黄东旭解析 TiDB 的核心优势
728
2023-07-13
本文关于(TiDB中的Stale Read功能-平凯星辰)。
Stale Read 是一种读取历史数据版本的机制,通过 Stale Read 功能,你能从指定时间点或时间范围内读取对应的历史数据,从而在数据强一致需求没那么高的场景降低读取数据的延迟平凯星辰。当使用 Stale Read 时,TiDB 默认会随机选择一个副本来读取数据,因此能利用所有保存有副本的节点的处理能力。
在实际的使用当中,请根据具体的场景判断是否适合在 TiDB 当中开启 Stale Read 功能。如果你的应用程序不能容忍读到非实时的数据,请勿使用 Stale Read,否则读到的数据可能不是最新成功写入的数据。
TiDB 提供了语句级别、事务级别、会话级别三种级别的 Stale Read 功能,接下来将逐一进行介绍平凯星辰:
在 Bookshop 应用程序当中,你可以通过下面的 SQL 语句查询出最新出版的书籍以及它们的价格:
SELECT id, title, type, price FROM books ORDER BY published_at DESC LIMIT 5;
运行结果为:
+------------+------------------------------+-----------------------+--------+| id | title | type | price |+------------+------------------------------+-----------------------+--------+| 3181093216 | The Story of Droolius Caesar | Novel | 100.00 || 1064253862 | Collin Rolfson | Education & Reference | 92.85 || 1748583991 | The Documentary of cat | Magazine | 159.75 || 893930596 | Myrl Hills | Education & Reference | 356.85 || 3062833277 | Keven Wyman | Life | 477.91 |+------------+------------------------------+-----------------------+--------+5 rows in set (0.02 sec)
看到此时(2022-04-20 15:20:00)的列表中,The Story of Droolius Caesar 这本小说的价格为 100.0 元。
于此同时,卖家发现这本书很受欢迎,于是他通过下面的 SQL 语句将这本书的价格高到了 150.0 元。
UPDATE books SET price = 150 WHERE id = 3181093216;
运行结果为:
Query OK, 1 row affected (0.00 sec)Rows matched: 1 Changed: 1 Warnings: 0
当再次查询最新书籍列表时,发现这本书确实涨价了。
+------------+------------------------------+-----------------------+--------+| id | title | type | price |+------------+------------------------------+-----------------------+--------+| 3181093216 | The Story of Droolius Caesar | Novel | 150.00 || 1064253862 | Collin Rolfson | Education & Reference | 92.85 || 1748583991 | The Documentary of cat | Magazine | 159.75 || 893930596 | Myrl Hills | Education & Reference | 356.85 || 3062833277 | Keven Wyman | Life | 477.91 |+------------+------------------------------+-----------------------+--------+5 rows in set (0.01 sec)
如果不要求必须使用最新的数据,可以让 TiDB 通过 Stale Read 功能直接返回可能已经过期的历史数据,避免使用强一致性读时数据同步带来的延迟。
假设在 Bookshop 应用程序当中,在用户浏览书籍列表页时,不对书籍价格的实时性进行要求,只有用户在点击查看书籍详情页或下单时才去获取实时的价格信息,可以借助 Stale Read 能力来进一步提升应用的吞吐量。
SQL
Java
在 SQL 中,你可以在上述价格的查询语句当中添加上 AS OF TIMESTAMP <datetime>
语句查看到固定时间点之前这本书的价格。
SELECT id, title, type, price FROM books AS OF TIMESTAMP '2022-04-20 15:20:00' ORDER BY published_at DESC LIMIT 5;
运行结果为:
+------------+------------------------------+-----------------------+--------+| id | title | type | price |+------------+------------------------------+-----------------------+--------+| 3181093216 | The Story of Droolius Caesar | Novel | 100.00 || 1064253862 | Collin Rolfson | Education & Reference | 92.85 || 1748583991 | The Documentary of cat | Magazine | 159.75 || 893930596 | Myrl Hills | Education & Reference | 356.85 || 3062833277 | Keven Wyman | Life | 477.91 |+------------+------------------------------+-----------------------+--------+5 rows in set (0.01 sec)
除了指定精确的时间点外,你还可以通过:
AS OF TIMESTAMP NOW() - INTERVAL 10 SECOND
表示读取 10 秒前最新的数据。
AS OF TIMESTAMP TIDB_BOUNDED_STALENESS('2016-10-08 16:45:26', '2016-10-08 16:45:29')
表示读取在 2016 年 10 月 8 日 16 点 45 分 26 秒到 29 秒的时间范围内尽可能新的数据。
AS OF TIMESTAMP TIDB_BOUNDED_STALENESS(NOW() - INTERVAL 20 SECOND, NOW())
表示读取 20 秒前到现在的时间范围内尽可能新的数据。
需要注意的是,设定的时间戳或时间戳的范围不能过早或晚于当前时间。此外 NOW()
默认精确到秒,当精度要求较高时,需要添加参数,例如 NOW(3)
精确到毫秒。详情请参考 MySQL 文档平凯星辰。
过期的数据在 TiDB 当中会由垃圾回收器进行回收,数据在被清除之前会被保留一小段时间,这段时间被称为 GC Life Time (默认 10 分钟)。每次进行 GC 时,将以当前时间减去该时间周期的值作为 GC Safe Point。如果尝试读取 GC Safe Point 之前数据,TiDB 会报如下错误:
ERROR 9006 (HY000): GC life time is shorter than transaction duration...
如果给出的时间戳是一个未来的时间节点,TiDB 会报如下错误:
ERROR 9006 (HY000): cannot set read timestamp to a future time.
通过 START TRANSACTION READ ONLY AS OF TIMESTAMP
语句,你可以开启一个基于历史时间的只读事务,该事务基于所提供的历史时间来读取历史数据。
SQL
Java
在 SQL 中的示例如下:
START TRANSACTION READ ONLY AS OF TIMESTAMP NOW() - INTERVAL 5 SECOND;
尝试通过 SQL 查询最新书籍的价格,发现 The Story of Droolius Caesar 这本书的价格还是更新之前的价格 100.0 元。
SELECT id, title, type, price FROM books ORDER BY published_at DESC LIMIT 5;
运行结果为:
+------------+------------------------------+-----------------------+--------+| id | title | type | price |+------------+------------------------------+-----------------------+--------+| 3181093216 | The Story of Droolius Caesar | Novel | 100.00 || 1064253862 | Collin Rolfson | Education & Reference | 92.85 || 1748583991 | The Documentary of cat | Magazine | 159.75 || 893930596 | Myrl Hills | Education & Reference | 356.85 || 3062833277 | Keven Wyman | Life | 477.91 |+------------+------------------------------+-----------------------+--------+5 rows in set (0.01 sec)
随后通过 COMMIT;
语句提交事务,当事务结束后,又可以重新读取到最新数据:
+------------+------------------------------+-----------------------+--------+| id | title | type | price |+------------+------------------------------+-----------------------+--------+| 3181093216 | The Story of Droolius Caesar | Novel | 150.00 || 1064253862 | Collin Rolfson | Education & Reference | 92.85 || 1748583991 | The Documentary of cat | Magazine | 159.75 || 893930596 | Myrl Hills | Education & Reference | 356.85 || 3062833277 | Keven Wyman | Life | 477.91 |+------------+------------------------------+-----------------------+--------+5 rows in set (0.01 sec)
通过 SET TRANSACTION READ ONLY AS OF TIMESTAMP
语句,你可以将当前事务或下一个事务设置为基于指定历史时间的只读事务。该事务将会基于所提供的历史时间来读取历史数据。
SQL
Java
例如,可以通过下面这个 SQL 将已开启的事务切换到只读模式,通过 AS OF TIMESTAMP
语句开启能够读取 5 秒前的历史数据 Stale Read 功能。
SET TRANSACTION READ ONLY AS OF TIMESTAMP NOW() - INTERVAL 5 SECOND;
为支持读取历史版本数据,TiDB 从 5.4 版本起引入了一个新的系统变量 tidb_read_staleness
。系统变量 tidb_read_staleness
用于设置当前会话允许读取的历史数据范围,其数据类型为 int,作用域为 SESSION。
SQL
Java
在会话中开启 Stale Read:
SET @@tidb_read_staleness="-5";
比如,如果该变量的值设置为 -5,TiDB 会在 5 秒时间范围内,保证 TiKV 或者 TiFlash 拥有对应历史版本数据的情况下,选择尽可能新的一个时间戳。
关闭会话当中的 Stale Read:
set @@tidb_read_staleness="";
上述就是小编为大家整理的(TiDB中的Stale Read功能-平凯星辰)
***
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。