TiDB 事务心跳超时机制测试分享

Tiit 517 2024-02-05

背景

当 APP  ”同时“ 发送 txn1 和 txn2 到 TiDB,txn1 和 txn2 之间存在锁冲突,TiDB 先执行了 txn1,则 txn2 需要等到 txn1 提交或回滚之后才能执行,TiDB 内部通过事务心跳机制来防止一些特殊情况下 txn1 持有锁的泄漏,进而防止 txn2 无限期等待。当 txn1 事务心跳超时后,txn2 即可 resolve txn1 持有的锁,之后当 txn1 恢复后会 rollback 并返回 error 报错给 APP。

常见的事务心跳超时情况有:

  1. txn 运行的 TiDB 与 TiKV 网络失联(本文模拟场景)。

  2. TiKV busy 导致 TiDB 发送心跳失败超时,TiDB 会自动 retry。

本文测试场景

场景1: txn1 和 txn2 锁相同数据,txn1 心跳超时,lock 被 txn2 resolved,txn1 commit 失败,txn2 commit 成功。

场景2: txn1 和 txn2 锁不同数据,txn1 心跳超时后恢复,txn1 & txn2 commit 成功。

结论

场景1: txn1 和 txn2 之间存在锁冲突,txn1 心跳超时后,txn2 resolve lock,txn1 心跳超时恢复后在 commit 阶段失败回滚。

场景2: txn1 和 txn2 之间没有锁冲突,txn1 心跳超时恢复后可以继续发送,commit 成功。

PS:不加锁语句如简单 select 不存在事务锁冲突,不在本文测试范围内,大家感兴趣可以自行测试更多语句模式。

准备

  • 测试工具

    • 使用 Kind + Operator  部署 TiDB 集群

    • 使用 Chaos Mesh 模拟网络分区

  • 工具版本

    • Operator v1.5.2

    • TiDB cluster v5.1.5 (所有版本适用)

    • Chaos Mesh v2.6.2

  • 测试数据

       id 为主键 handle key

mysql> select * from t;+----+------+| id | c    |+----+------+|  1 | a    ||  2 | b    ||  3 | c    |+----+------+3 rows in set (0.01 sec)

场景1 事务心跳超时 & 锁相同 row id

  1. SessionA on tidb-0 start transaction on t.id = 1

begin;select * from t where id = 1 for update;

1.png

tidb-0 periodically sends txn heartbeat to TiKV

2.png

  1. Simulate network partition between tidb-0 and all tikv

3.png

4.png

  1. During Simulation SessionB on tidb-1 select on t.id = 1

begin;select * from t where id = 1 for update;

5.png

tidb-1 periodically sends txn heartbeat to TiKV

6.png

  1. Stop Simulation

tidb-0 can not continue sending heartbeat to TiKV

  1. SessionA on tidb-0 continue transaction and commit return KV error

update t set c = 'aa' where id = 1;commit;

7.png

  1. SessoinB on tidb-1 execute transaction successfully

update t set c = 'aa' where id = 1;commit;

9.png

场景2 事务心跳超时 & 锁不同 row id

  1. Session A on tidb-0 start transaction on t.id = 1

begin;select * from t where id = 1 for update;

10.png

tidb-0 periodically sends heartbeat to TiKV

11.png

  1. Simulate network partition between tidb-0 and all tikv

12.png

13.png

  1. During Simulation SessionB on tidb-1 select on t.id = 2

begin;select * from t where id = 2 for update;

14.png

tidb-1 periodically sends heartbeat to TiKV

15.png

  1. Stop Simulation

tidb-0 can continue sending heartbeat to TiKV

16.png

  1. SessionA on tidb-0 continues transaction successfully

update t set c = 'aa' where id = 1;commit;

17.png

  1. SessoinB on tidb-1 continues transaction successfully

update t set c = 'bb' where id = 2;commit;

18.png


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:TiDB在作业帮的探索和推广
下一篇:如何优化TiDB中的写热点问题?
相关文章