MySQL 加锁机制验证记录-PingCAP

MySQL 加锁机制验证记录

网友投稿 577 2023-05-23

MySQL 加锁机制验证记录

MySQL 官方文档给出了不同类型语句的加锁情形，但我觉得这个总结更到位，因此想结合文章的几种情形，结合 InnoDB Monitor Output 做分析。

文章是验证过程的记录，全文比较长，建议结合目录查看感兴趣的部分。

开启 InnoDB Monitor

参考：官方文档

SET GLOBAL innodb_status_output=ON; -- 开启输出 SET GLOBAL innodb_status_output_locks=ON; -- 开启锁信息输出

注意这些选项在 mysql 重启后会恢复默认值。接下来使用命令查看信息：

SHOW ENGINE INNODB STATUS\G

样例输出，我们只关心锁相关的内容：

“page no 3 n bits 72” 代表在第 3 页的记录上，lock bitmap 共 72 位“index PRIMARY of …” 代表锁在某个索引上，PRIMARY 代表锁在主键上“lock_mode X” 锁模式，X 代表互斥，锁模式可以参数官方文档 InnoDB Locking“locks rec but not gap” 代表记录锁，“locks gap before rec” 代表间隙锁，没有说明则代表 Next Key Lock“heap no 4” 代表记录的序号，0 代表 infimum 记录、1 代表 supremum 记录，用户记录从 2 开始PHYSICAL RECORD 后面的内容是索引记录的内存结构，通常没办法直接阅读

这个记录里没法直接看出锁住了哪些记录。一种方法是通过 select * from information_schema.innodb_locks \G; 查看抢锁没抢到的信息，为了查看记录，在测试时可以另开一个会话，用诸如 SELECT * FROM ... WHERE ... FOR UPDATE 来抢锁，这样就可以看出锁在哪个记录上了。样例输出：

还有一个工具好用的工具 innodb_ruby 可以用来解析 MySQL 的静态文件。Monitor 日志里我们知道是哪个页的哪条记录，可以使用innodb_ruby 来找到对应的记录。(不过不建议在生产上使用)

不同情形下加锁验证

我们会考查 DELETE FROM t1 WHERE id = 5 语句在不同情形下的加锁情况，通过构造数据、执行语句、查看 Monitor 日志来验证加锁的机制。

主键 + RC

结论：只对 ID = 5 这条记录加 Record Lock

首先建表准备数据：

-- 建表 CREATE TABLE id_pk_rc(id int primary key, name varchar(32)); -- 准备数据 INSERT INTO id_pk_rc values(1, 'a'); INSERT INTO id_pk_rc values(3, 'b'); INSERT INTO id_pk_rc values(5, 'c'); INSERT INTO id_pk_rc values(7, 'c'); INSERT INTO id_pk_rc values(9, 'b');

执行语句

-- 设置为 RC 隔离级别 SET TRANSACTION ISOLATION LEVEL READ COMMITTED; BEGIN; -- 开启事务 DELETE FROM id_pk_rc WHERE id = 5; -- 先不结束事务，验证 Monitor Output 再用 ROLLBACK; 回滚

Monitor 输出日志：

看到输出里有 lock_mode X locks rec but not gap ，可以确定持有的是记录锁。

唯一索引 + RC

结论：索引和聚簇索引/主键中都对 ID = 5 加 Record Lock

首先建表准备数据：

-- 建表 CREATE TABLE id_ui_rc(pk int primary key, id int, name varchar(32)); CREATE UNIQUE INDEX id_ui ON id_ui_rc(id); -- 准备数据 INSERT INTO id_ui_rc values(1, 1, 'a'); INSERT INTO id_ui_rc values(2, 3, 'b'); INSERT INTO id_ui_rc values(3, 5, 'c'); INSERT INTO id_ui_rc values(4, 7, 'c'); INSERT INTO id_ui_rc values(5, 9, 'b');

执行语句：

-- 设置为 RC 隔离级别 SET TRANSACTION ISOLATION LEVEL READ COMMITTED; BEGIN; -- 开启事务 DELETE FROM id_ui_rc WHERE id = 5; -- 先不结束事务，验证 Monitor Output 再用 ROLLBACK; 回滚

Monitor 输出日志：

可以看到分别对 index id_ui 和 index PRIMARY 加了 Record Lock。

非唯一索引 + RC

结论：会对所有 ID = 5 的索引记录加 Record Lock，同时对主键加 Record Lock。

首先建表准备数据：

-- 建表 CREATE TABLE id_si_rc(pk int primary key, id int, name varchar(32)); CREATE INDEX id_si ON id_si_rc(id); -- 准备数据 INSERT INTO id_si_rc values(1, 1, 'a'); INSERT INTO id_si_rc values(2, 3, 'b'); INSERT INTO id_si_rc values(3, 5, 'c'); INSERT INTO id_si_rc values(4, 7, 'c'); INSERT INTO id_si_rc values(5, 5, 'b');

执行语句：

-- 设置为 RC 隔离级别 SET TRANSACTION ISOLATION LEVEL READ COMMITTED; BEGIN; -- 开启事务 DELETE FROM id_si_rc WHERE id = 5; -- 先不结束事务，验证 Monitor Output 再用 ROLLBACK; 回滚

Monitor 输出日志(省略了 PHYSICAL RECORD 的内容)：

可以看到一共有 4 条记录，首先可以看到索引 id_si 和 PRIMARY 分别锁住了两条记录，加的锁都是 X Record Lock No Gap，也就是记录锁。我们通过 select * from information_schema.innodb_locks \G; 查看是锁住了 3, 5 这两条记录。

无索引 + RC

结论：对所有记录加 Record Lock 再释放不匹配的记录锁

这个情形比较特殊，涉及两个知识点

MySQL 加锁时是对处理过程中“扫描”到的记录加锁，不管这条记录最终是不是通过 WHERE 语句剔除了对于 READ COMMITTED，MySQL 在扫描结束后，会违反 #1，释放 WHERE 条件不满足的记录锁

首先建表准备数据：

-- 建表 CREATE TABLE id_ni_rc(pk int primary key, id int, name varchar(32)); -- 准备数据 INSERT INTO id_ni_rc values(1, 1, 'a'); INSERT INTO id_ni_rc values(2, 3, 'b'); INSERT INTO id_ni_rc values(3, 5, 'c'); INSERT INTO id_ni_rc values(4, 7, 'c'); INSERT INTO id_ni_rc values(5, 5, 'b');

执行语句：

-- 设置为 RC 隔离级别 SET TRANSACTION ISOLATION LEVEL READ COMMITTED; BEGIN; -- 开启事务 DELETE FROM id_ni_rc WHERE id = 5; -- 先不结束事务，验证 Monitor Output 再用 ROLLBACK; 回滚

Monitor 输出日志(省略了 PHYSICAL RECORD 的内容)：

看到 TABLE LOCK 的状态是 IX 说明没有加表锁。同时看到最终锁住的只有heap_no = 4 和 6 的两条记录。

主键 + RR

当 ID 为主键时，在 RR 隔离级别下，加锁情况与一致，都是对主键记录加 Record Lock。

唯一索引 + RR

当 ID 为唯一索引时，在 RR 隔离级别下，加锁情况与一致，都是对索引记录和聚簇索引/主键 Record Lock。

非唯一索引 + RR

结论：对索引记录 Next Key Lock，末尾加 Gap Lock，同时对主键加 Record Lock

Repeatable Read 和 Read Committed 隔离级别的主要区别是 RR 要防止幻读。幻读指的是执行同一个 SQL 两次得到的结果不同。考虑下面的场景：

SELECT count(*) FROM t WHERE id = 5 FOR UPDATE id = 5 SELECT count(*) FROM t WHERE id = 5 FOR UPDATE

为了要避免这种情况，在 RR 隔离级别下，在 #1 执行时不仅要锁住现有的 ID=5 的索引，还需要阻止 ID = 5 的记录插入(即 #2)。而 Gap Lock 就是实现这个目的的一种手段。

考虑到索引是有序的，因此如果索引里有 [3, 5, 5, 7] 这几个元素，则可以通过锁住 (3, 5) 、 (5, 7) 这几个区间，加上 [5] 这几个已经存在的元素，就可以阻止 ID = 5 的记录插入。Gap Lock(间隙锁)的含义是锁住区间，而如果加上右边的闭区间，如 (3, 5] 就称为记录 5 的 Next-Key Lock。

InnoDB 在扫描行时会为扫到的行加上 Next-Key Lock，对于上面的数据，扫到记录 5 时，会加上 (3, 5] 锁，同时，还会对下一个记录加上 Gap Lock，即 (5, 7) ，造成 (3, 7) 都无法插入的现象，验证 MySQL 实现如下：

首先建表准备数据：

-- 建表 CREATE TABLE id_si_rr(pk int primary key, id int, name varchar(32)); CREATE INDEX id_si ON id_si_rr(id); -- 准备数据 INSERT INTO id_si_rr values(1, 1, 'a'); INSERT INTO id_si_rr values(2, 3, 'b'); INSERT INTO id_si_rr values(3, 5, 'c'); INSERT INTO id_si_rr values(4, 7, 'c'); INSERT INTO id_si_rr values(5, 5, 'b');

执行语句：

-- 设置为 RC 隔离级别 SET TRANSACTION ISOLATION LEVEL REPEATABLE READ; BEGIN; -- 开启事务 DELETE FROM id_si_rr WHERE id = 5; -- 先不结束事务，验证 Monitor Output 再用 ROLLBACK; 回滚

Monitor 输出日志(省略 PHYSICAL RECORD 的内容)：

首先我们看到：

id_si id_si

为什么唯一索引 + RR 就不需要 Gap Lock 呢?是因为我们的核心目的是不让其它事务插入 ID = 5 的记录，如果 ID 是唯一索引，锁住记录本身就能够满足要求了，不再需要 Gap Lock。

无索引 + RR

结论：对所有行都加记录锁，且索引前后都要加 Gap Lock

首先建表准备数据：

-- 建表 CREATE TABLE id_ni_rr(pk int primary key, id int, name varchar(32)); -- 准备数据 INSERT INTO id_ni_rr values(1, 1, 'a'); INSERT INTO id_ni_rr values(2, 3, 'b'); INSERT INTO id_ni_rr values(3, 5, 'c'); INSERT INTO id_ni_rr values(4, 7, 'c'); INSERT INTO id_ni_rr values(5, 5, 'b');

执行语句：

-- 设置为 RC 隔离级别 SET TRANSACTION ISOLATION LEVEL REPEATABLE READ; BEGIN; -- 开启事务 DELETE FROM id_ni_rr WHERE id = 5; -- 先不结束事务，验证 Monitor Output 再用 ROLLBACK; 回滚

Monitor 输出日志(省略了部分信息)：

首先看到 TABLE LOCK 的状态是 IX 说明没有加表锁。同时看到锁住了 heap no 2~6的记录，对应数据库中的 5 条记录。另外这里的锁是 Next Key Lock，加上 heap no 为 1 的 “supremum” 记录的 gap lock，锁住了所有已经存在和不存在的行。因此如果执行 SELECT * FROM id_ni_rc WHERE id = 0 FOR UPDATE 也会阻塞，尽管 0 记录不在数据库中。

死锁验证

死锁与获取锁的顺序有关，一条语句(如 INSERT、DELETE)中对不同行、不同索引的加锁存在先后，因此不同事务内的语句执行时，有可能产生死锁。常见死锁原因(摘自 MySQL InnoDB锁和死锁 )：

同一索引上，两个session相反的顺序加锁多行记录UPDATE/DELETE 通过不同的二级索引更新多条记录，可能造成在 Primary key 上不同的加锁顺序Primary key 和 Secondary index，通过 primary key 找到记录，更新 Secondary index 字段与通过 Secondary index 更新记录

样例情形：

首先建表准备数据：

CREATE TABLE deadlock(id int primary key, name varchar(32), reg int); CREATE INDEX deadlock_name ON deadlock(name); CREATE INDEX deadlock_reg ON deadlock(reg); -- 准备数据 INSERT INTO deadlock values(1, 'x', 5); INSERT INTO deadlock values(2, 'b', 4); INSERT INTO deadlock values(3, 'x', 3); INSERT INTO deadlock values(4, 'd', 2); INSERT INTO deadlock values(5, 'e', 1);

两个事务分别“同时”执行：

-- Transaction A | -- Transaction B DELETE FROM deadlock WHERE name = 'x'; | DELETE FROM deadlock WHERE reg >= 2;

其中一个事务可能会检测到死锁而出错。Monitor 日志里找到 “LATEST DETECTED DEADLOCK” 可以看到记录的死锁原因(这个示例复现出的问题与上图不直接一致)：

我们看到：

第一个事务在等待 PRIMARY 索引上 heap_no = 2 的记录的 Record Lock第二个事务已经取得 PRIMARY 索引上 heap_no = 2 的 Next Key Lock同时第二个事务在等待 deadlock_name 索引上 heap_no = 2 的 Record LockMySQL 选择回滚第一个事务

更新操作如 UPDATE/DELETE 加锁的顺序为：查询索引 > 主键索引 > 其它二级索引。如上例中，第二个事务已经锁住了主键索引，准备锁住另一个二级索引 deadlock_name ，而第一个已经锁住了 deadlock_name ，准备锁主键索引，造成死锁。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

577 2023-05-23

MySQL 加锁机制验证记录

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20