黄东旭解析 TiDB 的核心优势
753
2023-04-17
被面试官问住了,MySQL两阶段提交是什么鬼?
前言
MySQL通过两阶段提交的机制,保证了redo log和bin log的逻辑一致性,进而保证了数据的不丢失以及主从库的数据一致。
而说起两阶段提交,就不得不先介绍一下redo log和bin log。
redo log
redo log即重做日志,是InnoDB引擎特有的一种日志(有的面试官经常问到这一点)。
redo log主要做什么呢?
以更新数据为例,我们知道,MySQL的数据是存储在磁盘上的,如果每一次更新数据,都去磁盘寻址找到要更新的数据,进行更新操作的话,这个IO成本是非常高的。
如果是固态硬盘还好,如果是机械硬盘,那么MySQL的更新性能根本无法满足我们的业务需要。
所以,MySQL采用了一种叫做WAL的技术,Write-Ahead Logging。
当更新数据时,将更新操作(即某个数据页上做了什么修改)先写到redo log里面,然后更新内存,这个更新操作就算完成了。MySQL会在服务器空闲的时候,把redo log的操作记录刷新到磁盘里,以保持数据的一致性。
需要注意的是,redo log虽然也是磁盘上的一个文件,但是由于操作是顺序写,所以性能是非常高的。
当然了,redo log也是有大小上限的,不可能无限制的写入。
以上图为例,配置了4个redo log,write pos就是代表当前记录写到什么位置了,而check point表示一个推进点,它会不断的前移,做擦除数据的操作,以保证redo log可以不断的写入。
当然,擦除数据之前,会把redo log的记录刷新到磁盘。
通过redo log,可以保证即使MySQL发生异常重启,数据也不会丢失(因为redo log是物理日志,可以进行重放),这个特性就叫做crash-safe。
bin log
bin log是My***提供的一种日志,叫做归档日志,所有引擎都可以使用bin log。
那bin log和redo log的区别是什么呢?
1,这两种日志的提供者不同:bin log是由My***提供的,redo log是InnoDB引擎特有的。
2,redo log主要记录的是某个数据页做了什么修改,bin log记录的是语句的原始逻辑,比如更新了某一行的某个字段。
3,redo log是循环写的,数据会被覆盖。bin log是追加写,一个文件写满,就写下一个文件。
两阶段提交
介绍完了redo log和bin log,我们再看一下他们两者是如何配合完成两阶段提交的。
上图就是一个更新数据的流程,可以看到,在更新一条数据之前,MySQL会先将数据加载到内存,然后更新内存,开始写redo log。
此时,redo log处于prepare状态,等到bin log写完之后,再提交事务,这一条记录的更新操作就算完成了。
下面我们分析一下,采用两阶段提交的好处。
通过这样的机制,保证了redo log和bin log的一致性。
总结
之所以MySQL中既存在redo log,又存在bin log,这是因为bin log是My***提供的一种归档日志,其本身并不具备crash-safe能力。而redo log本身不具备归档能力,他是一种循环写的日志。
MySQL通过将这两种日志整合起来,并通过两阶段提交的机制,保证了数据的一致性。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。