黄东旭关于基础软件产品价值的思考
1138
2023-07-06
MySQL Binlog日志与主从复制是什么
1. Binlog日志的介绍
Binlog是Binary log的缩写,即二进制日志。Binlog的三个主要作用包括将随机IO转换为顺序IO以进行持久化、实现主从复制和支持数据恢复。本文重点主从复制相关的问题。
Binlog日志由一个索引文件与很多日志文件组成,每个日志文件由魔数以及事件组成,每个日志文件都会以一个Rotate类型的事件结束。
对于每个事件,都可以分为事件头与事件体两部分:
事件头的结构如下所示:
事件体的结构包括固定大小与可变大小两部分。
对于Binlog日志的格式,做简单的了解即可,感兴趣的同学可以深入学习。
2. 主从复制
2.1 主从复制的流程
MySQL主从复制的流程大致如下:
主库同步自己的Binlog日志给从库从库的IO线程将Binlog日志内容写入Relay Log从库的SQL线程取Relay Log并在数据库中进行回放
2.2 GTID
GTID是指全局事务标志,用来标记主从同步的情况。
当主节点提交一个事务时,会生成GTID并在Binlog日志中进行记录。从库的IO线程在读取Binlog日志时,会将其储存在自己的Relaylog中,并且将这个值设置到gtid_next中,即下一个要读取的GTID,从库读取这个gtid_next时,会对比自己的Binlog日志中是否有这个GTID:
如果有这个记录,说明这个GTID的事务已经执行过了,可以忽略掉(幂等)。如果没有这个记录,slave就会执行该GTID事务,并记录到自己的Binlog日志中。
2.3 复制模型
异步复制:master 把Binlog日志推送给slave,master不需要等到slave是否成功更新数据到Relay log,主库直接提交事务即可。这种模式牺牲了数据一致性。同步复制:每次用户操作时,必须要保证Master和Slave都执行成功才返回给用户。半同步复制:不要求Slave执行成功,而是成功接收Master日志就可以通知Master返回。
2.4 MGR模式
分布式一致性算法Paxos。由至少3个或更多个节点共同组成一个数据库集群,事务的提交必须经过半数以上节点同意方可提交提供,支持多写模式。
MGR 是 share-nothing 的复制方案,基于分布式paxos协议实现,每个实例都有独立的完整数据副本,集群自动检查节点信息,做数据的同步。同时提供单主模式和多主模式,单主模式在主库宕机后能够自动选主,所有写入都在主节点进行,多主模式支持多节点写入。集群提供了容错功能,只要大多数节点正常运行,集群就能正常提供服务。
2.5 并行回放
事务回放是从库的SQL线程执行Relay Log的过程,并行回放是为了提高这一过程的效率,将可以并行进行的事务同时进行。
基于逻辑时钟的并行回放
因为MySQL本身事务具有ACID的特点,所以从主库同步到从库的事务,只要其执行的逻辑时间上有重叠,那么这两个事务就能安全的进行并行回放。
基于writeSet的并行回放
将一定时间内关于特定数据块区域的事务集合存储在一个HashMap中。在同一组内的事务或者具有重叠逻辑时钟的事务之间不会发生冲突,而其他情况则无法确定是否存在冲突。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。