MySQL数据持久化过程实例分析-PingCAP

MySQL数据持久化过程实例分析

网友投稿 895 2023-07-08

MySQL数据持久化过程实例分析

1. 过程简述

理解MySQL数据的持久化过程，能很好的帮助我们加深对于MySQL底层的理解，在本文，我们以一种通俗的方式梳理一下这个过程，帮助大家建立起初步的认识，如果大家感兴趣，可以去深入学习与研究这个过程。

MySQL数据的存储总体上可以分为两部分，内存中的存储过程以及硬盘的持久化存储，这里，就涉及到了内存中buffer poll和redo log以及磁盘上的事务日志和表结构，在本文中，我们不具体解释每一部分的具体设计，只是给大家一个概念型的认识：

buffer poll 是InnoDB引擎缓存池的一部分，我们这里可以简单理解为数据库从磁盘读进内存的内存块的缓存；redo log是内存中的逻辑日志，记录了事务的变更操作事务日志是磁盘上的食物逻辑日志表结构是真正存储数据的结构

2. 内存中的操作

buffer poll中有对于读入内存的数据的缓存，在查询命令执行时，会优先在缓存中查看是否命中，未命中就会从磁盘中将需要的数据读进来，缓存的管理使用的是改良的LRU算法，这里不做深入地介绍了。

当一条修改指令运行的时候，首先进行的是对于buffer poll中缓存的修改，被修改后的数据会被标记为脏页，同时，修改的操作也会记录在redo log中，我们常说的MVCC中的版本链就是借助redo log实现的。

需要注意的是，脏页不是立刻落到磁盘的，而是有可以设置的刷盘控制机制，例如，一个事务执行结算后立刻落盘，按照一定时间定期落盘等等。

在内存中的操作都是非持久化的，如果这时发生了意料之外的问题导致系统宕机，数据是还没有持久化的，所以理论上也不会对数据库造成破坏性的影响。

3. 磁盘的持久化

3.1 事务日志的作用

InnoDB在磁盘的持久化分为两步，第一步是逻辑日志的存储，之后再将日志中的数据刷进磁盘空间。

在讨论为什么要使用逻辑日志之前，我们需要简单理解随机IO与顺序IO的区别：

寻址过程是磁盘IO中的一个重要瓶颈，因为它需要将探针移动到需要读取的位置来读取磁盘数据。

顺序IO是指寻址的空间是连续的，移动距离很短，随机IO是指我们需要寻找的地址分布在各处，需要移动很长的距离。

所以，我们能很明晰的得出结论：将随机IO替换为顺序IO能有效的提高磁盘IO的效率，逻辑日志的作用正是如此，由于日志文件在磁盘上是连续的，相比于分布在各处的数据表信息，IO效率能高出很多。

只要我们在事务日志中完整更新了操作，那么这个事务就已经持久化成功了，后续会有专门负责的线程将日志信息存储到表结构中。

3.2 表结构的两步存储

日志信息存储到表结构的过程是分为两步进行的，首先，会在表头的缓存区域内进行数据更新，更新完成后，才会在对应的表结构中刷新。

两步存储的目的是保证数据存储的强一致性，防止在刷入磁盘的过程中，数据库宕机导致数据不完整。

表头的缓存区域以及表结构的存储块都有校验码来检验数据的完整性，如果前者完整，后者不完整，直接讲前者数据在后者中重新刷一份即可解决，如果前者不完整，说明从日志刷取的过程失败，重新刷取即可。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

895 2023-07-08

MySQL数据持久化过程实例分析

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

MySQL数据持久化过程实例分析

微信扫一扫：分享

推荐文章

友情链接

热评文章