MySQL数据延迟跳动的问题分析-PingCAP

MySQL数据延迟跳动的问题分析

网友投稿 652 2023-05-21

MySQL数据延迟跳动的问题分析

今天分析了另外一个关于数据库延迟跳动的问题，也算是比较典型，这个过程中也有一些分析问题的方法和技巧工参考。

首先在高可用检测中，有一套环境的检测时断时续，经过排查发现是数据库产生了延迟，在登录到从库show slave status查看，会发现Seconds_behind_master的值是不断跳动的，即从0~39~0~39这样的频率不断跳动，让人很搓火。

查看数据库的相关日志发现竟然没有任何可以参考的日志记录，怎么分析这个问题呢，我们先来复现，于是我按照节奏抓取了3次问题出现的日志，即通过show slave status连续监测，抓取show slave status输出的结果保存下来，这样我们就得到了一个问题发生过程中的偏移量变化，而这个变化则是在SQLThread在回放过程中产生的问题。

比如下面的一段输出，我截取的是Slave端的relay log进行分析，相应的字段为Relay_Log_Pos

Slave_IO_State: Waiting for master to send event Master_Host: xxxx Master_User: dba_repl Master_Port: 4306 Connect_Retry: 60 Master_Log_File: mysqlbin.000044 Read_Master_Log_Pos: 386125369 Relay_Log_File: slave-relay-bin.000066 Relay_Log_Pos: 386125580 Relay_Master_Log_File: mysqlbin.000044

所以很快得到了偏移量的变化情况：385983806 ，386062813 ，386125580

接着我使用mysqlbinlog开始分析这些日志过程中的明细，根据如下的命令可以很快得到转储的日志中相关的表有3张。

# grep INSERT relaylog_xxxx.dump |awk '{print $3 " " $4}'|sed 's/INTO//g'|sort|uniq act_action_exec_info act_join_desc dic_subsidy_marketing_querylog_202008

我逐步分析了每张表的数据操作情况，得到的信息还是比较有限，继续做更进一步的分析，比如我们分析一下整个日志中的事务量大小：

可以看到是5K左右，算是比较大了，而这些额外的信息从哪里获得呢，我在主库开启了general_log，这样就能够得到更细粒度的操作日志了。

经过和业务沟通也基本明确了以上问题。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

652 2023-05-21

MySQL数据延迟跳动的问题分析

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20