Redis主从复制是如何保证数据不丢失的？-PingCAP

Redis主从复制是如何保证数据不丢失的？

网友投稿 919 2023-05-24

Redis主从复制是如何保证数据不丢失的？

介绍

在生产环境中，为了系统的可靠性，我们会对Redis搭建主从。这样当一个实例发生宕机，另一个实例中还有数据，还能继续提供服务。主从库之间采用的是读写分离的模式。

读操作：主库，从库都可以执行写操作：只能主库上执行，主库将操作同步给从库

因为主从库都可以接收读请求，提高了系统的QPS。那么主从库之间如何进行数据同步呢?

全量复制

「我们可以通过replicaof命令或者replicaof设置来让redis形成主从库的关系」(redis 5.0之前使用slaveof命令)

假设现在有两个实例，实例一(172.16.19.1)和实例二(172.16.19.2)

当我们在实例二上执行如下命令后，实例二就变成了实例一的从库，并从实例一上复制数据

replicaof 172.16.19.1 6379

当然我们也可以在实例二的redis.conf配置文件中配置如下内容

replicaof 172.16.19.1 6379

整个同步过程如下图所示

主从库全量复制主要分为如下三个阶段

从库发送psync命令，此时主库开始生成rdb文件主库将生成的rdb文件发送给从库主库将生成rdb文件后接收到的写命令发送给从库

我们仔细分析一下三个过程

从库发送psync命令，此时主库开始生成rdb文件

从库发送psync命令，表示要进行数据复制，psync命令包含了如下2个参数

「runID」：主库的runID，每个redis实例启动时都会自动生成一个随机ID，用来唯一标识实例。当从库第一次复制时，因为不知道主库的runID，所以将runID设置为?「offset」：复制进度，第一次复制为-1

主库将生成的rdb文件发送给从库

主库执行bgsave命令，生成rdb文件，并且发送给从库。从库收到rdb文件后，会清空当前数据库，然后加载rdb文件。因为从库在通过replicaof命令复制前，可能保存了其他的数据，为了避免之前数据的影响，需要先把从库清空

主库将生成rdb文件后接收到的写命令发送给从库

生成rdb文件后，主库仍能执行写命令，这些写命令会被放到replication buffer中。当主库发送完rdb文件后，就会把replication buffer中的命令发给从库，从库执行这些操作后。主从就是实现同步了。「后续正常的命令同步也是主库将命令写到replication buffer然后发给从库」

增量复制

如果在主从命令传播的过程中，出现了网络异常应该怎么办呢?

在Redis2.8之前，如果出现了网络异常，从库和主库会进行一次增量复制，开销非常大。在Redis2.8之后，主从库会采用增量复制的方式进行同步。增量复制只会把主从库断连期间主库接收到的命令同步给从库

「增量同步时主从库如何保持一致呢?」

复制偏移量

主库和存库都会在内部维护一个复制偏移量主库每次向从库发送n个字节的数据时，就把自己的复制偏移量加上n 从库每次收到主库传来的n个字节的数据时，就把自己的复制偏移量加上n

repl_backlog_buffer(复制积压缓冲区)

repl_backlog_buffer是由主服务器维护的一个固定长度先进先出(FIFO)队列我们举个例子，如果将hello字符串放入一个固定长度为3的FIFO队列，值依次为

[h, e, l] [e, l, l] [l, l, o]

「每次都是都是在队尾添加值，弹出队首」复制积压缓冲区的构造如下

偏移量...202122232425...

字节值 ... h e l l l o ...

「当服务器在进行命令传播的时候，不仅会将写命令发送给所有从服务器，还会将写命令入队到复制积压缓冲区中」

当从库发生网络中断重新上主库之后，会发送「psync 主库id offset」给主库，主库根据复制偏移量来决定对从服务器执行何种复制操作

如果从库发送的主库id与当前连接的主库id相同，可以继续尝试增量复制

如果从库发送的主库id与当前连接的主库id不相同，说明主服务器断线之前复制的主服务器并不是当前连接的服务器，只能全量复制

如果offse偏移量之后的数据(即偏移量offset+1开始的数据)仍然存在repl_backlog_buffer中，则把命令放到replication buffer，然后发送给从库

如果offset偏移量之后的数据不存在repl_backlog_buffer中，则进行全量复制

replication buffer和repl_backlog_buffer

有很多小伙伴刚开始的时候分不清replication buffer和repl_backlog_buffer的作用，包括我。

其实很好理解，replication buffer其实是一个client端的缓冲区，redis每次把要发送的命令放到这个缓冲区中，然后再发送。「每个客户端一个replication buffer」

「而repl_backlog_buffer单纯用作增量复制，在redis服务器中只有一个」

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

919 2023-05-24

Redis主从复制是如何保证数据不丢失的？

黄东旭解析 TiDB 的核心优势

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

Redis主从复制是如何保证数据不丢失的？

微信扫一扫：分享

推荐文章

友情链接

热评文章