两地三中心部署,两地三中心:同城同步复制,跨城异步复制

4747 1329 2023-06-19

本文讲述了两地三中心部署,两地三中心:同城同步复制,跨城异步复制

两地三中心是在同城双中心的基础上,在异地机房单独部署一套数据库集群,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。

两地三中心灾备架构

同城的两中心采用三副本机制部署 *** 灾备集群,异地中心集群只保持单副本,两地间结构化数据的同步通过传输同城灾备集群日志到异地灾备集群,然后通过重放日志记录的方式实现结构化数据的同步。两个集群同时在线,只有本地集群提供读写,异地集群用于数据备份,且数据同步有一定的延时。

两地三中心集群部署

灾难应对方案

主中心整体故障

当主中心(SUB1)整体发生故障,整个集群环境将会失去三分二的节点,如果从每个数据组来看,相当于每个数据组有两个数据节点出现了故障,存活的节点只剩余一个。这种情况下就需要用到“分裂(split)”和“合并(merge)”工具做一些特殊处理,把同城灾备中心的集群分裂成单副本集群,这时灾备中心节点可提供读写服务。分裂集群的耗时相对比较短,一般在十分钟内便能完成。具体操作可参考同城双中心灾难恢复。

同城网络故障

当同城网络出现故障,导致主中心与灾备中心无法进行通信时,由于采用了三副本的架构,应用程序可以通过访问本地两副本集群。针对同城网络的故障场景,无需采取特别的应对措施,只需要及时修复网络故障,修复后通过自动数据同步或者人工数据同步的方式去恢复灾备节点的数据即可。

本地双中心整体故障

当主中心和同城灾备中心都发生故障时,本地集群已无法对外提供服务。这种情况下,只需将应用切换至异地 *** 集群即可使业务恢复正常。待本地双中心集群故障恢复后,再将应用切换至本地即可。

异地灾备中心整体故障

当异地灾备中心故障时,导致异地集群无法通过日志重放进行数据同步,但并不影响本地集群的正常服务。针对异地灾备中心整体故障的场景,无需采取特别的应对措施,只需要及时修复故障节点,并恢复日志重放进程即可。

两地三中心是一个传统的容灾架构

两地指的是两个城市,三中心指的是3个IDC, 在同城部署两个IDC, 在另外一个城市再部署1个IDC

1.同城IDC——数据同步复制(一般通过存储阵列进行同步镜像方式来同步复制)

2.异地IDC——数据异步复制

IDC3只是一个冷备,平常不处理用户请求,因为IDC1到IDC3是异步复制,存在着比较高的时延

image.png

数据恢复的衡量指标RPO=recovery point objective恢复点目标,能够容忍的数据丢失量。. 零RPO,指的是已提交的数据都不会被丢失;

同城双中心是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。

与异地灾备模式相比较,同城双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点。

异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。

02

两地三中心灾备处理方案架构

两地三中心架构分为三种:

①生产中心—(同步镜像)—同城灾备中心—(异步复制)—异地数据中心;

②生产中心—(异步复制)—同城灾备中心—(异步复制)—异地数据中心;

③生产中心—(同步镜像)—同城灾备中心—同时(异步复制)—异地数据中心。

总结来说,两地三中心可提升业务系统的抵御灾难的能力,借用一句话“同城保生产,异地保生存”,如果发生机房或者楼宇级别的灾难,那同城可以保证生产系统在最短时间内恢复业务系统,而异地灾备是保证发生区域性灾难时,生产的关键业务数据不丢失,通过重建生产系统仍然能够保证生产系统恢复到灾难发生之前的业务水平。

那么,两地三中心灾备方案是如何实现的?接下来,两地三中心一站式数据保护解决方案为例来说明:

image.png

同步数据解决方案

✓两地三中心之数据备份

同城双中心的数据采用同步复制,在同城灾备中心建立一个在线更新的数据副本。当有数据下发到生产中心阵列时,阵列间的同步复制都会同时将数据复制一份到同城灾备中心。

同城灾备中心与异地灾备中心之间采用异步复制方式,定期将数据进行复制备份,异步复制支持增量复制方式,可以节省数据备份的带宽占用,缩短数据的备份时间。

✓两地三中心之灾难检测

两地三中心的灾难检测通过对资源组状态的监控来判断资源的可用性,包括数据库资源组、网络资源组等。当检测到生产中心有资源组出现fault状态时,同城内生产中心同灾备中心将进行切换,以保证业务的连续性。

✓两地三中心之容灾切换

基于应用容灾切换包括一系列的动作:停止灾难节点的部件服务、切断数据复制链路、建立数据容灾基线、启动容灾节点的部件服务、通知前端设备进行业务网络切换。具体动作可以结合实际情况,通过脚本来定制。

✓两地三中心之恢复回切

回切工作流程和切换流程原理是一样的,只是因为切换的时候是不确定触发的、可能导致业务受部分影响;而回切的时候通过人工确认,选择最小影响的情况下执行操作(比如业务流量非常小的情况下,甚至暂停业务情况下),因此回切推荐采用的是手动切换模式。

应用级容灾采用的是自动切换还是手动切换,用户可以在部署时通过修改主机集群软件的切换配置实现:

同城范围有效地保证了数据的安全性和业务连续性;

异地复制数据根据灾难情形,尽可能降低数据丢失机率;

同城双中心同步复制,数据实时同步,RPO=0;

异地无距离限制,保证数据一致性,保证对数据的有效保护;

异地容灾带宽要求低,先进的复制机制提高带宽利用率。

上文就是小编为大家整理的两地三中心部署,两地三中心:同城同步复制,跨城异步复制

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:同城双活与异地多活架构分析,深入了解异地多活
下一篇:如何使用 TiDB 快速构建应用?TiDB 事务机制
相关文章