聊聊数据库组件功能设计点-PingCAP

聊聊数据库组件功能设计点

网友投稿 612 2023-06-13

聊聊数据库组件功能设计点

引言

数据库中间件承担应用与数据库之间的粘合与润滑，数据库中间件设计的合理应用跑起来就丝滑，否则会拉胯。本文就常见数据库组件相关的功能设计点做个归纳整理:

分库分表数据复制数据同步平台全局唯一主键运维自动化可视化

一、分库分表

分库分表组件主要为分担数据库压力，通过多库多表承接请求。尽管拥有众多的分库分表组件，Apache ShardingSphere作为Apache的顶级项目依旧是主流。无论直接使用还是基于其二次开发或者自研，均值得研究。

1.ShardingSphere-JDBC

客户端直连数据库，分布式无中心化，主要针对java语言，数据库连接消耗多。

2.ShardingSphere-Proxy

客户端先连接到Proxy代理，通过代理连接数据库，能够跨语言，消耗数据库的连接数少(仅代理直接连接数据库),但是中心化风险点也主要在此。

3.ShardingSphere-Sidecar

网格化代理还在规划中，从当前蚂蚁对外提供的service mesh商业方案中，还没DB的mesh，下沉能力的同时，也带来了数据面和控制面板的复杂性。

备注：当前还是客户端直连数据库为主流，中心化的Proxy依然有公司采纳然占比依旧很少，至于Sidecar模式的大规模使用还在未来。

二、数据复制

1.单向搬运

将Mysql数据同步到消息队列或者其他数据存储源，常用开源组件为canal。

2.双/单向同步

在异地多活场景中数据库的双向同步、跨机房灾备的单向同步等场景，常用组件otter。

其他类似组件：dataLink、databus

备注：在单/双向同步场景中通常伴随着DDL的同步。

三、数据同步平台

当随着数据同步的场景越来越多，为每个不同的数据源写一个同步插件变得复杂和不好维护，此时可以考虑搭建一个数据同步平台。

通过ReaderPugin和WriterPlugin插件化插件化对接入的数据源和目标数据源只需要编写插件即可数据转换为提高吞吐性能可以引入Flink批处理框架

备注：数据同步平台社区也有开源DataX可供参考。

Flink-CDC

四、全局唯一主键

在分布式数据库中最好使用分布式全局唯一ID作为数据记录的唯一标识，原因也很简单，主要是避免主键冲突。

跨库数据迁移避免主键冲突双活数据库双向同步时避免主键冲突唯一键设计合理对排序和识别均有良好的辅助作用

生成全局唯一ID的方案有很多，常见的有：

UUID数据库发放不同的ID区段雪花算法(snowflake)生成唯一标识

雪花算法：由Twitter创建生成全局唯一ID算法，一个Snowflake ID组成共64位构成如下，如果不需要这么多位可以改造缩短一些长度。

Twitter Scala 版本：

雪花算法java版本参考:

五、运维自动化可视化

将常用的一些与DB相关需要手动的创建的自动化、可视化。

数据库申请与创建DDL变更自动化SQL执行结果导出同步任务申请自动化任务运行监控可视化

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

612 2023-06-13

聊聊数据库组件功能设计点

黄东旭解析 TiDB 的核心优势

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20