神仙打架：PG和MySQL到底选啥?-PingCAP

神仙打架：PG和MySQL到底选啥?

网友投稿 852 2023-05-20

神仙打架：PG和MySQL到底选啥?

本文介绍 MySQL 和 *** 的一些特性对比，让大家了解二者的优劣，更好的做出选择。

图片来自 Pexels

当前国内的现状，互联网公司使用 MySQL 的较多，*** 的使用比例反而不高，但相信看到 PG 的新特性后，你会爱上她。当然 MySQL 作为最流行的数据库，依然会吸引大部分人的眼球。

*** 标榜自己是世界上很先进的开源数据库，甚至 PG 粉丝或者一些 PGER 宣称，她可以和 *** 相媲美(虽然 PG 很强大，但是和 *** 还是有差距的，当然 PG 优势也是显而易见的)，而且没有那么昂贵的价格和傲慢的客服。

当然 PG 功能完善和强大是最早始于 9 版本，在 10 版本快速发展，增加很多功能和特性。

*** 是完全由社区驱动的开源项目，他的核心代码，都是由社区维护，商用版本都是基于 PG 做的二次开发。

MySQL 声称自己是最流行的开源数据。看现在国内的现状，称得上名副其实。MySQL 被卖几次后，最终落到 *** 公司的囊中。

正是因此，MySQL 之父 Monty，修改了 MySQL 的源代码，创立了 MariaDB 分支。

说到这里当然不得不提另一个重要的分支，Percana 公司的 Percona Server。

Percona 公司更擅长 MySQL 运维，开发了很多非常实用运维工具，而且都已经开源，并回馈给社区，像 XtraBackup 和 pt-Toolkits 工具。

简单对比 MySQL 和 *** 发现，MySQL 背后是成熟的商业公司(*** 有自己的 MySQL 企业版，收费，有许多社区版没有的特性)，而 *** 背后是一个庞大的志愿开发组。

相比而言，*** 的商业性质更少一些，他没有所谓的 *** 企业版，但是存在基于 PG 开发的一些企业级的 PG 数据库。

下面我将从以下几个方面阐述 MySQL 和 *** 的异同和优劣，由于笔者水平的限制，不当之处，还请大家多提意见。

1.开源方面

***：The world’s most advanced open source database。

PG 的开源协议特别灵活，任何公司的和个人都可以把 PG 作为一个产品销售，而不需要像 MySQL 那样必须修改大部分代码才可以作为公司的产品。

MySQL：World’s Most Popular Open Source Database。

开源协议：核心代码基于 GPL 或 Commercial License。

MySQL 的开源协议是基于 GPL 协议，任何公司都可以免费使用，不允许修改后和衍生的代码做为闭源的商业软件发布和销售，MySQL 的版权在甲骨文手中，甲骨文可以推了其商业闭源版本。

如上图所示，开源软件协议

2.ACID 支持方面

*** 支持事务的强一致性，事务保证性好，完全支持 ACID 特性。

MySQL 只有 innodb 引擎支持事务，事务一致性保证上可根据实际需求调整，为了最大限度的保护数据，MySQL 可配置双一模式，对 ACID 的支持上比 PG 稍弱弱。

3.SQL 标准的支持方面

*** 几乎支持所有的 SQL 标准，支持类型相当丰富。

MySQL 只支持部分 SQL 标准，相比于 PG 支持类型稍弱。

4.复制

MySQL 的复制是基于 binlog 的逻辑异步复制，无法实现同步复制。

复制模式：

一主一备一主多备级联复制循环复制主主复制

数据流转优势：通过 Canal 增量数据的订阅和消费，可以同步数据到 Kafka，通过 Kafka 做数据流转。

MySQL 所有的高可用方案都是基于 binlog 做的同步，以及基于 MySQL 的分布式数据也是基于 MySQL 的 binlog 实现，binlog 是 MySQL 生态圈最基本技术实现。

*** 可以做到同步，异步，半同步复制，以及基于日志逻辑复制，可以实现表级别的订阅和发布。

复制模式：

一主一备一主多备级联复制热备库/流复制逻辑复制

数据流转优势：通过逻辑复制实现消息的订阅和消费，可以同步数据到 Kafka，通过 Kafka 实现数据流转。

5.并发控制

*** 通过其 MVCC 实现有效地解决了并发问题，从而实现了非常高的并发性。

PG 新老数据一起存放的基于 XID 的 MVCC 机制，新老数据一起存放，需要定时触发 VACUUM，会带来多余的 IO 和数据库对象加锁开销，引起数据库整体的并发能力下降。而且 VACUUM 清理不及时，还可能会引发数据膨胀。

当然 *** 还有一点影响比较，为了保证事务的强一致性，未决事务会影响所有表 VACUUM 清理，导致表膨胀。

MySQL 仅在 InnoDB 中支持 MVCC。InnoDB 的基于回滚段实现的 MVCC 机制，但是 MySQL 的间隙锁影响较大，锁定数据较多。

6.性能

***

①*** 广泛用于读写速度高和数据一致性高的大型系统。此外，它还支持各种性能优化，当然这些优化仅在商业解决方案中可用，例如地理空间数据支持，没有读锁定的并发性等等。

②*** 性能最适用于需要执行复杂查询的系统。

③*** 在 OLTP/OLAP 系统中表现良好，读写速度以及大数据分析方面表现良好，基于 PG 的 GP 数据库，在数据仓库领域表现良好。

④*** 也适用于商业智能应用程序，但更适合需要快速读/写速度的数据仓库和数据分析应用程序。

MySQL

①MySQL 是广泛选择的基于 Web 的项目，需要数据库只是为了简单的数据事务。但是，当遇到重负载或尝试完成复杂查询时，MySQL 通常会表现不佳。

②MySQL 的读取速度，在 OLTP 系统中表现良好。

③MySQL+InnoDB 为 OLTP 场景提供了非常好的读/写速度。总体而言，MySQL 在高并发场景下表现良好。

④MySQL 是可靠的，并且与商业智能应用程序配合良好，因为商业智能应用程序通常读取很多。

7.高可用技术的实现

***

①基于流复制的异步、同步主从。

②基于流复制的 Keepalive。

③基于流复制的 Repmgr。

④基于流复制的 patroni+etcd。

⑤共享存储 HA(corosync+pacemaker)。

⑥Postgres-XC。

⑦Postgres-XL。

⑧中间件实现：pgpool、pgcluster、slony、plploxy。

MySQL

①主从复制。

②主主复。

③MHA。

④LVS+KEEPALIVE。

⑤MGR 分布式数据库，多点写入[不建议]，基于 Paxos 协议。

⑥PXC 分布式数据库，多点写入[不建议]，基于令牌环协议。

⑦INNODB CLUSTER[8.0 新技术，基于 MGR 实现，上层封装命令]，基于 Paxos 协议。

⑧中间件实现：Mycat。

8.外部数据源

*** FDW：[foreign-data wrapper 的一个简称，可以叫外部封装。

*** 不支持多数据引擎。但支持 Extension 组件扩充，以及通过名为 FDW 的技术将 ***、Hadoop、***、SQLServer、Excel、CSV 文件等作为外部表进行读写操作，因此，可以为大数据与关系型数据库提供良好对接。

MySQL：无。

9.数据存储和数据类型

PG 主表采用堆表存放，存放的数据量较大，数据访问方式类似于 *** 的堆表。

MySQL 采用索引组织表，MySQL 必须有主键索引，所有的数据访问都是通过主键实现，二级索引访问时，需要扫描两遍索引(主键和二级索引)。

10.*** 与 MySQL 优劣对比

*** 相对于 MySQL 的优势

①在 SQL 的标准实现上要比 MySQL 完善，而且功能实现比较严谨。

②存储过程的功能支持要比 MySQL 好，具备本地缓存执行计划的能力。

③对表连接支持较完整，优化器的功能较完整，支持的索引类型很多，复杂查询能力较强。

④PG 主表采用堆表存放，MySQL 采用索引组织表，能够支持比 MySQL 更大的数据量。

⑤PG 的主备复制属于物理复制，相对于 MySQL 基于 binlog 的逻辑复制，数据的一致性更加可靠，复制性能更高，对主机性能的影响也更小。

⑥MySQL 的存储引擎插件化机制，存在锁机制复杂影响并发的问题，而 PG 不存在。

⑦PG 对可以实现外部数据源查询，数据源的支持类型丰富。

⑧PG 原生的逻辑复制可以实现表级别的订阅发布，可以实现数据通过 Kafka 流转，而不需要其他的组件。

⑨PG 支持三种表连接方式，嵌套循环，哈希连接，排序合并，而 MySQL 只支持嵌套循环。

⑩*** 源代码写的很清晰，易读性比 MySQL 强太多了。

⑪*** 通过 PostGIS 扩展支持地理空间数据。地理空间数据有专用的类型和功能，可直接在数据库级别使用，使开发人员更容易进行分析和编码。

⑫可扩展型系统，有丰富可扩展组件，作为 Contribute 发布。

⑬*** 支持 JSON 和其他 NoSQL 功能，如本机 XML 支持和使用 HSTORE 的键值对。

它还支持索引 JSON 数据以加快访问速度，特别是 10 版本 JSONB 更是强大。

⑭*** 完全免费，而且是 BSD 协议，如果你把 *** 改一改，然后再拿去卖钱，也没有人管你。

这一点很重要，这表明了 *** 数据库不会被其它公司控制。相反，MySQL 现在主要是被 *** 公司控制。

MySQL 相对于 PG 的优势

①InnoDB 的基于回滚段实现的 MVCC 机制，相对 PG 新老数据一起存放的基于 XID 的 MVCC 机制，是占优的。

新老数据一起存放，需要定时触发 VACUUM，会带来多余的 IO 和数据库对象加锁开销，引起数据库整体的并发能力下降。而且 VACUUM 清理不及时，还可能会引发数据膨胀。

②MySQL 采用索引组织表，这种存储方式非常适合基于主键匹配的查询、删改操作，但是对表结构设计存在约束。

③MySQL 的优化器较简单，系统表、运算符、数据类型的实现都很精简，非常适合简单的查询操作。

④MySQL 相对于 PG 在国内的流行度更高，PG 在国内显得就有些落寞了。

⑤MySQL 的存储引擎插件化机制，使得它的应用场景更加广泛，比如除了 InnoDB 适合事务处理场景外，Myisam 适合静态数据的查询场景。

11.总结

总体上来说，开源数据库都不是很完善，商业数据库 *** 在架构和功能方面都还是完善很多的。

从应用场景来说，PG 更加适合严格的企业应用场景(比如金融、电信、ERP、CRM)，但不仅仅限制于此，*** 的 json，jsonb，hstore 等数据格式，特别适用于一些大数据格式的分析。

而 MySQL 更加适合业务逻辑相对简单、数据可靠性要求较低的互联网场景(比如 Google、Facebook、Alibaba)，当然现在 MySQL 的在 InnoDB 引擎的大力发展，功能表现良好。

MySQL 和 *** 复杂的开源关系型数据库，本文只是作者根据自己经验写的对 PG 和 MySQL 的理解，难免有不当之处，不当之处还请大家多多指正。

MySQL 在国内的发展已然很成熟，但是如果你转向 ***，会发现不一样的天地，学院派的风格，丰富的功能，肯定会给你带来不一样的惊喜。

作者：郭庆慧

编辑：陶家龙

百TB级 TiDB 集群在线更换 NVME 磁盘优化案例分享

852 2023-05-20

神仙打架：PG和MySQL到底选啥?

高成本云服务？TiDB 帮你省钱

百TB级 TiDB 集群在线更换 NVME 磁盘优化案例分享

构建企业内部 TiDB 自运维体系经验分享

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20