为什么分布式数据库中不使用uuid作为主键？-PingCAP

为什么分布式数据库中不使用uuid作为主键？

网友投稿 878 2023-04-05

为什么分布式数据库中不使用uuid作为主键？

分布式数据库当然也有主键的需求，但是为什么不直接使用uuid作为主键呢？作为曾经被这个问题困惑过的人，试着回答一下

1. UUID生成速率低下

Java的UUID依赖于SecureRandom.nextBytes方法，而SecureRandom又依赖于操作系统提供的随机数源，在Linux系统下，它的默认依赖是/dev/random，而这个源是阻塞的。最可怕的是，这个nextBytes方法还是一个synchronized方法，也就是说，如果多线程调用UUID，生成速率不升反降。

测试结果：在一台64线程的服务器上，调用UUID.randomUUID方法，生成一千万个uuid平均耗时在130s，tps不到8w

2. UUID主键在innodb中会引发性能问题

a. innodb中的主键索引也是聚集索引，如果插入的数据是顺序的，那么b+树的叶子基本都是满的，缓存也可以很好的发挥作用。如果插入的数据是完全无序的，那么叶子节点会频繁分裂，缓存也基本无效了。这会减少tps

b. uuid占用的空间较大

3. UUID完全没有意义，如果有一个主键是全局自增的，那么数据排列顺序就是数据的插入顺序

解决方案：

1. 分布式全局序列生成（使用zk的DistributedAtomicLong，一次自增一个步长，用户用完了步长内的序列，再找zk要）

2. Twitter的snowflake算法

当然自增序列也不是完美的，因为在极大并发的情况下，按自增主键插入会发生争用，主键的上界会出现热点。但总的来说，还是可以接受的

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

878 2023-04-05

为什么分布式数据库中不使用uuid作为主键？

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

为什么分布式数据库中不使用uuid作为主键？

微信扫一扫：分享

推荐文章

友情链接

热评文章