MySQL去除“关联表”重复数据，以建立联合唯一索引-PingCAP

MySQL去除“关联表”重复数据，以建立联合唯一索引

网友投稿 1046 2023-04-28

MySQL去除“关联表”重复数据，以建立联合唯一索引

前言

昨天遇到一个问题，需要对一张关系表进行重构和优化。然而这张关系表由于已有代码没有注重并发导致了很多的脏数据，即重复数据。

问题在于，由于代码不规范，在高并发时(或数据库压力大时造成的延时积压时)会出现多个(相同thread_id和user_id的)组合，如下：

之后你们懂的，各种和原想不一致的神奇bug喷涌而出，比如：

我刚刚取消了推荐，怎么还显示我推荐着!!

显示的总推荐数怎么和实际推荐用户加起来不一样!!

解决方案一：使用insert where not exists语句

先上代码：(这里拿另一个关系表的真实query举例，原理一样)

INSERT INTO `user_topic` (`user_id`, `topic_id`) SELECT :userId, :topicid FROM `user_topic` WHERE NOT EXISTS (SELECT * FROM `user_topic` WHERE `user_topic`.`user_id` = :userId AND `user_topic`.`topic_id` = :topicid) LIMIT 1;

通过这种“插入时判断不存在才插入并返回行数为1，存在的话返回行数为0”的方法，可以做到：

只有在返回行数为1的情况下才执行之后逻辑(如缓存内的统计数+1，缓存内帖子推荐人增加此userId等等)如果返回行数为0，则接口返回error

解决方案二：清理脏数据并建立联合唯一索引

这个方案是本文的核心了，也是我们目前认为的***实践。

***步：查找user_id, thread_id的联合duplication

或简单的版本

得到

哇!所有的重复项都在这里了，好想马上把它们干掉!

现在需要将重复的条目中ID更大的所有条目都删除，只留ID最小的那一个。

删之前先获得需要删除项，比对一下，

下一步，SELECT * FROM改成DELETE FROM，删除!

***，加联合唯一索引!

Of course，如果上述清理工作没有完成将会报错!

完!

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

1046 2023-04-28

MySQL去除“关联表”重复数据，以建立联合唯一索引

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

MySQL去除“关联表”重复数据，以建立联合唯一索引

微信扫一扫：分享

推荐文章

友情链接

热评文章