MySQL 查询重复数据，删除重复数据保留id最小的一条作为唯一数据-PingCAP

MySQL 查询重复数据，删除重复数据保留id最小的一条作为唯一数据

网友投稿 1164 2023-04-17

MySQL 查询重复数据，删除重复数据保留id最小的一条作为唯一数据

开发背景：

最近在做一个批量数据导入到MySQL数据库的功能，从批量导入就可以知道，这样的数据在插入数据库之前是不会进行重复判断的，因此只有在全部数据导入进去以后在执行一条语句进行删除，保证数据唯一性。

实战：

表结构如下图所示：

表明：brand

操作：

使用SQL语句查询重复的数据有哪些：

SELECT * from brand WHERE brandName IN(select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1 #条件是数量大于1的重复数据)

使用SQL删除多余的重复数据，并保留Id最小的一条唯一数据：

注意点：

错误SQL：DELETE FROM brand WHERE brandName IN (select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1) AND Id NOT IN (select MIN(Id) from brand GROUP BY brandName HAVING COUNT(brandName)>1)

提示：You can't specify target table 'brand' for update in FROM clause 不能为FROM子句中的更新指定目标表“brand”

原因是：不能将直接查处来的数据当做删除数据的条件，我们应该先把查出来的数据新建一个临时表，然后再把临时表作为条件进行删除功能

正确SQL写法：

DELETE FROM brand WHERE brandName IN (SELECT brandName FROM (SELECT brandName FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) e) AND Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) t)#查询显示重复的数据都是显示最前面的几条，因此不需要查询是否最小值

更加简单快捷的方式：

这是老飞飞的前辈给了一个更加方便，简洁的写法（非常感谢大佬的方法）：

DELETE FROM brand WHERE Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName) t)

这句的意思其实就是，通过分组统计出数据库中不重复的最小数据id编号，让后通过 not in 去删除其他重复多余的数据。

结果如下图：

总结：

很多东西都是需要自己一步一步的去探究的，当然网上的建议也是非常宝贵的借鉴和资源，无论做什么开发我们都需要理解它的工作原理才能够更好的掌握它。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

1164 2023-04-17

MySQL 查询重复数据，删除重复数据保留id最小的一条作为唯一数据

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20