一分钟带你学会MySQL覆盖索引，让你的SQL更高效-PingCAP

一分钟带你学会MySQL覆盖索引，让你的SQL更高效

网友投稿 786 2023-04-17

一分钟带你学会MySQL覆盖索引，让你的SQL更高效

覆盖索引是MySQL优化sql性能的一种非常重要而且常用的手段，通过覆盖索引，我们可以直接查询到需要的结果，而不用回表，从而大大减少树的搜索次数，非常明显的提升查询性能。

数据如何存储与查找

我们知道，MySQL的数据都是存储在B+树上的，每一个索引都代表一个B+树。

对于主键索引，叶子节点存储的是一行记录的所有字段值（逻辑上），而非主键索引的叶子节点存储的是主键值，非叶子节点存储的是索引以及指向数据的指针。

那我们查询数据的时候，MySQL是如何执行的呢？

以主键索引为例，就是在主键索引树上，从根节点出发，一直向下查找，直到找到符合条件的记录。

如果我们要查下图中的User2节点，那么查找路径就是UserA->UserC->UserF->User2。

回表

只按照主键查询是一种理想中的状态，随着业务逐渐复杂，表中的字段会越来越多，我们也会建立更多的非主键索引以应对业务带来的挑战。

但是非主键索引会带来一个问题：回表。

以下面这条sql为例：

select * from t where m in (3,4);

我们在表t的m字段上设置一个索引，那么这条sql的执行流程就是：

在索引树m上，找到记录3，获取到主键id，比如id=100；拿着100这个id去主键索引树上，获取到这一行的数据；在索引树m上，找到记录4，获取到主键id，比如id=101；拿着101这个id去主键索引树上，获取到这一行的数据；在索引树上查找下一个记录5（不一定是5，这里的5只是代表记录4后面的一条记录），记录5不符合查询条件，结束查询。

在上面的流程中，步骤2，4代表了回主键索引树搜索，这个动作就叫做回表。

而MySQL之所以做回表这个动作，是因为我们要查的数据 select *，只有在主键索引树上才有，所以不得不回表查询。

覆盖索引

如果我们把上面的sql改成下面这样：

select id from t where m in (3,4);

这个时候只需要查询id就行，而id这个值已经在m索引树上了，这时就不用再回表了，可以直接提供查询结果。

可以说，索引m覆盖了我们的查询请求，这种情况我们就称为覆盖索引。

这也是为什么我们在很多MySQL规范中可以看到，要求我们查询数据时尽量避免"select *"，就是因为"select *"会导致覆盖索引失效，从而引起强制回表，sql性能可能大幅下降。

最后

在我们查询SQL时，我们不仅要考虑where条件是否匹配了索引，还要尽量考虑查询的字段是否可以通过索引直接获取，覆盖索引可以减少树的搜索次数，显著的提升SQL查询性能。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

786 2023-04-17

一分钟带你学会MySQL覆盖索引，让你的SQL更高效

黄东旭解析 TiDB 的核心优势

黄东旭关于基础软件产品价值的思考

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20