MySQL回表查询与索引覆盖的区别是什么-PingCAP

MySQL回表查询与索引覆盖的区别是什么

网友投稿 1314 2023-07-01

MySQL回表查询与索引覆盖的区别是什么

回表查询

InnoDB索引分为两大类，一类是聚集索引(Clustered Index)，一类是非聚集索引(Secondary Index)

聚集索引（聚簇索引）：叶子节点中存的是整行数据，找到索引也就找到了数据，索引即数据，表中行的物理顺序与键值的逻辑（索引）顺序相同，一个表只能包含一个聚集索引。因为索引（目录）只能按照一种方法进行排序。

非聚集索引（普通索引、非聚簇索引、二级索引）：非聚集索引的btree叶子节点中存储的是当行数据的PK（主键）。例如MYISAM通过key_buffer把索引先缓存到内存中，当需要访问数据时(通过索引访问数据)，在内存中直接搜索索引，然后通过索引找到磁盘相应数据，这也就是为什么索引不在key buffer命中时，速度慢的原因。

为什么非主键索引结构叶子结点存储的是主键值？

减少了出现行移动或者数据页分裂时二级索引的维护工作（当数据需要更新的时候，二级索引不需要修改，只需要修改聚簇索引，一个表只能有一个聚簇索引，其他的都是二级索引，这样只需要修改聚簇索引就可以了，不需要重新构建二级索引）

当使用非聚集索引时，为了获取具体数据，我们需要通过主键返回到聚集索引并查询数据。着就叫回表查询。扫描了2次索引树。所以效率相对较低。

索引覆盖

索引覆盖就是解决回表查询的一种方案。见名知意，就是查询的所有列均被所使用的索引列覆盖(可以是单列索引也可以是联合索引，通常是联合索引，单列索引很难覆盖查询的所有列)。

因为索引中已经包含了要查询的字段的值，因此查询的时候直接返回索引中的字段值就可以了，不需要再到表中查询，避免了对主键索引的二次查询，也就提高了查询的效率。

id为聚集索引，name为非聚集索引：

select name, age from t where name = 'lcc';登录后复制

就需要回表查询

索引覆盖：

在SQL中只查询name字段。这样name的索引就覆盖到了所有的查询列。

select name from t where name = 'lcc';登录后复制

将name的索引修改为联合索引(name, age )，之后还是执行select name, age from t where name = 'lcc'。这样也覆盖到了所有的查询列。因为覆盖索引必须要存储索引的列值，而哈希索引、空间索引和全文索引等都不存储索引列值，从而只有使用B-Tree索引的数据可以做覆盖索引。

进行索引覆盖查询时，在explain（执行计划）的Extra列可以看到【Using Index】的信息。

索引覆盖的优点

索引条目通常远小于数据行的大小，因为覆盖索引只需要读取索引，极大地减少了数据的访问量。索引是按照列值顺序存储的，对于IO密集的范围查找会比随机从磁盘读取每一行数据的IO小很多。一些存储引擎比如MyISAM在内存中只缓存索引，数据则依赖操作系统来缓存，因此要访问数据的话需要一次系统调用，使用覆盖索引则避免了这一点。针对InnoDB引擎下的数据库表，覆盖索引因为InnoDB的聚簇索引而非常实用。因为InnoDB的二级索引在叶子节点中保存了行的主键值，如果二级索引能够覆盖查询，就避免了对主键索引的二次查询。

哪些场景适合使用索引覆盖来优化SQL

当不需要查询整行记录时；全表count查询优化；Limit分页查询；

哪些情况下不要建索引

表记录太少经常增删改的表或者字段（如用户余额）Where条件里用不到的字段不创建索引过滤性不好的不适合建索引（如性别）

索引下推

索引下推优化是 MySQL 5.6 引入的，可以在索引遍历过程中，对索引中包含的字段先做判断，直接过滤掉不满足条件的记录，减少回表次数

建立联合索引：

KEY `username` (`name`,`age`) )登录后复制

执行：

select * from user2 where name like 'j%' and age=99;登录后复制

上面的查询sql符合索引的最左前缀原则，所以将会用到 username 索引

5.5中上面这个 SQL 的执行流程是这样的：

首先 MySQL 的 server 层调用存储引擎获取第一个以 j 开头的 username。存储引擎找到 username=‘j’ 的第一条记录后，在 B+Tree 的叶子结点中保存着主键 id，此时通过回表操作，去主键索引中找到该条记录的完整数据，并返回给 server 层。server 层拿到数据之后，判断该条记录的 age 是否为 99，如果 age=99，就把该条记录返回给客户端，如果 age!=99，那就就丢弃该记录。

5.6中上面这个 SQL 的执行流程是这样的：

MySQL 的 server 层首先调用存储引擎定位到第一个以 j 开头的 username。找到记录后，存储引擎并不急着回表，而是继续判断这条记录的 age 是否等于 99，如果 age=99，再去回表，如果 age 不等于 99，就不去回表了，直接继续读取下一条记录。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

1314 2023-07-01

MySQL回表查询与索引覆盖的区别是什么

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

MySQL回表查询与索引覆盖的区别是什么

微信扫一扫：分享

推荐文章

友情链接

热评文章