MySQL: 喂，别走，听我解释一下好吗?-PingCAP

MySQL: 喂，别走，听我解释一下好吗?

网友投稿 663 2023-05-20

MySQL: 喂，别走，听我解释一下好吗?

MySQL：先别跑好吗?

程序员：不跑你养我啊?

MySQL：你听我给你「解释」啊。

程序员：你先管好你自己吧。

现在的互联网应用也好，传统应用也罢，不管开发语言是什么，涉及到关系型数据库，MySQL 基本都是不二之选。

在 Java 的开发框架里， MyBatis 可以自定义 SQL，ORM/JPA 会根据对象映射，自动生成一系列相关的 SQL。至于自动生成的SQL，甚至自定义的SQL 执行效率到底高不高，不用 select *, 增加 where 条件，避免查全量数据等等，我们开发人员可能基本都是根据现有的知识储备，在大脑里过滤一遍，至于到底 SQL 是否高效执行，却从来没有去问过MySQL 一句。

而实际上，SQL语句写完，这项工作完成了还不到一半，其余还需要评估我们SQL写的质量如何，执行效率够不够高。MySQL 像一位智者一样，一直待在那里，只要你问，知无不言。重点在于，你不要急着走，要听他解释一下。

Explain

在 MySQL 中，我们一般常用 desc tableName 来查看一张表的信息，各个列的定义等、通过 Explain SQL 来了解MySQL 是如何执行当前这条SQL的。

实际上 desc、describe、explain 都可以用来查看MySQL 是如何执行当前这条SQL的，在 MySQL 8.0.19 之后，这三者的作用可以说是等价的，explain 也可以用来查看表信息。后面我们会直接以 explain 为例，来说明具体的作用。

官方文档说的明白， explain 可以和SELECT、INSERT、UPDATE、DELETE 一起工作，显示 MySQL 优化器的语句执行计划，即用来告诉用户 MySQL 会怎样执行这条 SQL，以什么样的顺序，如果是多表的话是怎样 Join的。

输出字段官网文档截图如下：

上面返回看似不少，不过我们重点关注 type、key、rows 这三个。

我们常见应用的场景都是读多写少，而且对于 SQL 的执行的效率评估，一般也是说从已经存储的十成、百万甚至千万条数据中查询需要数据的效率。

后面以 SELECT 为例，来看看 explain 能带给我们什么帮忙和建议。

假设有如下表定义及数据：

CREATE TABLE `t3` ( `id` int NOT NULL, `a` int DEFAULT NULL, `b` int DEFAULT NULL, PRIMARY KEY (`id`), KEY `a` (`a`) ) ENGINE=InnoDB; delimiter ;; create procedure idata() begin declare i int; set i=1; while(i<=100000) do insert into t3 values(i,i,i); set i=i+1; end while; end;; delimiter ; call idata();

执行完上述SQL，我们来试想一下，在当前十万行数据的表中如果执行一条查询SQL，那在少量数据中查找一定比全表查找要快很好。

比如我们最熟悉的通过主键查询

select a from t3 where id=100;

你会发现，explain 中 type 是 const， key 是 PRIMARY

再比如执行

select * from t3 where b=100;

这个时候， explain 告诉我们，查询类型是ALL，全表扫描：

如果我们是想要把这个表里全部数据显示也就罢了，目前只查一条数据却执行全表扫描，explain 告诉我们扫描行可能会到9万多行，效率可想而知。

如果我们把SQL 改成这样：

select * from t3 where a=100;

此时 explain 变成了这样：

你会发现，type 变成了 ref， key 变成了a, rows 是1，区别只在于 a 列上建立了索引，此时扫描行数变成了一行，差别太明显了。

如果我们要查找一个范围内的数据，通过主键或者包含索引的列进行查询时，

扫描的还是有限行，此时type是range，但如果还是通过 b 做为条件进行过滤，那还是全表扫描：

另外，为什么一般的SQL优化建议里都会说别用 select * ,指定具体用到的列呢?

肯定是用到什么列的数据查什么数据更节省内存，传输，不要等到查出结果再在内存里进行过滤，此外更重要的一点是，每个创建的索引，都有自己的索引树，能够在索引树上完成查询操作，就不需要再回表去查询，效率当然会更高。

比如，我们把查询换成了

select a,id from t3 where a < 100;

此时，explain 会在Extra里告诉咱们，查询的时候没有回表，用到了index

如果把查询列改成星，这个时候，就需要回表了，

咱们前面说重点关注 type， key， rows，可以再看下 Extra， type 里查询效率从优到差，有

const

表中只有一行匹配，查询一次即可满足。常用来匹配主键或者唯一索引。

eq_ref

唯一索引

ref

非唯一索引

range

通过一个索引去查询，只扫描指定范围内的行。一般是在检索列中包含 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, LIKE, or IN()

index

类似于全表扫描，区别在于只扫描索引树

all

全表扫描，效率最低的。

在 MySQL 8.0.18 开始，还加入了一个 explain analyze，可以查看具体预计SQL执行耗时，比如我们通过它来查看上面的几个命令，会有如下输出，你会更直观的感觉到加了索引带来的效率提升。

是不是很明显?

所有，你听到MySQL 又在和你说了吗?

『小伙子，你慢些走。有事没事听我给你先解释解释，说道说道啊』

小结一下，通过 explain，我们能在执行前就从 MySQL的优化器拿到对于当前 SQL 的执行计划，了解执行中至少会扫描多少行，是否会使用到索引，大致会用多少时间等，这样该加索引加索引，该改SQL就改SQL，这样做到心中有数，应用的性能会更心中有数。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

663 2023-05-20

MySQL: 喂，别走，听我解释一下好吗?

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

MySQL: 喂，别走，听我解释一下好吗?

微信扫一扫：分享

推荐文章

友情链接

热评文章