到底什么是MySQL执行计划吗？-PingCAP

到底什么是MySQL执行计划吗？

网友投稿 596 2023-05-28

到底什么是MySQL执行计划吗？

面试官说：工作这么久了，应该知道sql执行计划吧，讲讲Sql的执行计划吧!看了看面试官手臂上纹的大花臂和一串看不懂的韩文，吞了吞口水，暗示自己镇定点，整理了一下思绪缓缓的对面试官说：我不会面试官：。。。。，回去等通知吧我：%^&%$!@#

一、前言

当我们工作到了一定的年限之后，一些应该掌握的知识点，我们是必须需要去了解的，比如今天面试官问的SQL执行计划当我们执行一条SQL的时候，可以直接对应的结果，但是你并不晓得，它会经历多深远黑暗的隧道，通过连接器、查询缓存、分析器、优化器、执行器重重筛选，才有可能展示到我们面前，有时候当你等待N长时间，但是展现的却是 timeout，这个时候想砸电脑的心都有了，不过当你看了今天的SQL执行计划后，你再也不用砸电脑了，看懂了这篇文章你就会知道这都不是事，让我们一起来揭晓这里面的奥妙

在实际的应用场景中，为了知道优化SQL语句的执行，需要查看SQL语句的具体执行过程，以加快SQL语句的执行效率。通常会使用explain+SQL语句来模拟优化器执行SQL查询语句，从而知道mysql是如何处理sql语句的。

首先我们来下面的一条sql语句，其中会有 id、select_type、table等等这些列，这些就是我们执行计划中所包含的信息，我们要弄明白的就是这些列是用来干嘛的，以及每个列可能存在多少个值。

explain select * from emp;

二、执行计划中包含的信息

贴心的小农已经把sql复制出来了，只需要放到数据库中执行即可，方便简单快捷 ——牧小农

建表语句：

SET FOREIGN_KEY_CHECKS=0; DROP TABLE IF EXISTS `dept`; CREATE TABLE `dept` ( `DEPTNO` int NOT NULL, `DNAME` varchar(14) DEFAULT NULL, `LOC` varchar(13) DEFAULT NULL, PRIMARY KEY (`DEPTNO`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `dept` VALUES ('10', 'ACCOUNTING', 'NEW YORK'); INSERT INTO `dept` VALUES ('20', 'RESEARCH', 'DALLAS'); INSERT INTO `dept` VALUES ('30', 'SALES', 'CHICAGO'); INSERT INTO `dept` VALUES ('40', 'OPERATIONS', 'BOSTON'); DROP TABLE IF EXISTS `emp`; CREATE TABLE `emp` ( `EMPNO` int NOT NULL, `ENAME` varchar(10) DEFAULT NULL, `JOB` varchar(9) DEFAULT NULL, `MGR` int DEFAULT NULL, `HIREDATE` date DEFAULT NULL, `SAL` double(7,2) DEFAULT NULL, `COMM` double(7,2) DEFAULT NULL, `DEPTNO` int DEFAULT NULL, PRIMARY KEY (`EMPNO`), KEY `idx_job` (`JOB`), KEY `jdx_mgr` (`MGR`), KEY `jdx_3` (`DEPTNO`), KEY `idx_3` (`DEPTNO`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `emp` VALUES ('7369', 'SMITH', 'CLERK', '7902', '1980-12-17', '800.00', null, '20'); INSERT INTO `emp` VALUES ('7499', 'ALLEN', 'SALESMAN', '7698', '1981-02-20', '1600.00', '300.00', '30'); INSERT INTO `emp` VALUES ('7521', 'WARD', 'SALESMAN', '7698', '1981-02-22', '1250.00', '500.00', '30'); INSERT INTO `emp` VALUES ('7566', 'JONES', 'MANAGER', '7839', '1981-02-02', '2975.00', null, '20'); INSERT INTO `emp` VALUES ('7654', 'MARTIN', 'SALESMAN', '7698', '1981-09-28', '1250.00', '1400.00', '30'); INSERT INTO `emp` VALUES ('7698', 'BLAKE', 'MANAGER', '7839', '1981-01-05', '2850.00', null, '30'); INSERT INTO `emp` VALUES ('7782', 'CLARK', 'MANAGER', '7839', '1981-09-06', '2450.00', null, '10'); INSERT INTO `emp` VALUES ('7839', 'KING', 'PRESIDENT', null, '1981-11-17', '5000.00', null, '10'); INSERT INTO `emp` VALUES ('7844', 'TURNER', 'SALESMAN', '7698', '1981-09-08', '1500.00', '0.00', '30'); INSERT INTO `emp` VALUES ('7900', 'JAMES', 'CLERK', '7698', '1981-12-03', '950.00', null, '30'); INSERT INTO `emp` VALUES ('7902', 'FORD', 'ANALYST', '7566', '1981-12-03', '3000.00', null, '20'); INSERT INTO `emp` VALUES ('7934', 'MILLER', 'CLERK', '7782', '1982-01-23', '1300.00', null, '10'); DROP TABLE IF EXISTS `emp2`; CREATE TABLE `emp2` ( `id` int NOT NULL AUTO_INCREMENT, `empno` int DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=utf8; INSERT INTO `emp2` VALUES ('1', '111'); INSERT INTO `emp2` VALUES ('2', '222'); DROP TABLE IF EXISTS `salgrade`; CREATE TABLE `salgrade` ( `GRADE` int NOT NULL, `LOSAL` double DEFAULT NULL, `HISAL` double DEFAULT NULL, PRIMARY KEY (`GRADE`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `salgrade` VALUES ('1', '700', '1200'); INSERT INTO `salgrade` VALUES ('2', '1201', '1400'); INSERT INTO `salgrade` VALUES ('3', '1401', '2000'); INSERT INTO `salgrade` VALUES ('4', '2001', '3000'); INSERT INTO `salgrade` VALUES ('5', '3001', '9999'); DROP TABLE IF EXISTS `t_job`; CREATE TABLE `t_job` ( `id` int NOT NULL AUTO_INCREMENT, `job` varchar(9) CHARACTER SET utf8 COLLATE utf8_general_ci DEFAULT NULL, PRIMARY KEY (`id`), KEY `j` (`job`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2.1 id

select查询的序列号，包含一组数字，表示查询中执行select子句或者操作表的顺序

id号分为三种情况：

1、如果id相同，那么执行顺序从上到下

-- 左关联 explain select* from emp e left join dept d on e.deptno = d.deptno; -- 右关联e explain select* from emp e right join dept d on e.deptno = d.deptno;

通过left join 和 right join 验证;id一样(注意执行计划的table列)，left join 先扫描e表，再扫描d表;right join 先扫描d表，再扫描e表

2、如果id不同，如果是子查询，id的序号会递增，id值越大优先级越高，越先被执行

explain select * from emp e where e.deptno = (select d.deptno from dept d where d.dname = 'SALES');

在下面的表中回先查询 id 为 2的数据也就是我们的 d表(注意：我们可以看到d表中select_type为 SUBQUERY 也就是子查询的意思)，然后根据d表中的deptno去查询 e表中的数据

3、id相同和不同的，同时存在：相同的可以认为是一组，从上往下顺序执行，在所有组中，id值越大，优先级越高，越先执行

explain select * from emp e join dept d on e.deptno = d.deptno join salgrade sg on e.sal between sg.losal and sg.hisal where e.deptno = (select d.deptno from dept d where d.dname = 'SALES');

在这里先从id为2的执行，如果id是一样的，就按照顺序执行

2.2 select_type

主要用来分辨查询的类型，是普通查询还是联合查询还是子查询

--simple:简单的查询，不包含子查询和union explain select* from emp;

--primary:查询中若包含任何复杂的子查询，最外层查询则被标记为Primary explain select * from emp e where e.deptno = (select d.deptno from dept d where d.dname = 'SALES');

--union:若第二个select出现在union之后，则被标记为union explain select * from emp where deptno = 10 union select * from emp where sal >2000;

--dependent union:跟union类似，此处的depentent表示union或union all联合而成的结果会受外部表影响 explain select * from emp e where e.empno in ( select empno from emp where deptno = 10 union select empno from emp where sal >2000);

--union result:从union表获取结果的select explain select * from emp where deptno = 10 union select * from emp where sal >2000;

--subquery:在select或者where列表中包含子查询 explain select* from emp where sal > (select avg(sal) from emp) ;

--dependent subquery:subquery的子查询要受到外部表查询的影响 explain select * from emp e where e.deptno = (select distinct deptno from dept where deptno = e.deptno);

--DERIVED: from子句中出现的子查询，也叫做派生类， explain select * from (select ename staname,mgr from emp where ename = 'W' union select ename,mgr from emp where ename = 'E') a;

-- UNCACHEABLE SUBQUERY：表示使用子查询的结果不能被缓存 explain select * from emp where empno = (select empno from emp where deptno=@@sort_buffer_size);

--uncacheable union:表示union的查询结果不能被缓存 explain select * from emp where exists (select 1 from dept where emp.deptno = dept.deptno union select 1 from dept where deptno = 10);

2.3 table

对应行正在访问哪一个表，表名或者别名，可能是临时表或者union合并结果集 1、如果是具体的表名，则表明从实际的物理表中获取数据，也可以是表的别名

explainselect*fromempwheresal>(selectavg(sal)fromemp);

2、表名是derivedN的形式，表示使用了id为N的查询产生的衍生表

explain select * from (select ename staname,mgr from emp where ename = 'WARD' union select ename staname,mgr from emp where ename = 'SMITH') a;

derived2 ：表明我们需要从衍生表2中取数据

3、当有union result的时候，表名是union n1,n2等的形式，n1,n2表示参与union的id

explain select * from emp where deptno = 10 union select * from emp where sal >2000;

2.4 type

type显示的是访问类型，访问类型表示我是以何种方式去访问我们的数据，最容易想的是全表扫描，直接暴力的遍历一张表去寻找需要的数据，效率非常低下，访问的类型有很多，效率从最好到最坏依次是：

system > const > eqref > ref > fulltext > refornull > indexmerge > uniquesubquery > indexsubquery > range > index > ALL

一般情况下，得保证查询至少达到range级别，最好能达到ref

--all:全表扫描，一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化。 explain select * from emp;

--index：全索引扫描这个比all的效率要好，主要有两种情况，一种是当前的查询时覆盖索引，即我们需要的数据在索引中就可以索取，或者是使用了索引进行排序，这样就避免数据的重排序 explain select empno from emp;

--range：表示利用索引查询的时候限制了范围，在指定范围内进行查询，这样避免了index的全索引扫描，适用的操作符：=, <>, >, >=, <, <=, IS NULL, BETWEEN, LIKE, or IN() explain select * from emp where empno between 7000 and 7500;

--index_subquery：利用索引来关联子查询，不再扫描全表 explain select * from emp where emp.job in (select job from t_job); --unique_subquery:该连接类型类似与index_subquery,使用的是唯一索引 explain select * from emp e where e.deptno in (select distinct deptno from dept); --ref_or_null：对于某个字段即需要关联条件，也需要null值的情况下，查询优化器会选择这种访问方式 explain select * from emp e where e.mgr is null or e.mgr=7369;

--ref：使用了非唯一性索引进行数据的查找 create index idx_3 on emp(deptno); explain select * from emp e,dept d where e.deptno =d.deptno;

--eq_ref ：使用唯一性索引进行数据查找 explain select * from emp,emp2 where emp.empno = emp2.empno;

--const：这个表至多有一个匹配行， explain select * from emp where empno = 7369;

--system：表只有一行记录（等于系统表），这是const类型的特例，平时不会出现

2.5 possible_keys

显示可能应用在这张表中的索引，一个或多个，查询涉及到的字段上若存在索引，则该索引将被列出，但不一定被查询实际使用

explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;

2.6 key

实际使用的索引，如果为null，则没有使用索引，查询中若使用了覆盖索引，则该索引和查询的select字段重叠。

explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;

2.7 key_len

表示索引中使用的字节数，可以通过keylen计算查询中使用的索引长度，在不损失精度的情况下长度越短越好。

1、一般地，keylen 等于索引列类型字节长度，例如int类型为4 bytes，bigint为8 bytes;

2、如果是字符串类型，还需要同时考虑字符集因素，例如utf8字符集1个字符占3个字节，gbk字符集1个字符占2个字节

3、若该列类型定义时允许NULL，其keylen还需要再加 1 bytes

4、若该列类型为变长类型，例如 VARCHAR(TEXT\BLOB不允许整列创建索引，如果创建部分索引也被视为动态列类型)，其keylen还需要再加 2 bytes 字符集会影响索引长度、数据的存储空间，为列选择合适的字符集;变长字段需要额外的2个字节，固定长度字段不需要额外的字节。而null都需要1个字节的额外空间，所以以前有个说法：索引字段最好不要为NULL，因为NULL让统计更加复杂，并且需要额外一个字节的存储空间。

explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;

2.8 ref

显示索引的哪一列被使用了，如果可能的话，是一个常数

explain select * from emp,dept where emp.deptno = dept.deptno and emp.deptno = 10;

2.9 rows

根据表的统计信息及索引使用情况，大致估算出找出所需记录需要读取的行数，此参数很重要，直接反应的sql找了多少数据，在完成目的的情况下越少越好

explain select * from emp;

2.10 extra

包含额外的信息。

--using filesort:说明mysql无法利用索引进行排序，只能利用排序算法进行排序，会消耗额外的位置 explain select * from emp order by sal;

--using temporary:建立临时表来保存中间结果，查询完成之后把临时表删除 explain select ename,count(*) from emp where deptno = 10 group by ename;

--using index:这个表示当前的查询时覆盖索引的，直接从索引中读取数据，而不用访问数据表。如果同时出现using where 表名索引被用来执行索引键值的查找，如果没有，表面索引被用来读取数据，而不是真的查找 explain select deptno,count(*) from emp group by deptno limit 10;

--using where:使用where进行条件过滤 explain select * from emp2 where empno = 1;

三总结

到这里执行计划就讲完了，sql的执行计划并不是很难，主要是记住每个列代表的意思和如何进行优化，这个是需要大量的训练和实操实现的，有兴趣的小伙伴可以自行去试试，还是很有趣的，本文只是简单介绍一下MySQL执行计划，想全面深入了解MySQL,可优先阅读MySQL官方手册，大家加油~

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

596 2023-05-28

到底什么是MySQL执行计划吗？

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

零售业数据库选型与迁移ToC系统实践大规模场景应用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20