Mysql表连接的执行流程是什么-PingCAP

Mysql表连接的执行流程是什么

网友投稿 707 2023-07-03

Mysql表连接的执行流程是什么

1. 前言

对于连接操作，驱动表和被驱动表的关联条件我们放在on后面，如果额外增加对驱动表和被驱动表的过滤条件，放到on或者where后面都不会报错，但是得到的结果集却是不一样的？？？

1.1 mysql连接的原理

众所周知，mysql是基于嵌套循环连接（Nested-Loop Join，暂不考虑优化算法）算法来进行表之间的连接操作的，大致过程如下：

选取驱动表，使用与驱动表相关的过滤条件执行对驱动表的单表查询；对于查询到的驱动表中的每一条纪录，分别到被驱动表中查找匹配的纪录。

伪代码如下：

for each row in t1 { // 遍历满足对t1单表查询结果集中的每一条纪录 for each row in t2 { // 对于某条t1纪录，遍历满足对t2单表查询结果集中的每一条纪录 if row satisfies join conditions, send to client }}登录后复制

1.2 show warnings命令

我们写的sql语句，在经过优化器优化后才会交给执行器执行，而show warnings命令则可以帮助我们获得优化器优化后的sql。

2. 准备工作

表结构如下：

CREATE TABLE `student` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `stu_code` varchar(20) NOT NULL DEFAULT '', `stu_name` varchar(30) NOT NULL DEFAULT '', `stu_sex` varchar(10) NOT NULL DEFAULT '', `stu_age` int(10) NOT NULL DEFAULT '0', `stu_dept` varchar(30) NOT NULL DEFAULT '', PRIMARY KEY (`id`) USING BTREE, UNIQUE KEY `uq_stu_code` (`stu_code`)) ENGINE=InnoDB AUTO_INCREMENT=43 DEFAULT CHARSET=utf8mb4CREATE TABLE `course` ( `id` bigint(20) NOT NULL AUTO_INCREMENT, `cou_code` varchar(20) NOT NULL DEFAULT '', `cou_name` varchar(50) NOT NULL DEFAULT '', `cou_score` int(10) NOT NULL DEFAULT '0', `stu_code` varchar(20) NOT NULL DEFAULT '', PRIMARY KEY (`id`) USING BTREE, KEY `idx_stu_code_cou_code` (`stu_code`,`cou_code`)) ENGINE=InnoDB AUTO_INCREMENT=19 DEFAULT CHARSET=utf8mb4登录后复制

表数据如下：

3. inner join内连接on、where的区别

sql如下：

select * from studentinner join course on student.stu_code = course.stu_codeand student.stu_code >= 3 and course.cou_score >= 80;登录后复制

执行explain+sql命令：

执行show warnings命令：

分析：从show warnings分析来看，对于inner join连接，经过优化器优化后，on连接条件会转化为where！也就是说内连接中的where和on是等价的。

4. left join左连接on、where的区别

4.1 where驱动表过滤条件

sql如下：

select * from studentleft join course on student.stu_code = course.stu_codewhere student.stu_code >= 3;登录后复制

执行explain+sql命令：

执行show warnings命令：

结果集：

分析：从explain分析看出，student作为驱动表，把student.stu_code >= 3作为过滤条件进行全表扫描，然后把查询到的每条纪录的student.stu_code（也就是on条件里面的）分别作为过滤条件让被驱动表course做单表查询。

4.2 on驱动表过滤条件

sql如下：

select * from studentleft join course on student.stu_code = course.stu_code and student.stu_code >= 3;登录后复制

执行explain+sql命令：

执行show warnings命令：

结果集：

从结果集来看，student.stu_code >= 3并未生效，为什么？

分析：从explain分析看出，student作为驱动表，做全表扫描，然后把查询到的每条记录的student.stu_code和student.stu_code >= 3（也就是on条件里面的）分别做为过滤条件让被驱动表做单表查询；此时student.stu_code >= 3对驱动表是不过滤的，仅在连接被驱动表时生效，查询不到符合纪录而返回NULL！

4.3 on被驱动表过滤条件

sql如下：

select * from studentleft join course on student.stu_code = course.stu_code and course.cou_score >= 80;登录后复制

执行explain+sql命令：

执行show warnings命令：

结果集：

分析：从explain分析看出，student作为驱动表，做全表扫描，然后把查询到的每条记录的student.stu_code和course.cou_score >= 80（也就是on条件里面的）分别做为过滤条件让被驱动表做单表查询；

4.4 where被驱动表过滤条件

sql如下：

执行explain+sql命令：

执行show warnings命令：

结果集：

从show warnings分析来看？left join连接变成了inner join连接？

分析：从show warnings分析看出，如果被驱动表有过滤条件在where，那么left join会被失效，被优化成inner join连接。所以被驱动表的过滤条件应该放在on而不是where。

TiDB 在国有大银行业务转型中的关键作用

707 2023-07-03

Mysql表连接的执行流程是什么

杭州银行×TiDB：打造首个云原生分布式国产银行核心业务系统

从银行资产规模看TiDB上线杭州银行核心有什么深远的意义？

TiDB 在国有大银行业务转型中的关键作用

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

Mysql表连接的执行流程是什么

微信扫一扫：分享

推荐文章

友情链接

热评文章