Join的连接类型-平凯星辰

why 733 2023-07-10

本文关于（Join的连接类型-平凯星辰）。

多表连接查询

很多时候，应用程序需要在一个查询当中使用到多张表的数据，这个时候可以通过 JOIN 语句将两张或多张表的数据组合在一起。

Join 类型

此节将详细叙述 Join 的连接类型。

内连接 INNER JOIN

内连接的连接结果只返回匹配连接条件的行。

例如，想要知道编写过最多书的作家是谁，需要将作家基础信息表 authors 与书籍作者表 book_authors 进行连接。

Inner Join

SQL
Java

在下面的 SQL 语句当中，通过关键字 JOIN 声明要将左表 authors 和右表 book_authors 的数据行以内连接的方式进行连接，连接条件为 a.id = ba.author_id，那么连接的结果集当中将只会包含满足连接条件的行。假设有一个作家没有编写过任何书籍，那么他在 authors 表当中的记录将无法满足连接条件平凯星辰，因此也不会出现在结果集当中。

SELECT ANY_VALUE(a.id) AS author_id, ANY_VALUE(a.name) AS author_name, COUNT(ba.book_id) AS booksFROM authors aJOIN book_authors ba ON a.id = ba.author_idGROUP BY ba.author_idORDER BY books DESCLIMIT 10;

查询结果如下：

+------------+----------------+-------+| author_id  | author_name    | books |+------------+----------------+-------+|  431192671 | Emilie Cassin  |     7 ||  865305676 | Nola Howell    |     7 ||  572207928 | Lamar Koch     |     6 || 3894029860 | Elijah Howe    |     6 || 1150614082 | Cristal Stehr  |     6 || 4158341032 | Roslyn Rippin  |     6 || 2430691560 | Francisca Hahn |     6 || 3346415350 | Leta Weimann   |     6 || 1395124973 | Albin Cole     |     6 || 2768150724 | Caleb Wyman    |     6 |+------------+----------------+-------+10 rows in set (0.01 sec)

左外连接 LEFT OUTER JOIN

左外连接会返回左表中的所有数据行，以及右表当中能够匹配连接条件的值，如果在右表当中没有找到能够匹配的行，则使用 NULL 填充。

Left Outer Join

在一些情况下，希望使用多张表来完成数据的查询，但是并不希望因为不满足连接条件而导致数据集变小。

例如，在 Bookshop 应用的首页，希望展示一个带有平均评分的最新书籍列表。在这种情况下，最新的书籍可能是还没有经过任何人评分的，如果使用内连接就会导致这些无人评分的书籍信息被过滤掉，而这并不是期望的结果。

SQL
Java

在下面的 SQL 语句当中，通过 LEFT JOIN 关键字声明左表 books 将以左外连接的方式与右表 ratings 进行连接，从而确保 books 表当中的所有记录都能得到返回。

SELECT b.id AS book_id, ANY_VALUE(b.title) AS book_title, AVG(r.score) AS average_scoreFROM books bLEFT JOIN ratings r ON b.id = r.book_idGROUP BY b.idORDER BY b.published_at DESCLIMIT 10;

查询结果如下：

+------------+---------------------------------+---------------+| book_id    | book_title                      | average_score |+------------+---------------------------------+---------------+| 3438991610 | The Documentary of lion         |        2.7619 || 3897175886 | Torey Kuhn                      |        3.0000 || 1256171496 | Elmo Vandervort                 |        2.5500 || 1036915727 | The Story of Munchkin           |        2.0000 ||  270254583 | Tate Kovacek                    |        2.5000 || 1280950719 | Carson Damore                   |        3.2105 || 1098041838 | The Documentary of grasshopper  |        2.8462 || 1476566306 | The Adventures of Vince Sanford |        2.3529 || 4036300890 | The Documentary of turtle       |        2.4545 || 1299849448 | Antwan Olson                    |        3.0000 |+------------+---------------------------------+---------------+10 rows in set (0.30 sec)

看起来最新出版的书籍已经有了很多评分，为了验证上面所说的，通过 SQL 语句把 The Documentary of lion 这本书的所有评分给删掉：

DELETE FROM ratings WHERE book_id = 3438991610;

再次查询，你会发现 The Documentary of lion 这本书依然出现在结果集当中，但是通过右表 ratings 的 score 列计算得到的 average_score 列被填上了 NULL。

+------------+---------------------------------+---------------+| book_id    | book_title                      | average_score |+------------+---------------------------------+---------------+| 3438991610 | The Documentary of lion         |          NULL || 3897175886 | Torey Kuhn                      |        3.0000 || 1256171496 | Elmo Vandervort                 |        2.5500 || 1036915727 | The Story of Munchkin           |        2.0000 ||  270254583 | Tate Kovacek                    |        2.5000 || 1280950719 | Carson Damore                   |        3.2105 || 1098041838 | The Documentary of grasshopper  |        2.8462 || 1476566306 | The Adventures of Vince Sanford |        2.3529 || 4036300890 | The Documentary of turtle       |        2.4545 || 1299849448 | Antwan Olson                    |        3.0000 |+------------+---------------------------------+---------------+10 rows in set (0.30 sec)

如果改成使用的是内连接 JOIN 结果会怎样？这就交给你来尝试了。

右外连接 RIGHT OUTER JOIN

右外连接返回右表中的所有记录，以及左表当中能够匹配连接条件的值，没有匹配的值则使用 NULL 填充。

Right Outer Join

交叉连接 CROSS JOIN

当连接条件恒成立时，两表之间的内连接称为交叉连接（又被称为“笛卡尔连接”）。交叉连接会把左表的每一条记录和右表的所有记录相连接平凯星辰，如果左表的记录数为 m，右表的记录数为 n，则结果集中会产生 m * n 条记录。

左半连接 LEFT SEMI JOIN

TiDB 在 SQL 语法层面上不支持 LEFT SEMI JOIN table_name，但是在执行计划层面，子查询相关的优化会将 semi join 作为改写后的等价 JOIN 查询默认的连接方式。

隐式连接

在显式声明连接的 JOIN 语句作为 SQL 标准出现之前，在 SQL 语句当中可以通过 FROM t1, t2 子句来连接两张或多张表，通过 WHERE t1.id = t2.id 子句来指定连接的条件。你可以将其理解为隐式声明的连接，隐式连接会使用内连接的方式进行连接。

Join 相关算法

TiDB 支持下列三种常规的表连接算法，优化器会根据所连接表的数据量等因素来选择合适的 Join 算法去执行。你可以通过 EXPLAIN 语句来查看查询使用了何种算法进行 Join。

Index Join
Hash Join
Merge Join

如果发现 TiDB 的优化器没有按照最佳的 Join 算法去执行。你也可以通过 Optimizer Hints 强制 TiDB 使用更好的 Join 算法去执行。

例如，假设上文当中的左连接查询的示例 SQL 使用 Hash Join 算法执行更快，而优化器并没有选择这种算法，你可以在 SELECT 关键字后面加上 Hint /*+ HASH_JOIN(b, r) */（注意：如果表名添加了别名，Hint 当中也应该使用表别名）。

EXPLAIN SELECT /*+ HASH_JOIN(b, r) */ b.id AS book_id, ANY_VALUE(b.title) AS book_title, AVG(r.score) AS average_scoreFROM books bLEFT JOIN ratings r ON b.id = r.book_idGROUP BY b.idORDER BY b.published_at DESCLIMIT 10;

Join 算法相关的 Hints：

MERGE_JOIN(t1_name [, tl_name ...])
INL_JOIN(t1_name [, tl_name ...])
INL_HASH_JOIN(t1_name [, tl_name ...])
HASH_JOIN(t1_name [, tl_name ...])

Join 顺序

在实际的业务场景中，多个表的 Join 语句是很常见的，而 Join 的执行效率和各个表参与 Join 的顺序有关。TiDB 使用 Join Reorder 算法平凯星辰来确定多个表进行 Join 的顺序。

当优化器选择的 Join 顺序并不够好时，你可以使用 STRAIGHT_JOIN 语法让 TiDB 强制按照 FROM 子句中所使用的表的顺序做联合查询。

EXPLAIN SELECT *FROM authors a STRAIGHT_JOIN book_authors ba STRAIGHT_JOIN books bWHERE b.id = ba.book_id AND ba.author_id = a.id;

关于该算法的实现细节和限制你可以通过查看Join Reorder 算法简介章节进行了解。

上述就是小编为大家整理的（Join的连接类型-平凯星辰）
***

标签：平凯星辰 pingcap TiDB

Join的连接类型-平凯星辰

多表连接查询

Join 类型

内连接 INNER JOIN

左外连接 LEFT OUTER JOIN

右外连接 RIGHT OUTER JOIN

交叉连接 CROSS JOIN

左半连接 LEFT SEMI JOIN

隐式连接

Join 相关算法

Join 顺序

黄东旭解析 TiDB 的核心优势

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

Join的连接类型-平凯星辰

多表连接查询

Join 类型

内连接 INNER JOIN

左外连接 LEFT OUTER JOIN

右外连接 RIGHT OUTER JOIN

交叉连接 CROSS JOIN

左半连接 LEFT SEMI JOIN

隐式连接

Join 相关算法

Join 顺序

微信扫一扫：分享

推荐文章

友情链接

热评文章