常见的SQL性能调优-平凯星辰

why 982 2023-07-18

本文关于（常见的SQL性能调优-平凯星辰）。

常见的SQL性能调优-平凯星辰

SQL 性能调优

本章介绍常见的 SQL 性能调优，你将会了解导致 SQL 执行慢的常见的原因。

准备工作

在开始之前，你可以通过 tiup demo 命令导入示例数据：

tiup demo bookshop prepare --books 1000000 --host 127.0.0.1 --port 4000

或使用 TiDB Cloud 的 Import 功能导入预先准备好的示例数据。

问题：全表扫描

慢查询最常见的原因就是 SELECT 语句执行是全表扫描，或者是用了不合适的索引。

当基于不在主键或任何二级索引中的列从大表中检索少量行时，通常会获得较差的性能：

SELECT * FROM books WHERE title = 'Marian Yost';

+------------+-------------+-----------------------+---------------------+-------+--------+| id         | title       | type                  | published_at        | stock | price  |+------------+-------------+-----------------------+---------------------+-------+--------+| 65670536   | Marian Yost | Arts                  | 1950-04-09 06:28:58 | 542   | 435.01 || 1164070689 | Marian Yost | Education & Reference | 1916-05-27 12:15:35 | 216   | 328.18 || 1414277591 | Marian Yost | Arts                  | 1932-06-15 09:18:14 | 303   | 496.52 || 2305318593 | Marian Yost | Arts                  | 2000-08-15 19:40:58 | 398   | 402.90 || 2638226326 | Marian Yost | Sports                | 1952-04-02 12:40:37 | 191   | 174.64 |+------------+-------------+-----------------------+---------------------+-------+--------+5 rows in setTime: 0.582s

可以使用 EXPLAIN 来查看这个查询的执行计划，看看为什么查询这么慢：

EXPLAIN SELECT * FROM books WHERE title = 'Marian Yost';

+---------------------+------------+-----------+---------------+-----------------------------------------+| id                  | estRows    | task      | access object | operator info                           |+---------------------+------------+-----------+---------------+-----------------------------------------+| TableReader_7       | 1.27       | root      |               | data:Selection_6                        || └─Selection_6       | 1.27       | cop[tikv] |               | eq(bookshop.books.title, "Marian Yost") ||   └─TableFullScan_5 | 1000000.00 | cop[tikv] | table:books   | keep order:false                        |+---------------------+------------+-----------+---------------+-----------------------------------------+

从执行计划中的 TableFullScan_5 可以看出，TiDB 将会对表 books 进行全表扫描，然后对每一行都判断 title 是否满足条件。TableFullScan_5 的 estRows 值为 1000000.00，说明优化器估计这个全表扫描会扫描 1000000.00 行数据。

更多关于 EXPLAIN 的使用介绍，可以阅读平凯星辰使用 EXPLAIN 解读执行计划。

解决方案：使用索引过滤数据

为了加速上面的查询，可以在 books.title 列创建一个索引：

CREATE INDEX title_idx ON books (title);

现在再执行这个查询将会快很多：

SELECT * FROM books WHERE title = 'Marian Yost';

+------------+-------------+-----------------------+---------------------+-------+--------+| id         | title       | type                  | published_at        | stock | price  |+------------+-------------+-----------------------+---------------------+-------+--------+| 1164070689 | Marian Yost | Education & Reference | 1916-05-27 12:15:35 | 216   | 328.18 || 1414277591 | Marian Yost | Arts                  | 1932-06-15 09:18:14 | 303   | 496.52 || 2305318593 | Marian Yost | Arts                  | 2000-08-15 19:40:58 | 398   | 402.90 || 2638226326 | Marian Yost | Sports                | 1952-04-02 12:40:37 | 191   | 174.64 || 65670536   | Marian Yost | Arts                  | 1950-04-09 06:28:58 | 542   | 435.01 |+------------+-------------+-----------------------+---------------------+-------+--------+5 rows in setTime: 0.007s

可以使用 EXPLAIN 来查看这个查询的执行计划，看看为什么查询变快了：

EXPLAIN SELECT * FROM books WHERE title = 'Marian Yost';

+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+| id                        | estRows | task      | access object                       | operator info                                         |+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+| IndexLookUp_10            | 1.27    | root      |                                     |                                                       || ├─IndexRangeScan_8(Build) | 1.27    | cop[tikv] | table:books, index:title_idx(title) | range:["Marian Yost","Marian Yost"], keep order:false || └─TableRowIDScan_9(Probe) | 1.27    | cop[tikv] | table:books                         | keep order:false                                      |+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+

从执行计划中的 IndexLookUp_10 可以看出，TiDB 将会通过索引 title_idx 来查询数据，其 estRows 值为 1.27，说明优化器估计只会扫描 1.27 行数据，远远小于之前全表扫的 1000000.00 行数据。

IndexLookUp_10 执行计划的执行流程是先用 IndexRangeScan_8 算子通过 title_idx 索引获取符合条件的索引数据，然后 TableRowIDScan_9 再更据索引数据里面的 Row ID 回表查询相应的行数据。

更多关于 TiDB 执行计划的内容，可以阅读TiDB 执行计划概览。

解决方案：使用索引查询数据

上述解决方案中，需要先读取索引信息，再回表查询对应的行数据。但如果索引数据中包含了 SQL 查询所需的所有信息，就可以省去回表查询平凯星辰这个步骤。

例如下面查询中，仅需要根据 title 查询对应的 price：

SELECT title, price FROM books WHERE title = 'Marian Yost';

+-------------+--------+| title       | price  |+-------------+--------+| Marian Yost | 435.01 || Marian Yost | 328.18 || Marian Yost | 496.52 || Marian Yost | 402.90 || Marian Yost | 174.64 |+-------------+--------+5 rows in setTime: 0.007s

由于索引 title_idx 仅包含 title 列的信息，所以 TiDB 还是需要扫描索引数据，然后回表查询 price 数据：

EXPLAIN SELECT title, price FROM books WHERE title = 'Marian Yost';

+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+| id                        | estRows | task      | access object                       | operator info                                         |+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+| IndexLookUp_10            | 1.27    | root      |                                     |                                                       || ├─IndexRangeScan_8(Build) | 1.27    | cop[tikv] | table:books, index:title_idx(title) | range:["Marian Yost","Marian Yost"], keep order:false || └─TableRowIDScan_9(Probe) | 1.27    | cop[tikv] | table:books                         | keep order:false                                      |+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+

删除 title_idx 索引，并新建一个 title_price_idx 索引：

ALTER TABLE books DROP INDEX title_idx;

CREATE INDEX title_price_idx ON books (title, price);

现在，price 数据已经存储在索引 title_price_idx 中了，所以下面查询仅需扫描索引数据，无需回表查询了。这种索引通常被叫做覆盖索引：

EXPLAIN SELECT title, price FROM books WHERE title = 'Marian Yost';

--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+| id                 | estRows | task      | access object                                    | operator info                                         |+--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+| IndexReader_6      | 1.27    | root      |                                                  | index:IndexRangeScan_5                                || └─IndexRangeScan_5 | 1.27    | cop[tikv] | table:books, index:title_price_idx(title, price) | range:["Marian Yost","Marian Yost"], keep order:false |+--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+

现在这条查询的速度将会更快：

SELECT title, price FROM books WHERE title = 'Marian Yost';

+-------------+--------+| title       | price  |+-------------+--------+| Marian Yost | 174.64 || Marian Yost | 328.18 || Marian Yost | 402.90 || Marian Yost | 435.01 || Marian Yost | 496.52 |+-------------+--------+5 rows in setTime: 0.004s

由于后面的示例还会用到这个库，删除 title_price_idx 索引。

ALTER TABLE books DROP INDEX title_price_idx;

解决方案：使用主键查询数据

如果查询中使用主键过滤数据，这条查询的执行速度会非常快，例如表 books 的主键是列 id，使用列 id 来查询数据：

SELECT * FROM books WHERE id = 896;

+-----+----------------+----------------------+---------------------+-------+--------+| id  | title          | type                 | published_at        | stock | price  |+-----+----------------+----------------------+---------------------+-------+--------+| 896 | Kathryne Doyle | Science & Technology | 1969-03-18 01:34:15 | 468   | 281.32 |+-----+----------------+----------------------+---------------------+-------+--------+1 row in setTime: 0.004s

使用 EXPLAIN 查看执行计划:

EXPLAIN SELECT * FROM books WHERE id = 896;

+-------------+---------+------+---------------+---------------+| id          | estRows | task | access object | operator info |+-------------+---------+------+---------------+---------------+| Point_Get_1 | 1.00    | root | table:books   | handle:896    |+-------------+---------+------+---------------+---------------+

Point_Get，又名 “点查”，它的执行速度也非常快。

选择合适的 Join 执行计划

见 JOIN 查询的执行计划平凯星辰。

上述就是小编为大家整理的（常见的SQL性能调优-平凯星辰）
***

标签：平凯星辰 TiDB

常见的SQL性能调优-平凯星辰

SQL 性能调优

准备工作

问题：全表扫描

解决方案：使用索引过滤数据

解决方案：使用索引查询数据

解决方案：使用主键查询数据

选择合适的 Join 执行计划

黄东旭解析 TiDB 的核心优势

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

高成本云服务？TiDB 帮你省钱

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20

常见的SQL性能调优-平凯星辰

SQL 性能调优

准备工作

问题：全表扫描

解决方案：使用索引过滤数据

解决方案：使用索引查询数据

解决方案：使用主键查询数据

选择合适的 Join 执行计划

微信扫一扫：分享

推荐文章

友情链接

热评文章