黄东旭解析 TiDB 的核心优势
792
2023-07-18
本文关于(常见的SQL性能调优-平凯星辰)。
本章介绍常见的 SQL 性能调优,你将会了解导致 SQL 执行慢的常见的原因。
在开始之前,你可以通过 tiup demo
命令导入示例数据:
tiup demo bookshop prepare --books 1000000 --host 127.0.0.1 --port 4000
或使用 TiDB Cloud 的 Import 功能导入预先准备好的示例数据。
慢查询最常见的原因就是 SELECT
语句执行是全表扫描,或者是用了不合适的索引。
当基于不在主键或任何二级索引中的列从大表中检索少量行时,通常会获得较差的性能:
SELECT * FROM books WHERE title = 'Marian Yost';
+------------+-------------+-----------------------+---------------------+-------+--------+| id | title | type | published_at | stock | price |+------------+-------------+-----------------------+---------------------+-------+--------+| 65670536 | Marian Yost | Arts | 1950-04-09 06:28:58 | 542 | 435.01 || 1164070689 | Marian Yost | Education & Reference | 1916-05-27 12:15:35 | 216 | 328.18 || 1414277591 | Marian Yost | Arts | 1932-06-15 09:18:14 | 303 | 496.52 || 2305318593 | Marian Yost | Arts | 2000-08-15 19:40:58 | 398 | 402.90 || 2638226326 | Marian Yost | Sports | 1952-04-02 12:40:37 | 191 | 174.64 |+------------+-------------+-----------------------+---------------------+-------+--------+5 rows in setTime: 0.582s
可以使用 EXPLAIN
来查看这个查询的执行计划,看看为什么查询这么慢:
EXPLAIN SELECT * FROM books WHERE title = 'Marian Yost';
+---------------------+------------+-----------+---------------+-----------------------------------------+| id | estRows | task | access object | operator info |+---------------------+------------+-----------+---------------+-----------------------------------------+| TableReader_7 | 1.27 | root | | data:Selection_6 || └─Selection_6 | 1.27 | cop[tikv] | | eq(bookshop.books.title, "Marian Yost") || └─TableFullScan_5 | 1000000.00 | cop[tikv] | table:books | keep order:false |+---------------------+------------+-----------+---------------+-----------------------------------------+
从执行计划中的 TableFullScan_5 可以看出,TiDB 将会对表 books
进行全表扫描,然后对每一行都判断 title
是否满足条件。TableFullScan_5 的 estRows
值为 1000000.00
,说明优化器估计这个全表扫描会扫描 1000000.00
行数据。
更多关于 EXPLAIN
的使用介绍,可以阅读平凯星辰使用 EXPLAIN 解读执行计划。
为了加速上面的查询,可以在 books.title
列创建一个索引:
CREATE INDEX title_idx ON books (title);
现在再执行这个查询将会快很多:
SELECT * FROM books WHERE title = 'Marian Yost';
+------------+-------------+-----------------------+---------------------+-------+--------+| id | title | type | published_at | stock | price |+------------+-------------+-----------------------+---------------------+-------+--------+| 1164070689 | Marian Yost | Education & Reference | 1916-05-27 12:15:35 | 216 | 328.18 || 1414277591 | Marian Yost | Arts | 1932-06-15 09:18:14 | 303 | 496.52 || 2305318593 | Marian Yost | Arts | 2000-08-15 19:40:58 | 398 | 402.90 || 2638226326 | Marian Yost | Sports | 1952-04-02 12:40:37 | 191 | 174.64 || 65670536 | Marian Yost | Arts | 1950-04-09 06:28:58 | 542 | 435.01 |+------------+-------------+-----------------------+---------------------+-------+--------+5 rows in setTime: 0.007s
可以使用 EXPLAIN
来查看这个查询的执行计划,看看为什么查询变快了:
EXPLAIN SELECT * FROM books WHERE title = 'Marian Yost';
+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+| id | estRows | task | access object | operator info |+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+| IndexLookUp_10 | 1.27 | root | | || ├─IndexRangeScan_8(Build) | 1.27 | cop[tikv] | table:books, index:title_idx(title) | range:["Marian Yost","Marian Yost"], keep order:false || └─TableRowIDScan_9(Probe) | 1.27 | cop[tikv] | table:books | keep order:false |+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+
从执行计划中的 IndexLookUp_10 可以看出,TiDB 将会通过索引 title_idx
来查询数据,其 estRows
值为 1.27
,说明优化器估计只会扫描 1.27
行数据,远远小于之前全表扫的 1000000.00
行数据。
IndexLookUp_10 执行计划的执行流程是先用 IndexRangeScan_8 算子通过 title_idx
索引获取符合条件的索引数据,然后 TableRowIDScan_9 再更据索引数据里面的 Row ID 回表查询相应的行数据。
更多关于 TiDB 执行计划的内容,可以阅读TiDB 执行计划概览。
上述解决方案中,需要先读取索引信息,再回表查询对应的行数据。但如果索引数据中包含了 SQL 查询所需的所有信息,就可以省去回表查询平凯星辰这个步骤。
例如下面查询中,仅需要根据 title
查询对应的 price
:
SELECT title, price FROM books WHERE title = 'Marian Yost';
+-------------+--------+| title | price |+-------------+--------+| Marian Yost | 435.01 || Marian Yost | 328.18 || Marian Yost | 496.52 || Marian Yost | 402.90 || Marian Yost | 174.64 |+-------------+--------+5 rows in setTime: 0.007s
由于索引 title_idx
仅包含 title
列的信息,所以 TiDB 还是需要扫描索引数据,然后回表查询 price
数据:
EXPLAIN SELECT title, price FROM books WHERE title = 'Marian Yost';
+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+| id | estRows | task | access object | operator info |+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+| IndexLookUp_10 | 1.27 | root | | || ├─IndexRangeScan_8(Build) | 1.27 | cop[tikv] | table:books, index:title_idx(title) | range:["Marian Yost","Marian Yost"], keep order:false || └─TableRowIDScan_9(Probe) | 1.27 | cop[tikv] | table:books | keep order:false |+---------------------------+---------+-----------+-------------------------------------+-------------------------------------------------------+
删除 title_idx
索引,并新建一个 title_price_idx
索引:
ALTER TABLE books DROP INDEX title_idx;
CREATE INDEX title_price_idx ON books (title, price);
现在,price
数据已经存储在索引 title_price_idx
中了,所以下面查询仅需扫描索引数据,无需回表查询了。这种索引通常被叫做覆盖索引:
EXPLAIN SELECT title, price FROM books WHERE title = 'Marian Yost';
--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+| id | estRows | task | access object | operator info |+--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+| IndexReader_6 | 1.27 | root | | index:IndexRangeScan_5 || └─IndexRangeScan_5 | 1.27 | cop[tikv] | table:books, index:title_price_idx(title, price) | range:["Marian Yost","Marian Yost"], keep order:false |+--------------------+---------+-----------+--------------------------------------------------+-------------------------------------------------------+
现在这条查询的速度将会更快:
SELECT title, price FROM books WHERE title = 'Marian Yost';
+-------------+--------+| title | price |+-------------+--------+| Marian Yost | 174.64 || Marian Yost | 328.18 || Marian Yost | 402.90 || Marian Yost | 435.01 || Marian Yost | 496.52 |+-------------+--------+5 rows in setTime: 0.004s
由于后面的示例还会用到这个库,删除 title_price_idx
索引。
ALTER TABLE books DROP INDEX title_price_idx;
如果查询中使用主键过滤数据,这条查询的执行速度会非常快,例如表 books
的主键是列 id
,使用列 id
来查询数据:
SELECT * FROM books WHERE id = 896;
+-----+----------------+----------------------+---------------------+-------+--------+| id | title | type | published_at | stock | price |+-----+----------------+----------------------+---------------------+-------+--------+| 896 | Kathryne Doyle | Science & Technology | 1969-03-18 01:34:15 | 468 | 281.32 |+-----+----------------+----------------------+---------------------+-------+--------+1 row in setTime: 0.004s
使用 EXPLAIN
查看执行计划:
EXPLAIN SELECT * FROM books WHERE id = 896;
+-------------+---------+------+---------------+---------------+| id | estRows | task | access object | operator info |+-------------+---------+------+---------------+---------------+| Point_Get_1 | 1.00 | root | table:books | handle:896 |+-------------+---------+------+---------------+---------------+
Point_Get,又名 “点查”,它的执行速度也非常快。
见 JOIN 查询的执行计划平凯星辰。
上述就是小编为大家整理的(常见的SQL性能调优-平凯星辰)
***
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。