SQL优化-隐式字符编码转换-PingCAP

SQL优化-隐式字符编码转换

网友投稿 614 2023-06-13

SQL优化-隐式字符编码转换

MySQL中我们知道有：

如果对索引字段做函数操作，可能会破坏索引值的有序性，因此优化器就决定放弃走树搜索功能。隐式类型转换也会导致放弃走树搜索。

因为类型转换等价于在条件字段上使用了函数比如：

假设tradeid字段有索引，且为varchar类型：mysql> select * from tradelog where tradeid=110717;等价于：mysql> select * from tradelog where CAST(tradid AS signed int) = 110717;

下面来看看隐式字符编码转换导致的一个慢SQL：：

业务上有个SQL执行需要1.31秒:

看看执行计划:

从执行计划分析看出问题出在r表也就是 h_merge_result_new_indicator 表全表扫描，查看该表的表结有联合索引。但是联合索引范围后会失效，于是打算新建一个联合索引：

查看预新建联合索引的字段选择性：

结合选择性来看：

create index idx_hmrni on h_merge_result_new_indicator(keyName,module,BATCH_NO);

创建后，再次查看执行计划依然无效：

查看表结构：

另外3个表结构其中有2个utf8mb4，1个utf8：

字符集 utf8mb4 是 utf8 的超集，所以当这两个类型的字符串在做比较的时候，MySQL 内部的操作是：先把 utf8 字符串转成 utf8mb4 字符集，再做比较。

因此：

这部分会转换后再与h_merge_result_new_indicator关联。

优化就只需要将字符集编码转为utf8再和h_merge_result_new_indicator关联就能用上索引：

再看查询只需要0.02秒了：

但是还有个问题，如上执行计划key_len是606 =(100*3+3)+(100*3+3)

也就是说，没有用上BATCH_NO字段上的索引，我们知道索引少一个字段，占用会减少，不会太臃肿。因此，联合索引只需要包含r(keyName,module)：

drop index idx_hmrni on h_merge_result_new_indicator;create index idx_hmrni on h_merge_result_new_indicator(keyName,module）;

结论

对索引字段做函数操作，可能会破坏索引值的有序性，因此优化器就决定放弃走树搜索功能。该例子是隐式字符编码转换，它们都跟其他条件索引上使用函数一样，因为要求在索引字段上做函数操作而导致了全索引扫描。

MySQL 的优化器确实有“偷懒”的嫌疑，即使简单地把 where id+1=1000 改写成 where id=1000-1 就能够用上索引快速查找，也不会主动做这个语句重写。

保证在条件索引上不做破坏索引值的有序性，是优化索引的利器。

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

614 2023-06-13

SQL优化-隐式字符编码转换

黄东旭解析 TiDB 的核心优势

黄东旭关于基础软件产品价值的思考

麒麟v10 上部署 TiDB v5.1.2 生产环境优化实践

推荐文章

HTAP 还可以这么玩？丨TiDB 在 IoT 智慧园区的应用

新特性解析丨TiDB 资源管控的设计思路与场景解析

TiDB赋能保险业-首个全栈自主核心保单系统成功投产

首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行

TiDB 在社交场景的解决方案实践

电商数据技术栈，在海量数据增长下如何实现实时与全量兼得？

金融行业数据库的选择

TiDB 在智能制造中的应用实践

TiDB 在全球头部物流企业计费管理系统的应用实践

PingCAP与教育部教育管理信息中心合作，推动普惠教育数字化转型

友情链接

热评文章

TiDB 中标杭州银行核心系统数据库项目

TiDB 首批通过信通院 HTAP 数据库基础能力评

PingCAP 与 Wisconsin-Madiso

PingCAP 成为中国唯一入选 Forrester

TiDB 走进东软集团，共建医疗数字化基石

共享开源技术，共建开放生态丨平凯星辰余梦杰出席 20