杭州银行×TiDB:打造首个云原生分布式国产银行核心业务系统
647
2023-07-02
mysql explain中key_len的含义以及计算方法是什么
前言
在Mysql中执行explain的结果中有一列为key_len,那么key_len的含义是什么呢?
key_len:表示索引使用的字节数,根据这个值可以判断索引的使用情况,特别是在组合索引的时候,判断该索引有多少部分被使用到非常重要。
计算key_len注意事项:
索引字段的附加信息: 可以分为变长和定长数据类型讨论,当索引字段为定长数据类型时,如char,int,datetime,需要有是否为空的标记,这个标记占用1个字节(对于not null的字段来说,则不需要这1字节);对于变长数据类型,比如varchar,除了是否为空的标记外,还需要有长度信息,需要占用两个字节。对于,char、varchar、blob、text等字符集来说,key len的长度还和字符集有关,latin1一个字符占用1个字节,gbk一个字符占用2个字节,utf8一个字符占用3个字节。
举例说明:
列类型 | KEY_LEN | 备注 |
---|---|---|
id int | key_len = 4+1 | int为4bytes,允许为NULL,加1byte |
id bigint not null | key_len=8 | bigint为8bytes |
user char(30) utf8 | key_len=30*3+1 | utf8每个字符为3bytes,允许为NULL,加1byte |
user varchar(30) not null utf8 | key_len=30*3+2 | utf8每个字符为3bytes,变长数据类型,加2bytes |
user varchar(30) utf8 | key_len=30*3+2+1 | utf8每个字符为3bytes,允许为NULL,加1byte,变长数据类型,加2bytes |
detail text(10) utf8 | key_len=30*3+2+1 | TEXT截取部分,被视为动态列类型。 |
备注:key_len只指示了where中用于条件过滤时被选中的索引列,是不包含order by/group by这一部分被选中的索引列的。
例如,有个联合索引idx(c1,c2,c3),3列均是int not null,那么下面的SQL执行计划中,key_len的值是8而不是12:
select ... from tb where c1=? and c2=? order by c1;登录后复制
示例
下面以具体的示例来进行说明,表结构:
CREATE TABLE `t4` ( `id` int(11) NOT NULL AUTO_INCREMENT, `a` int(11) NOT NULL DEFAULT '0', `b` int(11) NOT NULL DEFAULT '0', `c` int(11) NOT NULL DEFAULT '0', PRIMARY KEY (`id`), KEY `index1` (`a`,`b`)) ENGINE=InnoDB;登录后复制
执行explain的结果如下:
mysql> explain select * from t4 where a =0 and b > 0;+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+| 1 | SIMPLE | t4 | range | index1 | index1 | 8 | NULL | 1 | Using where |+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+mysql> explain select * from t4 where a > 0 and b = 0;+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+| 1 | SIMPLE | t4 | range | index1 | index1 | 4 | NULL | 1 | Using where |+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+登录后复制
可以看到a=0&b>0 和 a>0&b=0 explain的结果“几乎“相同,都用到索引index1,都是range这个索引(即对索引区间扫描)得到的结果。唯一不同的是key_len。根据索引长度key_len,可以推断多维索引使用了多少维。(MySQL索引都是前缀索引)
index1是二维索引KEY index1 (a,b),因此长度应该是4+4。
a=0&b>0 key_len是8,说明仅仅用到了索引就能得到结果,先用a=0找到树节点,然后在其下面根据b>0过滤,得到结果。即”完全“用到索引就能得到结果。
a>0&b=0 key_len是4,说明仅仅用到了前缀索引的第一维,仅仅用a>0得到结果(主键),然后去主键索引(聚簇索引)里面读取整个行,根据b=0过滤相关数据,得到结果。即“不完全”用到索引才能得到结果。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。