MySql优化- 执行计划解读与优化(二) - 走看看

zoukankan html css js c++ java

MySql优化- 执行计划解读与优化(二)
待阅

https://mp.weixin.qq.com/s/IN2mzyOXdVWE0NQJr1egcA

说明

解读执行计划l对于我们日常工作中慢sql的分析和调优有很大帮助,同时在解读的过程中也能知道如何规避慢sql

建议需要了解join匹配原理的知识:https://www.cnblogs.com/LQBlog/p/10711743.html

查看sql优化器优化后的sql
EXPLAIN EXTENDED select * from( select * from( select cn.`id` from `cpn_coupon` cn where cn.`create_timestamp` >='2019-12-27'))tab2 SHOW WARNINGS
mysql执行计划表结构

各个字段详解

测试表结构说明

sl_sales_bill_copy1 订单抬头表

sl_sales_bill_copy1订单行项目表

order_status 订单状态变动表

id

执行顺序值越大的优先执行如果相同则根据从上到下的顺序来确定如果为null则最后执行
#查出订单状态存在1010的订单的所有行项目信息
EXPLAIN select * from sl_sales_bill_copy1 lb join sl_sales_bill_head_copy1 lh on lh.SALES_BILL_NO = lb.SALES_BILL_NO where lb.SALES_BILL_NO in(select ls.SALES_BILL_NO from order_status ls where ls.status_code=1010)
先执行id为2查询将查询结果保存为临时表,再执行id为1的从上到下,先将lb为驱动表关联查询lh得出结果 subquery2临时表然后作为临时表去非驱动表ls查询数据

select_type

用途:查询的类型，主要是用于区分普通查询、联合查询、子查询等复杂的查询
1、SIMPLE：简单的select查询，查询中不包含子查询或者union 2、PRIMARY：查询中包含任何复杂的子部分，最外层查询则被标记为primary 3、SUBQUERY：被驱动的SELECT子查询（子查询位于FROM子句 where）
4、DEPENDENT SUBQUERY 子查询依赖外部查询,慎用 5、DERIVED：在from列表中包含的子查询被标记为derived（衍生），mysql或递归执行这些子查询，把结果放在临时表里
6、MATERIALIZED 物化子查询,子查询来自视图 7、UNION：在 UNION 查询语句中的第二个和紧随其后的 SELECT。 8、UNION RESULT：组中union结果的临时表 9、DEPENDENT SUBQUERY 子查询依赖外部查询(慎用)
10、DEPENDENT UNION 子查询中包含union
SIMPLE
explain select * from cpn_coupon where id=1
SUBQUERY

先通过子查询得出id 再根据id值去查询
EXPLAIN select * from cpn_coupon c where c.id =(select max(cn.coupon_id) from `cpn_coupon_code` cn where cn.`create_timestamp` >='2019-12-27')
DEPENDENT SUBQUERY

慎用子查询依赖外部查询,会先根据外部查询得出一个临时表再根据临时表去触发子查询因为p表没有查询条件每条数据都会触发一次o表查询现在数据 566条相当于触发了566 t2 select 数据量大就更夸张(就算t2走了索引页会导致性能问题) 建议改成select join group by 可以理解为p表查询结果为临时表。在for循环遍历每一条数据查询o表

可以理解为
var items=select * from prm_page_promotion for(var item in items){ select * from prm_page_promotion o where o.parent_id=item.getId(); }
explain select * from prm_page_promotion p where exists(select p.id from prm_page_promotion o where p.id=o.parent_id)
DERIVED

子查询位于form处先通过create_timestamp查询结果到临时表再根据临时表id查询
EXPLAIN select * from( select cn.`id` from `cpn_coupon` cn where cn.`create_timestamp` >='2019-12-27')tab2 where tab2.id=1
MATERIALIZED
--创建视图 create view v1 as select cn.coupon_id from `cpn_coupon_code` cn where cn.`create_timestamp` >='2019-12-27' --使用视图为子查询 EXPLAIN select * from cpn_coupon c where c.id in(select v1.coupon_id from v1)
UNION/UNOIN_RESULT

cp2为union表可以看出是先执行cpu2再执行cp2 primary为最外层,然后汇聚成UNION RESULT 结果
explain select * from cpn_coupon where id=578032073359495168 union all select * from cpn_coupon where id=580952931153494016
DEPENDENT UNION
explain select * from cpn_coupon cp where cp.id in(select cp1.id from cpn_coupon cp1 where cp1.id=578032073359495168 union all select cp2.id from cpn_coupon cp2 where cp2.id=580952931153494016)
cp2 cp1 查询结果为unioReuslt再通过cp表子查询union结果集

table

table 列表示 EXPLAIN 的单独行的唯一标识符。这个值可能是表名、表的别名或者一个未查询产生临时表的标识符，如派生表、子查询或集合。

当 FROM 子句中有子查询时，如果优化器采用的物化方式，table 列是 <derivenN> 格式，表示当前查询依赖 id=N 的查询，于是先执行 id=N 的查询。

当使用 UNION 查询时，UNION RESULT 的 table 列的值为 <UNION1,2>，1和2表示参与 UNION 的 SELECT 的行 id。

具体可参考上面:select_type unino和 DERIVED的执行计划

type

这一列表示关联类型或访问类型，即MySQL决定如何查找表中的行，查找数据行记录的大概范围。依次从最优到最差分别为:

system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

一般来说，好的sql查询至少达到range级别，最好能达到ref

system

const的特例平时无法重现可以忽略

const

表示通过扫描索引扫描一行就找到了数据 const用于比较primary key 或者 unique索引。因为只需匹配一行数据，所有很快。如果将主键置于where列表中，mysql就能将该查询转换为一个const

eq_ref

表连接时被驱动表关联字段查询为主键或者唯一索引查找时

lb.id为主键索引

如果where条件中查询非驱动表为非唯一索引或者主键索引则会降为ref

ref

被驱动表关联字段查询为非唯一索索引和主键索引的普通索引时

lh.SALES_BILL_NO为普通索引

range

表示范围查询常见于between 和>, >=,<, <= 前提是字段有建立btree索引

count未建立索引执行计划

count建立索引后

index

与ALL类似只是index全表扫描扫描的是索引页而不是数据行

因为我们id做了索引所以只需要去索引页里面取出所有id数据就好了

ALL

全表扫描

possible_keys

指出MySQL可能使用哪个索引在表中找到行，查询涉及到的字段上若存在索引，则该索引将被列出，但不一定被查询使用

key

实际使用的索引，如果为NULL，则没有使用索引,如果出现possible_keys有值但是 key为null 可能是在数据少量情况下 mysql优化器认为全表扫描比走索引快,所以放弃使用索引

如果想强制 MySQL使用或忽视 possible_keys 列中的索引，在查询中使用 force index、ignore index。

key_len

表示索引中使用的字节数，查询中使用的索引的长度（最大可能长度），并非实际使用长度，理论上长度越短越好。key_len是根据表定义计算而得的，不是通过表内检索出的

1.字符串类型key_length计算规则

各个字符集长度 utf8mb4=4,utf8=3,gbk=2,latin1=1

key_len=(表字符集长度) * 列长度 + 1(null) + 2(变长列)

char(n)：n字节长度

varchar(n)：2字节存储字符串长度，如果是utf-8，则长度 3n + 2

注意：该索引列可以存储NULL值，则key_len比不可以存储NULL值时多1个字节。

比如：varchar(50)，字符集为utf8 则实际占用的key_len长度是 3 * 50 + 2 = 152，如果该列允许存储NULL，则key_len长度是153。

2.数值类型key_length计算规则

tinyint：1字节 smallint：2字节 int：4字节 bigint：8字节

3.时间类型

date：3字节 timestamp：4字节 datetime：8字节

索引最大长度是768字节，当字符串过长时，MySQL 会做一个类似左前缀索引的处理，将前半部分的字符提取出来做索引。

举例1：

id为主键索引为bigint 索引key_length=8
explain select cp1.id from cpn_coupon cp1 where cp1.id=578032073359495168
举例2:

coupon_name为varchar(64) 按照计算公式key_len=(表字符集长度) * 列长度 + 1(null) + 2(变长列) 4*64+1+2=259
explain select cp1.id from cpn_coupon cp1 where cp1.coupon_name='a'
ref

ref 列显示了在 key 列记录的索引中，表查找值所用到的列或常量，常见的有：const（常量），字段名（例：user.id）

rows

列是查询优化器估计要读取并检测的行数，注意这个不是结果集里的行数。

如果查询优化器使用全表扫描查询，rows 列代表预计的需要扫码的行数；如果查询优化器使用索引执行查询，rows 列代表预计扫描的索引记录行数。

Extra

Extra 列提供了一些额外信息。这一列在 MySQL中提供的信息有几十个，这里仅列举一些常见的重要值如下：

Using index

表示使用了覆盖索引,覆盖索引:表示索引包含了返回所有列而不回表

Using where Using index

查询的列被索引覆盖，并且 WHERE 筛选条件是索引列之一 id为主键 name为普通索引
explain select cp1.id from cpn_coupon cp1 where cp1.coupon_name='a'
NULL

查询的列未被索引覆盖，并且 WHERE 筛选条件是索引的前导列，意味着用到了索引，但是部分字段未被索引覆盖，必须通过 回表 来查询，不是纯粹地用到了索引，也不是完全没用到索引。

id主键 introduction没有索引，需要根据回表获取到对应数据
explain select cp1.id,cp1.introduction from cpn_coupon cp1
Using where

Using where的作用只是提醒我们MySQL将用where子句来过滤结果集

Using index condition

查询的列不完全被索引覆盖 where条件为二级索引需要根据二级索引存储的聚簇索引id 获得数据才能拿到introduction(回表)

id为主键 introduction没有索引 coupon_name有索引
explain select cp1.id,cp1.introduction from cpn_coupon cp1 where cp1.coupon_name='a'
Using temporary

表示mysql需要临时表转存数据常见于 group by、DISTINCT、ORDER BY使用非索引字段一般出现这种情况就需要考虑进行优化了，首先是想到用索引来优化。

表示使用了非索引字段排序

Using filesort

如果一个排序操作不能通过索引来完成，那这次排序操作就叫做filesort，这跟file没有任何关系。filesort应该叫做sort，而它的实现，就是大家熟悉的快排(一般由于排序列没有建索引导致)

有时候存在Using filesort，也未必是什么大不了的：如

select * from t_talbe order by id；只是告诉你它使用了“all rows”。

什么是回表查询如何避免回表

首先看聚簇索引和非聚簇索引构成点击跳转

例子1:

id为聚簇索引 name为非聚簇索引通过聚簇索引name查找可以找到id 无须回表查询效率高
select id,name from user where name='shenjian';　
Extra：Using index。

例子2

id为聚簇索引 name为非聚簇索引,sex为非索引，sex需要根据聚簇索引获取到对应的数据行(回表操作) 如果将name和sex升级为联合索引则无须回表
select id,name,sex from user where name='shenjian';
Extra：Using index condition。

不要使用cont(*) 避免回表使用 coun(索引列)

如何查找mysql中的慢sql

1.查看mysql是否开启mansql记录日志

show variables like 'slow_query_log';

2.慢sql记录时间

show variables like 'long_query_time';

3.设置记录mysql为打开状态

set global slow_query_log='ON';OFF为关闭

设置超过一秒的sql都将记录

set global long_query_time=1

设置记录文件

set global slow_query_log_file='/var/lib/mysql/test_1116.log';

查看记录文件

show variables like 'slow_query_log_file';

优化实践

数据表
# 重建 `staff` 表 DROP TABLE `staff`; CREATE TABLE `staff` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名', `s_name` VARCHAR(24) NOT NULL DEFAULT '' COMMENT '花名', `s_no` INT(4) NOT NULL DEFAULT 0 COMMENT '工号', `work_age` int(11) NOT NULL DEFAULT '0' COMMENT '工龄', `position` varchar(20) NOT NULL DEFAULT '' COMMENT '职位', `arrival_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入职时间', `remark` VARCHAR(500) DEFAULT NULL COMMENT '备注', # 允许 NULL PRIMARY KEY (`id`), # 主键 UNIQUE KEY idx_s_name (s_name), # 唯一索引 KEY idx_s_no (s_no), # 普通索引 KEY `idx_name_age_position` (`name`,`work_age`,`position`) USING BTREE # 联合索引 ) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='员工记录表'; # 初始化 `staff` 表数据 INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('zhangsan','zs',10,2,'manager',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('lisi','ls',11,3,'dev',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('wangwu','ww',12,8,'dev',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('zhangliu','zl',110,5,'dev',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('xiaosun','xs',111,5,'dev',NOW()); INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('donggua','dg',200,3,'dev',NOW());
全值匹配
EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan';
EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age = 2;
EXPLAIN SELECT * FROM staff where name = 'zhangsan' AND work_age = 2 AND position = 'dev';
EXPLAIN SELECT * FROM staff where position = 'dev' AND name = 'zhangsan' AND work_age = 2;
这里我们将联合索引最左name排在后面也能正常使用索引时因为mysql优化后会帮我们排在前面,在写的过程中还是要根据联合索引顺序编写，避免二次优化

最佳左前缀法则

如果索引了多列，要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。

跳过了name(全表扫描)
EXPLAIN SELECT * FROM staff WHERE work_age = 2 AND position ='dev';
跳过了name和work_age(全表扫描)
EXPLAIN SELECT * FROM staff WHERE position = 'dev';
索引列上避免做计算操作
EXPLAIN SELECT * FROM staff WHERE LEFT(name, 5) = 'zhang';
EXPLAIN SELECT * FROM staff WHERE LOWER(name) = 'zhangsan';
查询值上函数运算是没问题的
EXPLAIN SELECT * FROM staff WHERE name = LEFT('zhang',5);
其实很好理解比如你通过hashMap存储根据name快速找到对应对象,如果你要根据key做处理匹配就只能遍历keys 做完处理再比较

但是如果你正式查询条件使用函数，你只是在get之前通过函数转了一下查询值不会影响索引

范围条件右边的列无法使用索引
EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age > 2 AND position ='dev';
根据上面key_length计算规则 idx_name+age的索引长度正好为78 索引position没有用到索引

只是从 name = 'zhangsan' AND work_age > 2 条件返回的结果集中，再过滤符合 position 字段条件的数据。

尽量使用覆盖索引

1覆盖索引：简单理解，只访问建了索引的列。减少使用 SELECT * 语句查询列。避免回表

未回表查询
EXPLAIN SELECT name,work_age FROM staff WHERE name= 'zhangsan' AND work_age = 3;
回表查询

因为查询返回了非索引字段所以需要根据聚簇索引找到对应的数据行
EXPLAIN SELECT name,work_age,s_no FROM staff WHERE name= 'zhangsan' AND work_age = 3; EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age = 3;
范围条件查找能够命中索引

例子1：

若条件中范围列有普通索引和主键索引同时存在，优先使用主键索引:
EXPLAIN SELECT * FROM staff WHERE staff.s_no > 10 AND staff.id > 2;
例子2：
EXPLAIN SELECT * FROM staff WHERE staff.name != 'zl' AND staff.s_no > 1 ;
可以看到s_no没有走索引因为数据量比较小,sql优化引擎认为全表扫描比索引快,因为会回表需要查询2次

我们可以改为force index强制走索引
EXPLAIN SELECT * FROM staff force index(idx_s_no) WHERE staff.name != 'zl' AND staff.s_no > 1 ;
IS NOT NULL 无法使用索引
EXPLAIN select * from cpn_coupon c where c.coupon_name is null
EXPLAIN select * from cpn_coupon c where c.coupon_name is not null
模糊条件查询以通配符开头索引失效
EXPLAIN SELECT * from staff where name like '%zhang%';
EXPLAIN SELECT * from staff where name like '%zhang';
EXPLAIN SELECT * from staff where name like 'zhang%';
改为覆盖索引将走索引
EXPLAIN SELECT name,work_age FROM staff WHERE name LIKE '%zhang%';
避免隐式转换

未加单引号
EXPLAIN SELECT * FROM staff WHERE name = 1;
可以理解为
EXPLAIN SELECT * FROM staff WHERE CONVERT(name,int) = 1;
OR多数情况会失效

因为是or查询,所以格努work_age找索引没有满足最左前缀匹配将全表扫描
EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR work_age = 2;
优化为将走索引
EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR (name='zhangsan' and work_age = 2);
使用覆盖查询将走索引
explain SELECT name,work_age FROM staff WHERE name='zhangsan' OR work_age = 2;
EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR s_name='wangwu';
使用union改进
EXPLAIN SELECT * FROM staff WHERE name='zhangsan' union all SELECT * FROM staff WHERE s_name='wangwu';
id2 后面extra是因为唯一索引如果查询不存在的值将不会走索引参考:https://www.cnblogs.com/huahua035/p/10573930.html

注意所以再日常使用中不要使用先查询判断是否存在再插入直接插入让mysql抛出异常并捕获异常比如用户注册,但是建立了唯一索引查询的时候就要特别注意查询的地方

负向查询条件不能使用索引

负向查询条件包括：!=、<>、NOT IN、NOT EXISTS、NOT LIKE 等。
EXPLAIN SELECT * FROM staff WHERE id !=1 AND id != 2; EXPLAIN SELECT * FROM staff WHERE id NOT IN (1,2);
in则可以命中
EXPLAIN SELECT * FROM staff WHERE id IN (11,12);
排序对索引的影响

ORDER BY是经常用的语句，排序也遵循最左前缀列的原则。
EXPLAIN SELECT * FROM staff ORDER BY name,work_age;
EXPLAIN SELECT name,work_age FROM staff ORDER BY name,work_age;
覆盖索引可以命中索引

索引优化总结

1.更新非常频繁字段不宜建索引

因为字段更新台频繁，会导致B+树的频繁的变更，重建索引。所以这个过程是十分消耗数据库性能的。

2.区分度不大的字段不宜建索引

比如类似性别这类的字段，区分度不大，建立索引的意义不大。因为不能有效过滤数据，性能和全表扫描相当。另外注意一点，返回数据的比例在 30% 之外的，优化器不会选择使用索引。

3.业务中有唯一特性的字段，建议建成唯一索引

业务中如果有唯一特性的字段，即使是多个字段的组合，也尽量都建成唯一索引。尽管唯一索引会影响插入效率，但是对于查询的速度提升是非常明显的。此外，还能够提供校验机制，如果没有唯一索引，高并发场景下，可能还会产生脏数据。

但是要小心查询不存在的数据不走索引

4.多表关联时，要确保关联字段上非驱动表必须有索引
查看全文

相关阅读:
pat 1027. Colors in Mars (20)
pat 1035. Password (20)
pat 1006. Sign In and Sign Out (25)
pat 1031. Hello World for U (20)
pat 1005. Spell It Right (20)
pat 1002. A+B for Polynomials (25)
pat 1008. Elevator (20)
pat 1001. A+B Format (20)
算法分析与设计实验四密码算法
 Android通讯录管理（获取联系人、通话记录、短信消息）

原文地址：https://www.cnblogs.com/LQBlog/p/10723158.html

热门文章
点的距离
 背单词
 The XOR-longest Path
Secret Message 秘密信息
 L 语言
 Nikitosh 和异或
 The XOR Largest Pair
Phone List
似乎在梦中见过的样子
 Censoring

Copyright © 2011-2022 走看看