zoukankan      html  css  js  c++  java
  • MySql优化- 执行计划解读与优化(二)

    待阅

    https://mp.weixin.qq.com/s/IN2mzyOXdVWE0NQJr1egcA

    说明

    解读执行计划l对于我们日常工作中慢sql的分析和调优有很大帮助,同时在解读的过程中也能知道如何规避慢sql

    建议需要了解join匹配原理的知识:https://www.cnblogs.com/LQBlog/p/10711743.html

    查看sql优化器优化后的sql

    EXPLAIN EXTENDED select * from( select * from( select cn.`id` from `cpn_coupon` cn
    where cn.`create_timestamp` >='2019-12-27'))tab2
    
    SHOW WARNINGS 

    mysql执行计划表结构

    各个字段详解

    测试表结构说明

    sl_sales_bill_copy1 订单抬头表

    sl_sales_bill_copy1订单行项目表

    order_status 订单状态变动表

    id

    执行顺序 值越大的优先执行 如果相同则根据从上到下的顺序来确定 如果为null则最后执行

    #查出订单状态存在1010的订单的所有行项目信息
    EXPLAIN select * from sl_sales_bill_copy1 lb join sl_sales_bill_head_copy1 lh on lh.SALES_BILL_NO = lb.SALES_BILL_NO where lb.SALES_BILL_NO in(select ls.SALES_BILL_NO from order_status ls where ls.status_code=1010)

    先执行id为2查询 将查询结果保存为临时表,再执行id为1的 从上到下,先将lb为驱动表关联查询lh得出结果 subquery2临时表 然后作为临时表去非驱动表ls查询数据

    select_type

    用途:查询的类型,主要是用于区分普通查询、联合查询、子查询等复杂的查询

    1、SIMPLE:简单的select查询,查询中不包含子查询或者union 
    2、PRIMARY:查询中包含任何复杂的子部分,最外层查询则被标记为primary 
    3、SUBQUERY:被驱动的SELECT子查询(子查询位于FROM子句 where)
    4、DEPENDENT SUBQUERY 子查询依赖外部查询,慎用
    5、DERIVED:在from列表中包含的子查询被标记为derived(衍生),mysql或递归执行这些子查询,把结果放在临时表里
    6、MATERIALIZED 物化子查询,子查询来自视图
    7、UNION:在 UNION 查询语句中的第二个和紧随其后的 SELECT8、UNION RESULT:组中union结果的临时表 9、DEPENDENT SUBQUERY 子查询依赖外部查询(慎用)
    10、DEPENDENT UNION 子查询中包含union

    SIMPLE

    explain select * from cpn_coupon where id=1

    SUBQUERY

    先通过子查询得出id 再根据id值去查询

    EXPLAIN select * from cpn_coupon c where c.id =(select max(cn.coupon_id) from `cpn_coupon_code` cn
    where cn.`create_timestamp` >='2019-12-27')

    DEPENDENT SUBQUERY

    慎用子查询依赖外部查询,会先根据外部查询得出一个临时表 再根据临时表 去触发子查询  因为p表没有查询条件 每条数据都会触发一次o表查询  现在数据 566条  相当于触发了566 t2 select 数据量大就更夸张(就算t2走了索引页会导致性能问题) 建议改成select join group by  可以理解为p表查询结果为临时表。在for循环遍历每一条数据 查询o表

    可以理解为

    var items=select * from   prm_page_promotion
    
    
    for(var item in items){
    
      select * from prm_page_promotion o where o.parent_id=item.getId();
    
    }
    explain select * from prm_page_promotion p
    where exists(select p.id from prm_page_promotion o where p.id=o.parent_id)

    DERIVED

    子查询位于form处 先通过create_timestamp查询结果到临时表  再根据临时表id查询

    EXPLAIN select * from( select cn.`id` from `cpn_coupon` cn
    where cn.`create_timestamp` >='2019-12-27')tab2 where tab2.id=1

    MATERIALIZED

    --创建视图
    create view v1 as select cn.coupon_id from `cpn_coupon_code` cn
    where cn.`create_timestamp` >='2019-12-27'
    --使用视图为子查询
    EXPLAIN select * from cpn_coupon c where c.id in(select v1.coupon_id from v1)

    UNION/UNOIN_RESULT

    cp2为union表 可以看出是先执行cpu2再执行cp2 primary为最外层,然后汇聚成UNION RESULT 结果

    explain select * from cpn_coupon where id=578032073359495168
    union all
    select * from cpn_coupon where id=580952931153494016

    DEPENDENT UNION

    explain select * from cpn_coupon cp where cp.id  in(select cp1.id from cpn_coupon  cp1 where cp1.id=578032073359495168
    union all
    select cp2.id from cpn_coupon cp2 where cp2.id=580952931153494016)

    cp2 cp1 查询结果为unioReuslt再通过cp表子查询union结果集

    table 

    table 列表示 EXPLAIN 的单独行的唯一标识符。这个值可能是表名、表的别名或者一个未查询产生临时表的标识符,如派生表、子查询或集合。

    当 FROM 子句中有子查询时,如果优化器采用的物化方式,table 列是 <derivenN> 格式,表示当前查询依赖 id=N 的查询,于是先执行 id=N 的查询。

    当使用 UNION 查询时,UNION RESULT 的 table 列的值为 <UNION1,2>,1和2表示参与 UNION 的 SELECT 的行 id。

    具体可参考 上面:select_type unino和 DERIVED的执行计划

    type

    这一列表示关联类型或访问类型,即MySQL决定如何查找表中的行,查找数据行记录的大概范围。依次从最优到最差分别为:

    system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

    一般来说,好的sql查询至少达到range级别,最好能达到ref

    system

    const的特例平时无法重现 可以忽略 

    const

    表示通过扫描索引 扫描一行就找到了数据 const用于比较primary key 或者 unique索引。因为只需匹配一行数据,所有很快。如果将主键置于where列表中,mysql就能将该查询转换为一个const 

    eq_ref

    表连接时 被驱动表关联字段查询为主键或者唯一索引查找时

    lb.id为主键索引

    如果where条件中查询非驱动表为非唯一索引或者主键索引则会降为ref

    ref

    被驱动表关联字段查询为非唯一索索引和主键索引的普通索引时

    lh.SALES_BILL_NO为普通索引

    range

    表示范围查询 常见于between 和>, >=,<, <= 前提是字段有建立btree索引

     count未建立索引执行计划

    count建立索引后

    index

    与ALL类似 只是index全表扫描扫描的是索引页而不是数据行

    因为我们id做了索引 所以只需要去索引页里面取出所有id数据就好了

    ALL

    全表扫描

    possible_keys

    指出MySQL可能使用哪个索引在表中找到行,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询使用

    key

    实际使用的索引,如果为NULL,则没有使用索引,如果出现possible_keys有值但是 key为null 可能是在数据少量情况下 mysql优化器认为全表扫描比走索引快,所以放弃使用索引

    如果想强制 MySQL使用或忽视 possible_keys 列中的索引,在查询中使用 force indexignore index

    key_len

    表示索引中使用的字节数,查询中使用的索引的长度(最大可能长度),并非实际使用长度,理论上长度越短越好。key_len是根据表定义计算而得的,不是通过表内检索出的

    1.字符串类型key_length计算规则

    各个字符集长度 utf8mb4=4,utf8=3,gbk=2,latin1=1

    key_len=(表字符集长度) * 列长度 + 1(null) + 2(变长列)

    char(n):n字节长度

    varchar(n):2字节存储字符串长度,如果是utf-8,则长度 3n + 2

    注意:该索引列可以存储NULL值,则key_len比不可以存储NULL值时多1个字节。

    比如:varchar(50),字符集为utf8 则实际占用的key_len长度是 3 * 50 + 2 = 152,如果该列允许存储NULL,则key_len长度是153。

    2.数值类型key_length计算规则

    tinyint:1字节 smallint:2字节 int:4字节 bigint:8字节

    3.时间类型

    date:3字节 timestamp:4字节 datetime:8字节

    索引最大长度是768字节,当字符串过长时,MySQL 会做一个类似左前缀索引的处理,将前半部分的字符提取出来做索引。

    举例1:

    id为主键索引 为bigint 索引key_length=8

    explain select cp1.id from cpn_coupon  cp1 where cp1.id=578032073359495168

    举例2:

    coupon_name为varchar(64) 按照计算公式key_len=(表字符集长度) * 列长度 + 1(null) + 2(变长列)  4*64+1+2=259

    explain select cp1.id from cpn_coupon  cp1 where cp1.coupon_name='a'

    ref

    ref 列显示了在 key 列记录的索引中,表查找值所用到的列或常量,常见的有:const(常量),字段名(例:user.id

    rows

    列是查询优化器估计要读取并检测的行数,注意这个不是结果集里的行数。

    如果查询优化器使用全表扫描查询,rows 列代表预计的需要扫码的行数;如果查询优化器使用索引执行查询,rows 列代表预计扫描的索引记录行数。

    Extra

    Extra 列提供了一些额外信息。这一列在 MySQL中提供的信息有几十个,这里仅列举一些常见的重要值如下:

    Using index 

    表示使用了覆盖索引,覆盖索引:表示索引包含了返回所有列 而不回表

    Using where Using index 

    查询的列被索引覆盖,并且 WHERE 筛选条件是索引列之一 id为主键  name为普通索引

    explain select cp1.id from cpn_coupon  cp1 where cp1.coupon_name='a'

    NULL

    查询的列未被索引覆盖,并且 WHERE 筛选条件是索引的前导列,意味着用到了索引,但是部分字段未被索引覆盖,必须通过 回表 来查询,不是纯粹地用到了索引,也不是完全没用到索引。

    id主键 introduction没有索引,需要根据回表获取到对应数据

    explain select cp1.id,cp1.introduction from cpn_coupon  cp1  

    Using where

    Using where的作用只是提醒我们MySQL将用where子句来过滤结果集

    Using index condition

    查询的列不完全被索引覆盖 where条件为二级索引 需要根据二级索引存储的聚簇索引id 获得数据才能拿到introduction(回表)

    id为主键 introduction没有索引 coupon_name有索引

    explain select cp1.id,cp1.introduction from cpn_coupon  cp1 where cp1.coupon_name='a'

    Using temporary

    表示mysql需要临时表转存数据 常见于 group by、DISTINCT、ORDER BY使用非索引字段  一般出现这种情况就需要考虑进行优化了,首先是想到用索引来优化。

    表示使用了非索引字段排序

    Using filesort

    如果一个排序操作不能通过索引来完成,那这次排序操作就叫做filesort,这跟file没有任何关系。filesort应该叫做sort,而它的实现,就是大家熟悉的快排(一般由于 排序列没有建索引导致)

    有时候存在Using filesort,也未必是什么大不了的:如

     select * from t_talbe order by id;只是告诉你它使用了“all rows”。

    什么是回表查询如何避免回表

    首先看聚簇索引和非聚簇索引构成点击跳转

    例子1:

    id为聚簇索引 name为非聚簇索引 通过聚簇索引name查找可以找到id 无须回表查询效率高

    select id,name from user where name='shenjian'; 

    Extra:Using index。

    例子2

    id为聚簇索引 name为非聚簇索引,sex为非索引,sex需要根据聚簇索引获取到对应的数据行(回表操作) 如果将name和sex升级为联合索引则无须回表

    select id,name,sex from user where name='shenjian';

    Extra:Using index condition

    不要使用cont(*) 避免回表 使用 coun(索引列)

     

    如何查找mysql中的慢sql

    1.查看mysql是否开启mansql记录日志

    show variables like 'slow_query_log';

    2.慢sql记录时间

    show variables like 'long_query_time';

    3.设置记录mysql为打开状态

    set global slow_query_log='ON';OFF为关闭

    设置超过一秒的sql都将记录

    set global long_query_time=1

    设置记录文件

    set global slow_query_log_file='/var/lib/mysql/test_1116.log';

    查看记录文件

    show variables like 'slow_query_log_file';

    优化实践 

    数据表

    # 重建 `staff` 表
    DROP TABLE `staff`;
    CREATE TABLE `staff` (
      `id` int(11) NOT NULL AUTO_INCREMENT,
      `name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名',
      `s_name` VARCHAR(24) NOT NULL DEFAULT '' COMMENT  '花名',
      `s_no` INT(4) NOT NULL DEFAULT 0 COMMENT  '工号',
      `work_age` int(11) NOT NULL DEFAULT '0' COMMENT '工龄',
      `position` varchar(20) NOT NULL DEFAULT '' COMMENT '职位',
      `arrival_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入职时间',
      `remark` VARCHAR(500) DEFAULT NULL COMMENT '备注', # 允许 NULL
      PRIMARY KEY (`id`), # 主键
      UNIQUE KEY idx_s_name (s_name), # 唯一索引
      KEY idx_s_no (s_no), # 普通索引
      KEY `idx_name_age_position` (`name`,`work_age`,`position`) USING BTREE # 联合索引
    ) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='员工记录表';
    # 初始化 `staff` 表数据
    INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('zhangsan','zs',10,2,'manager',NOW());
    INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('lisi','ls',11,3,'dev',NOW());
    INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('wangwu','ww',12,8,'dev',NOW());
    INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('zhangliu','zl',110,5,'dev',NOW());
    INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('xiaosun','xs',111,5,'dev',NOW());
    INSERT INTO staff(name,s_name,s_no,work_age,position,arrival_time) VALUES('donggua','dg',200,3,'dev',NOW());

    全值匹配

    EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan';

    EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age = 2;

    EXPLAIN SELECT * FROM staff where name = 'zhangsan' AND work_age = 2 AND position = 'dev';

    EXPLAIN SELECT * FROM staff where position = 'dev' AND name = 'zhangsan' AND work_age = 2;

    这里我们将联合索引最左name排在后面 也能正常使用索引时因为mysql优化后会帮我们排在前面,在写的过程中 还是要根据联合索引顺序编写,避免二次优化

    最佳左前缀法则

    如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。

    跳过了name(全表扫描)

    EXPLAIN SELECT * FROM staff WHERE work_age = 2 AND position ='dev';

    跳过了name和work_age(全表扫描)

    EXPLAIN SELECT * FROM staff WHERE position = 'dev';

    索引列上避免做计算操作

    EXPLAIN SELECT * FROM staff WHERE LEFT(name, 5) = 'zhang';
    EXPLAIN SELECT * FROM staff WHERE LOWER(name) = 'zhangsan';

     查询值上函数运算是没问题的 

    EXPLAIN SELECT * FROM staff WHERE name = LEFT('zhang',5);

    其实很好理解比如你通过hashMap存储根据name快速找到对应对象,如果你要根据key做处理匹配 就只能遍历keys 做完处理再比较

    但是如果你正式查询条件使用函数,你只是在get之前 通过函数转了一下查询值 不会影响索引

    范围条件右边的列无法使用索引

    EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age > 2 AND position ='dev';

     根据上面key_length计算规则  idx_name+age的索引长度 正好为78 索引position没有用到索引

    只是从 name = 'zhangsan' AND work_age > 2 条件返回的结果集中,再过滤符合 position 字段条件的数据。

    尽量使用覆盖索引

    1覆盖索引:简单理解,只访问建了索引的列。减少使用 SELECT * 语句查询列。 避免回表

    未回表查询

    EXPLAIN SELECT name,work_age FROM staff WHERE name= 'zhangsan' AND work_age = 3;

     回表查询

    因为查询 返回了非索引字段 所以需要根据聚簇索引找到对应的数据行

    EXPLAIN SELECT name,work_age,s_no FROM staff WHERE name= 'zhangsan' AND work_age = 3;
    EXPLAIN SELECT * FROM staff WHERE name= 'zhangsan' AND work_age = 3;

    范围条件查找能够命中索引

    例子1:

    若条件中范围列有普通索引和主键索引同时存在, 优先使用主键索引:

    EXPLAIN SELECT * FROM staff WHERE staff.s_no > 10 AND staff.id > 2;

    例子2: 

    EXPLAIN SELECT * FROM staff  WHERE staff.name != 'zl' AND staff.s_no > 1 ;

    可以看到s_no没有走 索引  因为数据量比较小,sql优化引擎认为全表扫描比索引快,因为会回表 需要查询2次

    我们可以改为force index强制走索引

    EXPLAIN SELECT * FROM staff force index(idx_s_no) WHERE staff.name != 'zl' AND staff.s_no > 1 ;

    IS NOT NULL 无法使用索引

    EXPLAIN select * from cpn_coupon c
    where c.coupon_name is null

    EXPLAIN select * from cpn_coupon c
    where c.coupon_name is not null

    模糊条件查询以通配符开头索引失效

    EXPLAIN SELECT * from staff where name like '%zhang%';
    EXPLAIN SELECT * from staff where name like '%zhang';

    EXPLAIN SELECT * from staff where name like 'zhang%';

     改为覆盖索引将走索引

    EXPLAIN SELECT name,work_age FROM staff WHERE name LIKE '%zhang%';

    避免隐式转换

    未加单引号

    EXPLAIN SELECT * FROM staff WHERE name = 1

    可以理解为

    EXPLAIN SELECT * FROM staff WHERE CONVERT(name,int) = 1;

    OR多数情况会失效 

    因为是or查询,所以格努work_age找索引 没有满足最左前缀匹配将全表扫描

    EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR work_age = 2;

    优化为将走索引

    EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR (name='zhangsan' and work_age = 2);

    使用覆盖查询将走索引

    explain SELECT name,work_age FROM staff WHERE name='zhangsan' OR work_age = 2;

    EXPLAIN SELECT * FROM staff WHERE name='zhangsan' OR s_name='wangwu';

     使用union改进

    EXPLAIN SELECT * FROM staff WHERE name='zhangsan' 
    union all
     SELECT * FROM staff WHERE s_name='wangwu';

    id2 后面extra是因为 唯一索引如果查询不存在的值将不会走索引 参考:https://www.cnblogs.com/huahua035/p/10573930.html

    注意所以再日常使用中不要使用 先查询判断是否存在 再插入 直接插入 让mysql抛出异常 并捕获异常比如用户注册,但是建立了唯一索引查询的时候就要特别注意 查询的地方 

    负向查询条件不能使用索引

    负向查询条件包括:!=、<>、NOT IN、NOT EXISTS、NOT LIKE 等。

    EXPLAIN SELECT * FROM staff WHERE id !=1 AND id != 2; 
    EXPLAIN SELECT * FROM staff WHERE id NOT IN (1,2);

     in则可以命中

    EXPLAIN SELECT * FROM staff WHERE id IN (11,12);

    排序对索引的影响

    ORDER BY是经常用的语句,排序也遵循最左前缀列的原则。

    EXPLAIN SELECT * FROM staff ORDER BY name,work_age;

    EXPLAIN SELECT name,work_age FROM staff ORDER BY name,work_age;

     覆盖索引可以命中索引

    索引优化总结

    1.更新非常频繁字段不宜建索引

    因为字段更新台频繁,会导致B+树的频繁的变更,重建索引。所以这个过程是十分消耗数据库性能的。

    2.区分度不大的字段不宜建索引

    比如类似性别这类的字段,区分度不大,建立索引的意义不大。因为不能有效过滤数据,性能和全表扫描相当。另外注意一点,返回数据的比例在 30% 之外的,优化器不会选择使用索引。

    3.业务中有唯一特性的字段,建议建成唯一索引

    业务中如果有唯一特性的字段,即使是多个字段的组合,也尽量都建成唯一索引。尽管唯一索引会影响插入效率,但是对于查询的速度提升是非常明显的。此外,还能够提供校验机制,如果没有唯一索引,高并发场景下,可能还会产生脏数据。

    但是要小心 查询不存在的数据不走索引

    4.多表关联时,要确保关联字段上非驱动表必须有索引

  • 相关阅读:
    电脑端与iPad 端如何共享ChemDraw结构
    用几何画板绘制带根号坐标点的方法
    几何画板使用方法
    如何在ChemDraw中缩短双键长度
    如何在ChemDraw中打出符号π
    怎么用几何画板制作图形平移和旋转
    怎么用几何画板制作三维波纹
    如何在ChemDraw中输入℃温度符号
    怎么用ChemDraw加反应条件
    MathType中输入不了汉字如何处理
  • 原文地址:https://www.cnblogs.com/LQBlog/p/10723158.html
Copyright © 2011-2022 走看看