zoukankan      html  css  js  c++  java
  • 如何分析Mysql慢SQL

    内容摘要:

    • 开启慢查询日志捕获慢SQL

    • 使用explain分析慢SQL

    • 使用show profile查询SQL执行细节

    • 常见的SQL语句优化

    一、开启慢查询日志捕获慢SQL

    ① 查询mysql是否开启慢日志捕获:SHOW VARIABLES LIKE '%slow_query_log%';

    如果还没开启的话,开启:SET GLOBAL slow_query_log=1;

    ②  查看慢查询的时间阙值:SHOW GLOBAL VARIABLES LIKE '%long_query_time%';

    可以根据实际情况去调整时间:SET GLOBAL long_query_time=2;

    ③ 查询多少SQL超过了慢查询时间的阙值: SHOW GLOBAL STATUS LIKE '%Slow_queries%';

    ④ 使用MySQL提供的日志分析工具mysqldumpslow,获取差慢SQL

    举例:

    --获取慢日志中最多的10个SQL
    ./mysqldumpslow -s r -t 10 /PATH/TO/慢日志文件

    --获取按照时间排序的前10条里面含有左连接的查询语句

    mysqldumpslow -s t -t 10 -g "left join" 慢日志文件

     更多用法可以使用:./mysqldumpslow --help 查看

    二、使用explain分析慢SQL

    举例:EXPLAIN SELECT a.username FROM tb_admin a LEFT JOIN tb_group p ON a.groupId = p.id WHERE a.username = 'xiaophai' LIMIT 1

    1、id
    SELECT查询的序列号,包含一组数字,表示查询中执行SELECT语句或操作表的顺序
    包含三种情况:
       ① id相同,执行顺序由上至下
       ② id不同,如果是子查询,id序号会递增,id值越大优先级越高,越先被执行
       ③ 既有相同的,又有不同的。id如果相同认为是一组,执行顺序由上至下; 在所有组中,id值越大优先级越高,越先执 行。
    2、select_type
         SIMPLE:   简单SELECT查询,查询中不包含子查询或者UNION
         PRIMARY: 查询中包含任何复杂的子部分,最外层的查询
        SUBQUERY: SELECT或WHERE中包含的子查询部分
        DERIVED: 在FROM中包含的子查询被标记为DERIVER(衍生), MySQL会递归执行这些子查询,把结果放到临时表中
        UNION: 若第二个SELECT出现UNION,则被标记为UNION, 若UNION包含在FROM子句的子查询中,外层子查询将被标记为DERIVED
        UNION RESULT: 从UNION表获取结果的SELECT
    3、table
        显示这一行数据是关于哪张表的
    4、type 
        type显示的是访问类型,是较为重要的一个指标,结果值从最好到最坏依次是:
        system>const>eq_ref>ref>fulltext>ref_or_null>index_merge>unique_subquery>index_subquery>range>index>ALL
        一般来说,得保证查询至少达到range级别,最好能达到ref。

        system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现
        const:如果通过索引依次就找到了,const用于比较主键索引或者unique索引。 因为只能匹配一行数据,所以很快。如果将主键置于where列表中,MySQL就能将该查询转换为一个常量
        eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
        ref:非唯一性索引扫描,返回匹配某个单独值的所有行。本质上也是一种索引访问,它返回所有匹配 某个单独值的行,然而它可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体
        range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引,一般就是在你的where语句中出现between、<、>、in等的查询,这种范围扫描索引比全表扫描要好,因为只需要开始于缩印的某一点,而结束于另一点,不用扫描全部索引
        index:Full Index Scan ,index与ALL的区别为index类型只遍历索引树,这通常比ALL快,因为索引文件通常比数据文件小。 (也就是说虽然ALL和index都是读全表, 但index是从索引中读取的,而ALL是从硬盘读取的)
        all:Full Table Scan,遍历全表获得匹配的行
    5、possible_keys
        显示可能应用在这张表中的索引,一个或多个。 查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
    6、key
        实际使用的索引。如果为NULL,则没有使用索引。 
        查询中若出现了覆盖索引,则该索引仅出现在key列表中。
    7、key_len
        表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精度的情况下,长度越短越好。
        key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。
    8、ref
        显示索引的哪一列被使用了,哪些列或常量被用于查找索引列上的值。
    9、rows
        根据表统计信息及索引选用情况,大致估算出找到所需记录多需要读取的行数。
    10、Extra
        包含不适合在其他列中显示但十分重要的额外信息:
        ① Using filesort: 说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”
        ② Using temporary: 使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by
        ③ Using index: 表示相应的SELECT操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错。 如果同时出现using where,表明索引被用来执行索引键值的查找; 如果没有同时出现using where,表明索引用来读取数据而非执行查找动作 覆盖索引(Covering Index): 理解方式1:SELECT的数据列只需要从索引中就能读取到,不需要读取数据行,MySQL可以利用索引返回SELECT列表中 的字段,而不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖 理解方式2:索引是高效找到行的一个方法,但是一般数据库也能使用索引找到一个列的数据,因此他不必读取整个行。 毕竟索引叶子节点存储了他们索引的数据;当能通过读取索引就可以得到想要的数据,那就不需要读取行了,一个索引 包含了(覆盖)满足查询结果的数据就叫做覆盖索引 注意: 如果要使用覆盖索引,一定要注意SELECT列表中只取出需要的列,不可SELECT *, 因为如果所有字段一起做索引会导致索引文件过大查询性能下降
        ④ impossible where: WHERE子句的值总是false,不能用来获取任何元组
        ⑤ select tables optimized away: 在没有GROUP BY子句的情况下基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作, 不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化
        ⑥ distinct: 优化distinct操作,在找到第一匹配的元祖后即停止找同样值的操作

    三、使用show profile查询SQL执行细节

    Show Profile是MySQL提供可以用来分析当前会话中语句执行的资源消耗情况,可以用于SQL的调优测量

    分析步骤
    1、查看状态:SHOW VARIABLES LIKE 'profiling';


    2、开启:set profiling=on;


    3、查看结果:show profiles;


    4、诊断SQL:show profile cpu,block io for query 上一步SQL数字号码;


          ALL:显示所有开销信息
          BLOCK IO:显示IO相关开销
          CONTEXT SWITCHES:显示上下文切换相关开销
          CPU:显示CPU相关开销
          IPC:显示发送接收相关开销
          MEMORY:显示内存相关开销
          PAGE FAULTS:显示页面错误相关开销
         SOURCE:显示和Source_function,Source_file,Source_line相关开销
         SWAPS:显示交换次数相关开销
         注意(遇到这几种情况要优化)
        converting HEAP to MyISAM: 查询结果太大,内存不够用往磁盘上搬
        Creating tmp table:创建临时表
        Copying to tmp table on disk:把内存中的临时表复制到磁盘
        locked

    四、常见的SQL语句优化

    1、尽量避免在where字句中使用or来连接条件,否则将导致放弃使用索引而进行全表扫描。

          select id from user where username='15623695987' or mobile='15623695987';

          可以这样查询:

         select id from user where username='15623695987' union all  select id from user where mobile='15623695987';

    2、正确使用like查询。

         %xx%查询会导致索引使用不上:

         select id from user where username like '%test%'

         正确使用索引:

         select id from user where username like 'test%'

    3、尽量避免在where字句中对字段进行表达式操作

       错误做法:

       select id from user where score/2 =100;

       应改为:

       select id from user where score =100*2;

    4、如果确认查询结果数量,应尽可能加上limit

       select id from user where username='test' limit 1;

    5、不用要使用隐式转换

       错误例子:

       select id from user where mobile=15689764359 limit 1;

       select username from user where id='15' limit 1;

       正确做法:

       select id from user where mobile='15689764359' limit 1;

       select username from user where id=15 limit 1;

    6、正确使用复合索引

         举例:user表,index  idx_username(username,group_id)

        能使用索引:

        select id from user where username='test' and group_id=1;

        select id from user where username='test'

        select id from user where group_id=1 and username='test'

        不能使用索引:

        select id from user where group_id=1;

       总结: 是否使用索引与idx_username(username,group_id),这两个字段的先后顺序有关

    7、如果使用了join,请尽量使用小表join大表

       

    8、正确使用exists和in

        ① in

        select `user`.id,`user`.username from `user` where `user`.id in (select `order`.user_id from `order`)

        ② exists

        select `user`.id,`user`.username from `user` where exists (select`order`.user_id from `order` where `user`.id = `order`.user_id)

        应用场景参考:如果子查询得出的结果集记录较少,主查询中的表较大且又有索引时应该用in, 反之如果外层的主查询记录较少,子查询中的表大,又有索引时使用exists

  • 相关阅读:
    H264关于RTP协议的实现
    RTSP交互命令简介及过程参数描述
    RTSP协议详解
    TCP 协议中MSS的理解
    RTSP 协议分析
    Linux下/etc/resolv.conf 配置DNS客户
    371. Sum of Two Integers
    python StringIO
    高效的两段式循环缓冲区──BipBuffer
    JavaScript Lib Interface (JavaScript系统定义的接口一览表)
  • 原文地址:https://www.cnblogs.com/linyue09/p/9869163.html
Copyright © 2011-2022 走看看