zoukankan      html  css  js  c++  java
  • mysql查询优化~group by和order by

    一 简介:聊聊group by的分组
    二 explain体现
        extra下
       1 using tempoary
       2 using tempoary && using filesort
       3 using filesort
       4 none
    三 实现方式
      1 定义
        GROUP BY 实际上也同样会进行排序操作,而且与ORDER BY 相比,GROUP BY 主要只是多了排序之后的分组操作,所以group by同样可以利用到索引
      2 实现方式
        使用松散(Loose)索引扫描实现 GROUP BY 
       1 单一表查询
       2 Group by中只有最左前缀列,没有其他列
       3 只支持max和min聚合,而且,要聚合的列必须是group by中列所在的索引(未测试)
       4 未被group by引用的索引其他部分必须是常量(不理解)
       5 不支持前缀索引。
      eg
       -- 因为聚合函数不是max或者min
      SELECT c1, SUM(c2) FROM t1 GROUP BY c1;
      -- 因为不符合最左前缀原则
      SELECT c1, c2 FROM t1 GROUP BY c2, c3;
      -- 查询涉及到了索引的一部分,紧跟group by中的列,但是没有常量等值语句,加上 WHERE c3 = const就好了
      SELECT c1, c3 FROM t1 GROUP BY c1, c2;
      2 使用临时表实现 GROUP BY
        处理过程 通过where索引过滤 然后放置在临时表中再进行分组+排序
    四 优化
      1 尽量使用group by 的分组利用到联合索引
      2 尽量添加order by null避免filesort
    五  order by 使用场景解析

        select * from table  order by a1   当a1有索引的时候是可以利用到索引的

        select * from table where a1=1 order by b1   当a 和 b为联合索引且a为最左的时候 是可以利用到索引的

        select * from table  order by  a1 desc, b1   利用8.0的特性创建制定顺序的联合索引是可以的,其他情况下是不能利用到索引,因为联合索引只能按照一个顺序进行查找

        select * from table order by a1,b1              当a和b为联合索引时是可以利用到索引的

        select * from table  where a1 > n  order by  a1  这种情况下根据数据量的分布可能会利用到icp特性或者应用不到索引

        select * from table   where a1 = n and b1 > n order by b1  这种情况下可能会遇到ICP特性

        select * from table group a1 order by b1    这种情况下不能利用索引

        相关排序参数 sort_buffer_size 先利用这个参数内存,只有内存不够了才会在磁盘形成临时文件

    六  order by  与分页操作

          select *  from  table  where  a =  b =  order by id limit 10

         现象 通过explain 走的是ID主键  奇怪现象   asc  与 desc 相差速度很大,但是explain确是相同

         分析  通过explain分析可知,执行顺序为 先根据order by进行排序 然后再进行条件过滤 最后分页取操作. asc与desc执行速度的不同其实也可以推测. 那么就是结果集的数据都集中在正向而不是反向.那么这样desc 和asc的速度不一样就可以得知了.而limit 小结果集的加入让sql优化器更倾向于order by 索引

         解决方法:  1 order by 的排序项最好能参与到 where条件过滤中,即是联合索引的一部分  2 调大 limit 结果集(根据业务决定) 3 采用延迟join

         

  • 相关阅读:
    supervise 用来监控服务,自动启动
    tee -a /var/log/jd.log
    类的构造函数与析构函数的调用顺序
    c++之带默认形参值的函数
    zoj1001-A + B Problem
    zoj1037-Gridland
    cf499A-Watching a movie
    cf478B-Random Teams 【排列组合】
    C++版修真小说
    Python_12-线程编程
  • 原文地址:https://www.cnblogs.com/danhuangpai/p/10845483.html
Copyright © 2011-2022 走看看