zoukankan      html  css  js  c++  java
  • 查询优化

     
     
    1.查询主流程: 
    a.客户端发送一条查询给服务器
    b.服务器先检查查询缓存,如果命中了缓存,则立刻返回存储在缓存中的结果,否则进入下一阶段。
    c.服务器进行SQL解析,预处理,再由优化器生成对应的执行计划,
    d.mysql根据优化器生成的执行计划,调用存储引擎的API来执行查询。
    e.将结果返回给客户端。
     
    2.MySQL连接状态:
    对于一个MYSQL连接线程,任何时刻都有一个状态,在一个查询的周期中,状态可能会变化很多次,这些状态有:
    sleep: 线程正在等待客户端发送新的请求
    query:线程正在执行查询或者正在将结果发送给客户端
    locked:在mysql服务器层,该线程正在等待表锁。在存储引擎级别实现的锁,例如innoDB的行锁,并不会体现在线程状态中。对于myisam来说这是个比较典型的状态,但在其他没有行锁的引擎也经常会出现。
    analyzing and statistics:线程正在收集存储引擎的统计信息,并生成查询的执行计划。
    copying to tmp table [on disk]:线程正在执行查询,并且将结果集复制到一个临时表,这种状态一般要么是在做 group by 操作,要么是文件排序操作,或者是union操作。如果这个状态后面还有 on disk 标记,那表示mysql正在将一个内存临时表放到磁盘上。
    sorting result:线程正在对结果集进行排序
    sending data:这表示多种情况,线程可能在多个状态之间传送数据,或者在生成结果集,或者在客户端发送请求。
     
     3.解决查询效率低方法
    a.确认应用程序是否在检索大量的超过需要的数据,有时候是访问了太多的行,有时候是访问了太多的列 
    b.确认mysql服务器是否在分析大量超过需要的数据航行。mysql能够使用下面三种方式应用where条件,从好到坏依次是
    1.在索引中使用where条件来过滤不匹配的记录,这是在存储引擎层完成的
    2.使用索引覆盖扫描来返回记录,直接在索引中过滤不需要的记录并返回命中的结果,这是在mysql服务器层完成的,但无需再回表查询记录
    3.从数据库中返回数据,然后过滤不满足条件的记录,这也是在mysql 服务器层完成的。
     
    c如果发现查询需要扫描大量的额数据但只返回少数的行,可以如下优化
    1.使用索引覆盖扫描
    2.改变库表结构,例如使用单独的汇总表
    3.重写这个复杂的查询
     
    4.重构查询的几种方法
    a.一个复杂查询 or 多个简单查询:设计查询的时候一个需要考虑的重要问题是,是否需要将一个复杂的查询分成多个简单的查询。
    b.切分查询:有时候对于一个大查询我们需要“分而治之”,将大查询切分为小查询,每个查询功能完全一样,只完成一小部分,每次只返回一小部分查询结果。
    c分解关联查询:
        select * from tag 
           join tag_post on tag_post.tag_id = tag.id
           join post on tag_post.post_id = post.id
        where tag.tag = 'mysql'
        可以分解成下面这些查询来代替:
        > select * from tag where tag = 'mysql'
        > select * from tag_post where tag_id = 1234
        > select * from post where post_id in (123, 456, 567, 9098, 8904)    
      优势:
          让缓存的效率更高。
          将查询分解后,执行单个查询可以减少锁的竞争。
          在应用层做关联,可以更容易对数据库进行拆分,更容易做到高性能和可扩展。
          查询本身效率也可能会有所提升。
          可以减少冗余记录的查询,
          更进一步,这样做相当于在应用中实现了哈希关联,而不是使用mysql的嵌套循环关联。
     
     
    5.MYsql的一些优化类型
    重新定义关联表的顺序,命中率高的表可能被先查询
    将外链接转换为连接
    使用等价变换规则
    优化Count() MIN() MAX():
    预估并转换为常数表达式
    覆盖索引扫描
    子查询优化
    提前终止查询
    等值传播
    列表IN()的比较
    排序优化,尽可能避免排序或者对大量数据进行排序,如果要排序的数据量小于“排序缓存区”,使用内存进行快排,如果内存不够,先将数据分块,每个分块使用快排后将结果存放在磁盘上,最后将各排好序的块进行合并
    limit优化,要么在应用中限制分页的数量,要么根据索引覆盖扫描找出对应的行索引,然后在根据索引到数据库中查询具体的记录
    union优化,除非真的需要消除重复的行,否则一定要使用union all。因为如果没有all关键字,mysql会给零时表加上distinct选项,这回导致对整个零时表的数据做唯一性检查
    如果查询的两个表大小相当,那么用in和exists差别不大。 如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in:
  • 相关阅读:
    今日总结
    今日总结
    今日总结
    k8s controller
    深入k8s:Informer使用及其源码分析
    理解 K8S 的设计精髓之 List-Watch机制和Informer模块
    Unix domain socket 简介
    Linux网络编程——端口复用(多个套接字绑定同一个端口)
    DPVS Tutorial
    dpvs route RTF_KNI
  • 原文地址:https://www.cnblogs.com/wzj4858/p/7910482.html
Copyright © 2011-2022 走看看