zoukankan      html  css  js  c++  java
  • mysql InnoDB 索引小记

    0、索引结构

    1)、MyISAM与InnoDB索引结构比较,如下:

    2)、MyISAM的索引结构

    主键索引和二级索引结构很像,叶子存储的都是索引以及数据存储的物理地址,其他节点存储的仅仅是索引信息。其数据物理地址相连。

    3)、InnoDB的索引结构

    主键索引的每一个叶子存储的都是一行数据,而二级索引的每一个叶子存储的是二级索引以及主键索引,其他节点存储的仅仅是索引信息。

    1、索引使用原则

    1)、最左前缀匹配原则,mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)顺序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引则都可以用到,a,b,d的顺序可以任意调整。
    
    2)、=和in可以乱序,比如a = 1 and b = 2 and c = 3 建立(a,b,c)引可以任意顺序,mysql的查询优化器会帮你优化成索引可以识别的形式
    
    3)、尽量选择区分度高的列作为索引,区分度的公式是count(distinct col)/count(*),表示字段不重复的比例,比例越大我们扫描的记录数越少,唯一键的区分度是1,而一些状态、性别字段可能在大数据面前区分度就是0,那可能有人会问,这个比例有什么经验值吗?使用场景不同,这个值也很难确定,一般需要join的字段我们都要求是0.1以上,即平均1条扫描10条记录。
    
    4)、索引列不能参与计算,保持列“干净”,比如from_unixtime(create_time) = ’2016-03-24’就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成create_time = unix_timestamp(’2016-03-24’);
    
    5)、尽量的扩展索引,不要新建索引。比如表中已经有a的索引,现在要加(a,b)的索引,那么只需要修改原来的索引即可。
    
    6)、如果表记录比较少,则可以不用使用索引。

    2、使用联合索引的七种情况

    1)、全列索引
        mysql会使用索引,列顺序可以颠倒。
    
    2)、最左前缀索引
        mysql会使用索引
    
    3)、查询条件用到了索引中的精确匹配,但中间某个条件未提供
        mysql不会使用索引,但是如果把中间缺失的那个索引列补上,则可以有index优化。
        “IN”可以用于索引列。
    
    4)、查询条件未指定索引第一列
        mysql不会使用索引。
    
    5)、匹配某列的前缀字符串
        只要通配符%不出现在开头,mysql可以为此列使用索引。
    
    6)、范围查询
        范围列可以用到索引,必须是最左前缀,但范围列后面的索引则列无法用到索引。
    
    7)、查询条件列含有函数或者表达式
        mysql不会为此列使用索引。

    MySQL中的样例库中titles中

    将索引emp_no删除,之后

    当Where后面的查询条件都跟索引中列顺序一致时,

    当其顺序与索引中顺序不一致时,

    备注:这是由于MySQL的查询优化器会自动调整where条件的顺序来使用合适的索引。

    备注:以上查询,Where条件中只是使用了索引中连续的一个或几个,当没有遵循最左前缀查询时,则只能进行全表扫描!

     当联合索引中缺少某列时,且该列是可枚举的,此时可以将该列枚举一下,填坑的方式使其能够形成最左前缀。

    当联合索引遇到>,<,>=,<=等符号时,则索引停止,这里跟普通的联合索引有所不同,当不是主键联合索引时,则当第一列使用了该种符号,则不会使用索引,当第二列使用时,则第一列才会使用索引。

    如user表中的联合所有是(username,passport,loginTime),则当

    1)、select * from user where username < 'Lee Tao' and passport = '123456';时,不会使用索引;

    2)、select * from user where username = 'Lee Tao' and passport > '123456';时,则只会使用第一列username长度的索引;

     

     不能在索引列上进行计算,也不能在索引列上添加函数计算,否则也不会使用该索引。

    order by中当是联合主键时,是会使用索引,当是普通的联合索引时,若想要使用索引,则需要force index或查询的就是索引列,如:

     一般order by需要跟limit或where一起使用时才能使用索引。

    以下是普通索引的样例:

    以上根据比例,新增有限制长度的索引。

    当使用>=时,当是索引第一列时,则不会使用索引。

    备注:对于同一张表的查询,每次只会用一个索引!

    综上,存在联合索引a_b_c(a,b,c),其中假设每个列的长度分别为1,2,3,则根据where条件不同,应用最左前缀匹配原则,有:

    1)、a = 1 and b = 2 and c = 3时,使用联合索引a_b_c(1+2+3)进行等值查找;
    2)、a = 1 and b = 2时,使用联合索引a_b_c(1+2)进行查找,由于缺了c,只能使用部分索引;
    3)、a = 1 and c = 3时,使用联合索引a_b_c(1)进行查找,由于缺了b,只能使用部分索引;当b是可枚举时,可以使用填坑的方式,将其补齐,如a = 1 and b in (1,2) and c = 3时,此时使用联合索引(1 + 2 + 3);
    4)、a = 1时,使用联合索引a_b_c(1)进行查找,由于只有a,只能使用部分索引;
    5)、b = 2 或 c = 3 或 b = 2 and c = 3时,由于此时不满足最左前缀匹配,故不会使用联合索引a_b_c;
    6)、a = 1 and b = 2 and c > 3时,使用联合索引a_b_c(1 + 2),其中当索引列遇到>,<,>=,<=等符号时,则索引停止;
    7)、a > 1 and b = 2时,当该索引是普通索引时,则不会使用索引,否则会使用索引a_b_c(1)。

    备注:
    1)、建立索引根据(表中该列的不同的值的行数) / (表中的所有记录行数 )的比例,越接近1,说明其可区分度高,则可以建立索引,当接近0时,即可区分度不高时,如性别或状态什么,就不适合建立索引。
    2)、能建立联合索引的尽量建立联合索引。

    小知识:前缀索引
    前缀索引的选择
    select count(distinct column_name) / count(*) from table_name;

    select count(distinct left(column_name, prefix_length)) / count(*) from table_name;

    建立前缀索引
    alter table table_name add index(column_name(prefix_length));

    前缀索引的优缺点:有效减少了索引文件的大小,提高了索引的速度,但不能在order by 或group by 中使用,也不能作用在覆盖索引(Covering Index)。

     图说mysql查询执行流程【来自于网络】

    1)、查询缓存,判断sql语句是否完全匹配,再判断是否有权限,两个判断为假则到解析器解析语句,为真则提取数据结果返回给用户。
    2)、解析器解析。解析器先词法分析,语法分析,检查错误比如引号有没闭合等,然后生成解析树。
    3)、预处理。预处理解决解析器无法决解的语义,如检查表和列是否存在,别名是否有错,生成新的解析树。
    4)、优化器做大量的优化操作。
    5)、生成执行计划。
    6)、查询执行引擎,负责调度引擎获取相应数据
    7)、返回结果。

    参考:

    http://blog.coderland.net/mysql/2015/08/26/MySQL%E7%B4%A2%E5%BC%95%E5%AE%9E%E8%B7%B5/

    http://www.kancloud.cn/kancloud/theory-of-mysql-index/41857

     http://tech.meituan.com/mysql-index.html

    http://www.cnblogs.com/hustcat/archive/2009/10/28/1591648.html

    http://tec.5lulu.com/detail/104dan2wtey6z85a7.html

    http://www.2cto.com/database/201302/188193.html

    以上所引用的图什么大部分来自于网络!

  • 相关阅读:
    chrome webkitappearance
    图片占用内存
    javascript性能优化repaint和reflow
    vim 系统剪切板
    CSS选择符的命名(转载)
    relative 内部 margin
    中国软件企业
    dom元素排序
    shell
    tips for asm
  • 原文地址:https://www.cnblogs.com/xiaoxian1369/p/5316611.html
Copyright © 2011-2022 走看看