zoukankan      html  css  js  c++  java
  • mysql 索引优化

    一、索引的基本语法

    1.创建索引
    
    CREATE INDEX index_name ON table_name(column_name,column_name)
    如:CREATE INDEX box_id ON iodn_device_port(box_id)
    
    2.删除索引
    
    drop index index_name on table_name ;
    alter table table_name drop index index_name ;
    alter table table_name drop primary key ;
    如:drop index box_id on iodn_device_port ;
    
    3.查询某张表都是用了那些索引
    
    SHOW INDEX FROM iodn_device_port
    
    4.查看索引的执行计划
    explain  select * from iodn_device_port where box_id=7080

     二、索引的五中类型

    1.单列索引 
    也叫普通索引
    CREATE INDEX account_Index ON `award`(`account`);
    
    2.唯一索引
    与普通索引类似,但是不同的是唯一索引要求所有的类的值是唯一的,这一点和主键索引一样.但是他允许有空值
    CREATE UNIQUE INDEX IndexName ON `TableName`(`字段名`(length)); 或者 ALTER TABLE TableName ADD UNIQUE (column_list) 
    
    3.主键索引
    
    不允许有空值,(在B+TREE中的InnoDB引擎中,主键索引起到了至关重要的地位)
    
    主键索引建立的规则是 int优于varchar,一般在建表的时候创建,最好是与表的其他字段不相关的列或者是业务不相关的列.一般会设为 int 而且是 AUTO_INCREMENT自增类型的
    
    4.组合索引
    
    一个表中含有多个单列索引不代表是组合索引,通俗一点讲 组合索引是:包含多个字段但是只有索引名称
    
    其sql格式是 CREATE INDEX IndexName On `TableName`(`字段名`(length),`字段名`(length),...);
    
     CREATE INDEX nickname_account_createdTime_Index ON `award`(`nickname`, `account`, `created_time`);
    
    5.全文索引
    
    文本字段上(text)如果建立的是普通索引,那么只有对文本的字段内容前面的字符进行索引,其字符大小根据索引建立索引时申明的大小来规定.
    
    如果文本中出现多个一样的字符,而且需要查找的话,那么其条件只能是 where column lick '%xxxx%' 这样做会让索引失效
    
    .这个时候全文索引就祈祷了作用了
    
    ALTER TABLE tablename ADD FULLTEXT(column1, column2)

    一、explain  执行计划 解释

    id   表的读取顺序(id)

    select 查询的序列号,包含一组可以重复的数字,表示查询中执行sql语句的顺序。一般有三种情况:
    第一种:id全部相同,sql的执行顺序是由上至下;
    第二种:id全部不同,sql的执行顺序是根据id大的优先执行;
    第三种:id既存在相同,又存在不同的。先根据id大的优先执行,再根据相同id从上至下的执行。

    select_type

    select 查询的类型,主要是用于区别普通查询,联合查询,嵌套的复杂查询
    simple:简单的select 查询,查询中不包含子查询或者union
    primary:查询中若包含任何复杂的子查询,最外层查询则被标记为primary
    subquery:在select或where 列表中包含了子查询
    derived:在from列表中包含的子查询被标记为derived(衍生)MySQL会递归执行这些子查询,把结果放在临时表里。
    union:若第二个select出现在union之后,则被标记为union,若union包含在from子句的子查询中,外层select将被标记为:derived
    union result:从union表获取结果的select

    partitions

    表所使用的分区,如果要统计十年公司订单的金额,可以把数据分为十个区,每一年代表一个区。这样可以大大的提高查询效率。

    type    数据读取操作的操作类型(type)

    这是一个非常重要的参数,连接类型,常见的有:all , index , range , ref , eq_ref , const , system , null 八个级别。
    性能从最优到最差的排序:system > const > eq_ref > ref > range ~index_merge> index > all
    对java程序员来说,若保证查询至少达到range级别或者最好能达到ref则算是一个优秀而又负责的程序员。
    all:(full table scan)全表扫描无疑是最差,若是百万千万级数据量,全表扫描会非常慢。
    index:(full index scan)全索引文件扫描比all好很多,毕竟从索引树中找数据,比从全表中找数据要快。
    range:只检索给定范围的行,使用索引来匹配行。范围缩小了,当然比全表扫描和全索引文件扫描要快。sql语句中一般会有between,in,>,< 等查询。
    ref:非唯一性索引扫描,本质上也是一种索引访问,返回所有匹配某个单独值的行。比如查询公司所有属于研发团队的同事,匹配的结果是多个并非唯一值。
    eq_ref:唯一性索引扫描,对于每个索引键,表中有一条记录与之匹配。比如查询公司的CEO,匹配的结果只可能是一条记录,
    const:表示通过索引一次就可以找到,const用于比较primary key 或者unique索引。因为只匹配一行数据,所以很快,若将主键至于where列表中,MySQL就能将该查询转换为一个常量。
    system:表只有一条记录(等于系统表),这是const类型的特列,平时不会出现,了解即可

    possible_keys

    显示查询语句可能用到的索引(一个或多个或为null),不一定被查询实际使用。仅供参考使用。

    key  哪些索引被实际使用(key)

    显示查询语句实际使用的索引。若为null,则表示没有使用索引。

    key_len

    显示索引中使用的字节数,可通过key_len计算查询中使用的索引长度。在不损失精确性的情况下索引长度越短越好。key_len 显示的值为索引字段的最可能长度,并非实际使用长度,即key_len是根据表定义计算而得,并不是通过表内检索出的。

    ref  表之间的引用(ref)

    显示索引的哪一列或常量被用于查找索引列上的值。

    rows  每张表有多少行被优化器查询(rows)

    根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数,值越大越不好。

    extra

    Using filesort: 说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序” 。出现这个就要立刻优化sql。
    Using temporary: 使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和 分组查询 group by。 出现这个更要立刻优化sql。
    Using index: 表示相应的select 操作中使用了覆盖索引(Covering index),避免访问了表的数据行,效果不错!如果同时出现Using where,表明索引被用来执行索引键值的查找。如果没有同时出现Using where,表示索引用来读取数据而非执行查找动作。
    覆盖索引(Covering Index) :也叫索引覆盖,就是select 的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select 列表中的字段,而不必根据索引再次读取数据文件。
    Using index condition: 在5.6版本后加入的新特性,优化器会在索引存在的情况下,通过符合RANGE范围的条数 和 总数的比例来选择是使用索引还是进行全表遍历。
    Using where: 表明使用了where 过滤
    Using join buffer: 表明使用了连接缓存
    impossible wherewhere 语句的值总是false,不可用,不能用来获取任何元素
    distinct: 优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。

    filtered

    一个百分比的值,和rows 列的值一起使用,可以估计出查询执行计划(QEP)中的前一个表的结果集,从而确定join操作的循环次数。小表驱动大表,减轻连接的次数。

    二、索引优化建议

     1.导致索引失效的可能情况 

    1.使用到了not in  != 等条件查询
    2.使用like %key  通配符开头的模糊查询

          两边均有%时和左边有%时,索引会失效,而%在右边时,索引可用。

          解决like'%字符串%'时索引不被使用的方法:添加覆盖索引

      覆盖索引:通过索引直接找到了数据,而不必去遍历行就叫覆盖索引

    2. 索引命名要规范,主键索引名为 pk_ 字段名;唯一索引名为 uk _字段名 ;普通索引名则为 idx _字段名。(SQL规范优雅)

    三、索引技术名词解释

    1.覆盖索引
        通俗来说就是,通过索引就能找到值,而不必要去回表,或通过主键再去找对应的值,减少了io的次数,提高了查询效率。
    
    2.回表
        通过辅助键索引查找时,辅助键索引叶子节点只存储了主键的值,而没有对应的行记录,所以还要再去通过主键在主键索引树里面找到对应的行记录,效率相对更低。
    
    3.索引下推
        索引下推是对于组合索引来说,组合索引有最左匹配原则,也就是先匹配左边第一个索引,在mysql 5.6之前,mysql 未实现索引下推,它的执行过程是先在索引树里按照第一个索引键找到具体的值,这往往需要回表多次,然后将多行记录值交给mysql服务器再去按照第二个条件执行过滤,而 5.6之后,所谓索引下推就是在索引的内部就直接判断第二个条件是否满足,这样就只需要回表一次。
    
    4.谓词下推
        一般是对于连接查询来说的,原则是早做选择,通过where 下过滤一部分,然后再连接表,这就是所谓的谓词下推。

    总结

    1 索引是排好序且快速查找的数据结构。其目的是为了提高查询的效率。
    2 创建索引后,查询数据变快,但更新数据变慢。
    3 性能下降的原因很可能是索引失效导致。
    4 索引创建的原则,经常查询的字段适合创建索引,频繁需要更新的数据不适合创建索引。
    5 索引字段频繁更新,或者表数据物理删除容易造成索引失效。
    6 擅用 explain 分析sql语句
    7 除了优化sql语句外,还可以优化表的设计。如尽量做成单表查询,减少表之间的关联。设计归档表等。

    到这里,MySQL的索引优化分析就结束了,有什么不对的地方,大家可以提出来。如果觉得不错可以点一下推荐。



  • 相关阅读:
    requests
    urllib
    爬虫初入
    Django之admin
    Django之FileField字段
    边学边练之博客园----登录验证
    边学边练之博客园----设计表
    Django之中间件
    计算机基础
    win—命令行窗口一层一层的打开文件
  • 原文地址:https://www.cnblogs.com/lufei33180/p/14241840.html
Copyright © 2011-2022 走看看