zoukankan      html  css  js  c++  java
  • 索引

    简介
    官方定义:索引(index)是帮助MySQL高效获取数据的数据结构
    分类
    一个索引值包含单个列,一张表可以有多个单列索引
    索引列的值必须是唯一,单允许有空
    一个索引包含多个列,时间开发中推荐使用
    哪些情况需要创建索引
    1.主键,唯一索引
    2.经常用作查询条件的字段需要创建索引
    3.经常需要排序、分组和统计的字段需要创建索引
    4.查询中与其他表关联的字段,外键关系创建索引
    哪些情况不需要创建索引
    1.表中数据少,百万级以下的数据表不需要创建索引
    2.经常增删改的表不需要创建索引
    3.数据重复且分布平均的字段不需要创建索引
    4.频繁更新的字段不合适创建索引
    5.where条件里用不到的字段不需要创建索引
    优势
    1.提高数据的检索速度,降低数据库IO成本:使用索引的意义就是缩小表中需要查询的行数,从而加快搜索的速度。
    2.降低数据排序的成本,降低CUP消耗:索引之所以查的快,是因为先将数据排好序,若该字段正好需要排序,则正好降低了排序的成本。
    劣势
    1.占用存储空间:索引实际上也就是一张表,记录了主键和索引字段,一般以索引文件的形式存储在磁盘上
    2.降低更新表的速度:表的数据发生了变化,对应索引也需要一起变更,从而降低了更新速度;否则索引指向的物理数据及可能不对,这也是索引失效的原因之一。
    3.优质索引创建难:索引的创建并非一日之功,也并非一直不变。需要频繁根据用户的行为和具体的业务逻辑创建最佳的索引。
    MySQL自身瓶颈
    MySQL自身常见的性能问题有磁盘空间不足、磁盘IO太大、服务器硬件性能低
    CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据的时候
    磁盘IO瓶颈发生在装入数据远大于内存容量的时候
    top,free,iostat 和 vmstat来查看系统的性能状态
    explain分析sql语句
    使用explain关键字可以模拟优化器执行sql查询语句,从而得知MySQL 是如何处理sql语句。
    +----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+
    | id | select_type | table | partitions | type | possible_keys | key | key_len | ref  | rows | filtered | Extra |
    +----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+
    
    id
    select查询的序列号,包含一组可以重复的数字,表示查询中执行sql语句的顺序:
    第一种:id全部相同,sql的执行顺序是由上至下
    第二种:id全部不同,sql的执行顺序是根据id大的优先执行
    第三种:id既存在相同,有存在不同的,先根据id大的优先执行,再根据相同id从上至下执行
    select_type
    select 查询的类型,主要是用于区别普通查询,联合查询,嵌套的复杂查询
    简单的select 查询,查询中不包含子查询或者union
    查询中若包含任何复杂的子查询,最外层查询则被标记为primary
    在select或where 列表中包含了子查询
    在from列表中包含的子查询被标记为derived(衍生)MySQL会递归执行这些子查询,把结果放在临时表里。
    若第二个select出现在union之后,则被标记为union,若union包含在from子句的子查询中,外层select将被标记为:derived
    从union表获取结果的select
    partitions
    表所使用的分区,如果要统计十年公司订单的金额,可以把数据分为十个区,每一年代表一个区。这样可以大大的提高查询效率。
    type
    这是一个非常重要的参数,连接类型,常见的有:all , index , range , ref , eq_ref , const , system , null 八个级别。
    性能从最优到最差的排序:system > const > eq_ref > ref > range > index > all
    full table scan)全表扫描无疑是最差,若是百万千万级数据量,全表扫描会非常慢。
    (full index scan)全索引文件扫描比all好很多,毕竟从索引树中找数据,比从全表中找数据要快。
    只检索给定范围的行,使用索引来匹配行。范围缩小了,当然比全表扫描和全索引文件扫描要快。sql语句中一般会有between,in,>,< 等查询。
    非唯一性索引扫描,本质上也是一种索引访问,返回所有匹配某个单独值的行。比如查询公司所有属于研发团队的同事,匹配的结果是多个并非唯一值。
    唯一性索引扫描,对于每个索引键,表中有一条记录与之匹配。比如查询公司的CEO,匹配的结果只可能是一条记录,
    表示通过索引一次就可以找到,const用于比较primary key 或者unique索引。因为只匹配一行数据,所以很快,若将主键至于where列表中,MySQL就能将该查询转换为一个常量。
    表只有一条记录(等于系统表),这是const类型的特列,平时不会出现,了解即可
    possible_keys
    显示查询语句可能用到的索引(一个或多个或为null),不一定被查询实际使用。仅供参考使用。
    key
    显示查询语句实际使用的索引。若为null,则表示没有使用索引。
    key_len
    显示索引中使用的字节数,可通过key_len计算查询中使用的索引长度。在不损失精确性的情况下索引长度越短越好。key_len 显示的值为索引字段的最可能长度,并非实际使用长度,即key_len是根据表定义计算而得,并不是通过表内检索出的。
    ref
    显示索引的哪一列或常量被用于查找索引列上的值。
    rows
    根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数,值越大越不好。
    extra
    说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序” 。出现这个就要立刻优化sql。
    使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和 分组查询 group by。 出现这个更要立刻优化sql。
    表示相应的select 操作中使用了覆盖索引(Covering index),避免访问了表的数据行,效果不错!如果同时出现Using where,表明索引被用来执行索引键值的查找。如果没有同时出现Using where,表示索引用来读取数据而非执行查找动作。
    也叫索引覆盖,就是select 的数据列只用从索引中就能够取得,不必读取数据行,MySQL可以利用索引返回select 列表中的字段,而不必根据索引再次读取数据文件。
    在5.6版本后加入的新特性,优化器会在索引存在的情况下,通过符合RANGE范围的条数 和 总数的比例来选择是使用索引还是进行全表遍历。
    表明使用了where 过滤
    表明使用了连接缓存
    where 语句的值总是false,不可用,不能用来获取任何元素
    优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。
    filtered
    一个百分比的值,和rows 列的值一起使用,可以估计出查询执行计划(QEP)中的前一个表的结果集,从而确定join操作的循环次数。小表驱动大表,减轻连接的次数。
    通过explain的参数介绍,我们可以得知:
    1 表的读取顺序(id)
    2 数据读取操作的操作类型(type)
    3 哪些索引被实际使用(key)
    4 表之间的引用(ref)
    5 每张表有多少行被优化器查询(rows)
  • 相关阅读:
    HDU 5912 Fraction (模拟)
    CodeForces 722C Destroying Array (并查集)
    CodeForces 722B Verse Pattern (水题)
    CodeForces 722A Broken Clock (水题)
    CodeForces 723D Lakes in Berland (dfs搜索)
    CodeForces 723C Polycarp at the Radio (题意题+暴力)
    CodeForces 723B Text Document Analysis (水题模拟)
    CodeForces 723A The New Year: Meeting Friends (水题)
    hdu 1258
    hdu 2266 dfs+1258
  • 原文地址:https://www.cnblogs.com/nubi/p/dbindex.html
Copyright © 2011-2022 走看看