zoukankan      html  css  js  c++  java
  • (三)MySQL索引

    1.索引是什么


    MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。可以得到索引的本质:索引是数据结构。

    你可以简单理解为“排好序的快速查找数据结构”
    详情:

    结论:数据本身之外,数据库还维护着一个满足特定查找算法的数据结构,这些数据结构以某种方式指向数据,这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引。

    一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上我们平常所说的索引,如果没有特别指明,都是指B树(多路搜索树,并不一定是二叉树)结构组织的索引。其中聚集索引,次要索引,覆盖索引,复合索引,前缀索引,唯一索引默认都是使用B+树索引,统称索引。当然,除了B+树这种类型的索引之外,还有哈希索引(hashindex)等。

    2.索引的优势和劣势


    优势:
    类似大学图书馆建书目索引,提高数据检索的效率,降低数据的IO成本。
    通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。
    劣势:
    实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间的虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行insert,update和delete。 因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息。

    3.索引的分类


    • 单值索引
      即一个索引只包含单个列,一个表可以有多个单列索引
    • 唯一索引
      索引列的值必须唯一,但允许有空值
    • 复合索引
      即一个索引包含多个列

    4.索引结构


    • BTree索引

    • Hash索引
    • full-text全文索引
    • R-Tree索引

    5.哪些情况需要建索引


    • 1.主键自动建立唯一索引

    • 2.频繁作为查询条件的字段应该创建索引

    • 3.查询中与其它表关联的字段,外键关系建立索引

    • 4.频繁更新的字段不适合创建索引,因为每次更新不单单是更新了记录还会更新索引,加重了IO负担

    • 5.Where条件里用不到的字段不创建索引

    • 6.单键/组合索引的选择问题,who?(在高并发下倾向创建组合索引)

    • 7.查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度

    • 8.查询中统计或者分组字段

    6.哪些情况不要建索引


    • 1.表记录太少
    • 2.经常增删改的表
    • 3.注意,如果某个数据列包含许多重复的内容,为它建立索引就没有太大的实际效果

    7.性能分析


    MySQL常见瓶颈:

    • 1.CPU:CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据时候
    • 2.IO:磁盘I/O瓶颈发生在装入数据远大于内存容量的时候
    • 3.服务器硬件的性能瓶颈:top,free,iostat和vmstat来看系统的性能状态

    8.Explain


    8.1.Explain是什么(查看执行计划)

    使用Explain关键字可以模拟优化器执行SQL查询语句,从而知道Mysql是如何处理你的SQL语句。分析你的查询语句或是表结构的性能瓶颈

    8.2.能干嘛

    • 1.表的读取顺序
    • 2.数据读取操作的操作类型
    • 3.哪些索引可以使用
    • 4.哪些索引被实际使用
    • 5.表之间的引用
    • 6.每张表有多少行被优化器查询

    8.3.怎么玩

    • 1.Explain+SQL语句
    • 2.执行计划包含的信息:|id|select_type|table|type|possible_keys|key|key_len|ref|rows|Extra|

    8.4.explain各字段解释

    8.4.1.explain之id

    select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
    三种情况:

    • id相同,执行顺序由上至下

    • id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行

    • id相同不同,同时存在

    8.4.2.select_type

    有哪些:SIMPLE|PRIMARY|SUBQUERY|DERIVED|UNION|UNION RESULT
    查询的类型,主要是用于区别普通查询,联合查询,子查询等复杂查询

    • SIMPLE:简单的select查询,查询中不包含子查询或者UNION。
    • PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY。
    • SUBQUERY:在SELECT或WHERE列表中包含了子查询。
    • DERIVED:在FROM列表中包含的子查询被标记为DERIVED(衍生)MySQL会递归执行这些子查询,把结果放在临时表里。
    • UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED。
    • UNION RESULT:从UNION表获取结果的SELECT。
    8.4.3.table

    显示这一行的数据是关于哪张表的。

    8.4.4.type

    |ALL|index|range|ref|eq_ref|const,system|NULL
    访问类型排列,显示查询使用了何种类型
    从最好到最差依次是:
    system>const>eq_ref>ref>rang>index>ALL

    • system:表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计。
    • const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快。如将主键置于where列表中,MySQL就能将该查询转换为一个常量。
    • eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
    • ref:非唯一性索引扫描,返回匹配某个单独的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的所有行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
    • range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引一般就是在where语句中出现了between,<,>,in等查询这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束语另一点,不用扫描全部索引。
    • index:Full Index Scan,index与ALL区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。 (也就是说虽然all和index都是读全表,但index是从索引中读取的,而all是从硬盘中读的)
    • all:Full Table Scan,将遍历全表以找到匹配的行

    备注:一般来说,得保证查询至少达到range级别,最好能达到ref

    8.4.5.possible_keys 和 key
    • possible_keys:显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用。
    • key:实际使用的索引。如果为NULL,则没有使用索引。查询中若使用了覆盖索引,则该索引仅出现在key列表中。
    8.4.6.key_len

    表示索引中使用的字节数,可通过该列计算查询中使用的索引长度。在不损失精度性的情况下,长度越短越好key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。

    8.4.7.ref

    显示索引哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。

    8.4.8.rows

    根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。

    8.4.9.Extra

    包含不适合在其他列中显示但十分重要的额外信息

    8.4.9.1.Using filesort

    说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。
    Mysql中无法利用索引完成的排序操作称为“文件排序”

    8.4.9.2.Using temporary

    使用了临时表保存中间结果,Mysql在对查询结果排序时使用临时表。常见于排序order by 和分组查询group by。

    8.4.9.3.Using index

    表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错!

    • 如果同时出现using where,表明索引被用来执行索引键值的查找;
    • 如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
      覆盖索引(Covering Index):
      理解方式一:就是select的数据列只用从索引中就能取得,不必读取数据行,MySQL可以利用索引返回select列表中的字段,而不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖。
    8.4.9.4.using where

    表明使用了where过滤

    8.4.9.5.using join buffer

    使用了连接缓存

    8.4.9.6.impossibe where

    where子句的值总是false,不能用来获取任何元组

    8.4.9.7.select tables optimized away

    在没有group by 子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段在进行计算,查询执行计划生成的阶段即完成优化。

    8.4.9.8.distinct

    9.练习


  • 相关阅读:
    C,C++,VC++有什么区别
    RF & Microarray
    偏最小二乘法
    各种机器学习方法的优缺点
    纠错输出编码法ECOC
    遗传算法GA
    支持向量机SVM
    神经网络NN
    机器学习的基本概念
    SPI通信协议(SPI总线)学习
  • 原文地址:https://www.cnblogs.com/everyingo/p/13885542.html
Copyright © 2011-2022 走看看