zoukankan      html  css  js  c++  java
  • InnoDB引擎索引大观

    InnoDB是mysql处理OLTP(online transcation process)类型业务的存储引擎。为了加快数据查询速度。InnoDB引擎提供了丰富的索引实现。

    1. 索引的分类


    索引能够分为聚集索引和非聚集索引,聚簇索引(cluster) index)是指索引中键值的逻辑顺序和相应行的物理顺序一致。简单说就是索引中键值存储的是相应的行数据。非聚簇索引中索引的键值中存储的仅仅是相应行的引用。并不代表行实际的存储。

    索引是在数据库的存储引擎中实现。不同的存储引擎索引的实现不一样。

    举例来说。你翻到新华字典的汉字“爬”那一页就是P开头的部分。这就是物理存储顺序(聚簇索引)。而不用你到文件夹,找到汉字“爬”所在的页码,然后依据页码找到这个字(非聚簇索引)[1]。

    依据实现方式的不同。索引分为B+树索引、哈希索引、全文索引和空间树索引。B/B+树是实现索引经常使用的数据结构。它是一个平衡的多叉查找树,从根节点到每个叶子节点的距离相等且树的高度可控,因此能够大幅度的降低查找次数。

    哈希是一种非常快的查找方法,普通情况下查找的时间复杂度为O(1),可是非常多的数据库系统如SQL Server、Oracle并不支持哈希索引。MySQL的Memory存储引擎默认的存储类型为哈希。

    而在InnoDB数据库引擎实现了一种自适应性哈希索引。InnoDB引擎会监控对索引表上索引的查找,假设观察到建立哈希索引能够带来速度的有效提升,则建立哈希索引。

    自适应性索引通过缓冲池的B+树构建而来,因此建立速度非常快。全文索引是使用相似倒排索引的结构构造而成,MySQL中能够在建表时指定FULLTEXT到nchar,vchar,text类型性的字段上建立全文索引。


    2. MyISAM和InnoDB索引实现的不同


    聚簇索引保证keyword的值相近的元组存储的物理位置也同样(所以字符串类型不宜建立聚簇索引。特别是随机字符串。会使得系统进行大量的移动操作),且一个表仅仅能有一个聚簇索引。由于由存储引擎实现索引。所以。并非全部的引擎都支持聚簇索引。眼下,仅仅有solidDB和InnoDB支持。

    叶子页面包括完整的元组,而内节点页面仅包括索引的列(索引的列为整型)。一些DBMS同意用户指定聚簇索引,可是MySQL的存储引擎到眼下为止都不支持。InnoDB对主键建立聚簇索引。假设你不指定主键,InnoDB会用一个具有唯一且非空值的索引来取代。假设不存在这种索引。InnoDB会定义一个隐藏的主键,然后对其建立聚簇索引。一般来说,DBMS都会以聚簇索引的形式来存储实际的数据。它是其他二级索引的基础。

    MyISAM仅仅支持非聚簇的索引,因此在谈主键索引和辅助索引之间的差别的时候不能简单的一概而论,比較合适的说法应该是这种:

    索引的功能是在存储引擎上存在的。不同的存储引擎实现主键索引和辅助索引不同。在MyISAM存储引擎中,主键索引和非逐渐索引都是非聚簇索引,叶子节点都是存储相应数据行的引用。而在InnoDB中,主键索引是聚集索引,B+树的叶子节点存储是行数据。辅助索引是非聚集索引。索引B+树叶子节点存储的相应行的主键。通过主键索引能够找到相应的行。
    另外InnoDB支持自适应哈希索引,MyISAM支持全文索引。MySQL 5.6以后的InnoDB存储引擎也開始支持全文索引。

    3. 使用索引的几个原则

    索引能够降低查询的次数,可是一个错误的观点是在每个可能的属性上都建索引。索引的建立和调整过程会消耗资源。与索引相应的全表查找。假设表中数据的数量非常少建索引事实上是不合适的。那什么情况下使用索引才更有效呢?

    B+树索引使用的两个原则:
    1. 高选择性
    2. 结果集的数量非常少的情况

    假设某个字段取值范围非常广(性别和地域字段就是一个返利),差点儿没有反复,即高选择性,则此时使用B+树索引是最合适的。

    假设结果的数量非常多通过B+树索引一层层推断的性能差于全表扫描。

    即使你在该列加了索引,优化器也不会使用索引,而是会使用全表扫描的方法。

    对于另外一种情况,优化器是怎么推断是不是应该使用索引的呢?优化器会通过EXPLAIN的row字段预估查询可能得到的行,假设大于20%的行优化器会使用全表扫描的方法。

    实际上。预估的返回行数的值是不准确的。因此优化器有时是不靠谱的。
    假设我们能够明白知道返回的结果集的大小,能够使用force index(index_col)强制使用索引。

    3.1 索引失效的情况

    B+树索引失效实质是查询不适用B+树查找的性质。

    常见的情况有:
    (1)后项或者中间匹配,比如:使用like ‘a%*’是能够使用索引。使用like ‘%*a’ 索引失效
    (2)使用IS NOT NULL或者<>
    (3)在索引列上使用函数或者运算
    (4)复合索引中where条件没有使用到第一列,比如:where A=1或者where A=1 and B=2都会使用到索引,where B=2或者where A=1 or B=2索引失效.

    <h1>4 主键索引和辅助索引</h1>
    <h1>5 复合索引 </h1>
    

    參考文章:
    [1] http://blog.chinaunix.net/uid-116213-id-3395051.html

  • 相关阅读:
    禁止Crontab产生邮件
    centos6.2 ftp 配置
    [转] 夏天折T恤的方法
    [转] 55个经典开源Windows工具(2)
    [转] 55个经典开源Windows工具(3)
    [**轻松一下**] 程序员喝酒喝出的计算机文化!
    [转] 55个经典开源Windows工具(1)
    [转] 关于mscomm的用法,提高篇
    [转] 传说中的减肥............
    [转] 关于MSCOMM控件的一些说明
  • 原文地址:https://www.cnblogs.com/jzssuanfa/p/7052500.html
Copyright © 2011-2022 走看看