zoukankan      html  css  js  c++  java
  • 数据库索引及其数据结构

    数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。索引的实现通常使用B树及其变种B+树

    在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。

    为表设置索引是要付出代价的:一是增加了数据库的存储空间;二是子啊插入和修改数据的时候要花费较多的时间(因为索引也要随之改动)

    创建索引可以大大提高系统的性能。

    第一,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。

    第二,可以大大加快数据的检索速度,这也是创建索引的最主要的原因。

    第三,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。

    第四,在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。

    第五,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。 

    也许会有人要问:增加索引有如此多的优点,为什么不对表中的每一个列创建一个索引呢?因为,增加索引也有许多不利的方面。

    第一,创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。

    第二,索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。

    第三,当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。

    一般来说,应该在这些列上创建索引:

    (1)在经常需要搜索的列上,可以加快搜索的速度;

    (2)在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;

    (3)在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;

    (4)在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;

    (5)在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;

    (6)在经常使用在WHERE子句,join字句中的列上面创建索引,加快条件的判断速度。

    一般来说,不应该创建索引的的这些列具有下列特点:

    第一, 对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。

    第二,对于那些只有很少数据值的列也不应该增加索引。这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。

    第三,对于那些定义为text, image和bit数据类型的列不应该增加索引。这是因为,这些列的数据量要么相当大,要么取值很少。

    第四,当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改性能远远大于检索性能时,不应该创建索引。

    根据数据库的功能,可以在数据库设计器中创建三种索引唯一索引、主键索引和聚集索引

    唯一性索引:

    惟一索引可以确保索引列不包含重复的值.
    可以用多个列,但是索引可以确保索引列中每个值组合都是唯一的

    创建索引,例如create unique index <索引的名字> on  tablename (列的列表); create unique index idxempid on emp(姓,名)
    修改表,例如ALTER TABLE tablename ADD UNIQUE [索引的名字] (列的列表);
    创建表的时候指定索引,例如CREATE TABLE tablename ( [...], UNIQUE [索引的名字] (列的列表) );
    如果能确定某个数据列将只包含彼此各不相同的值,在为这个数据列创建索引的时候就应该用关键字UNIQUE把它定义为一个唯一索引。这么做的好处:
      一是简化了MySQL对这个索引的管理工作,这个索引也因此而变得更有效率;
      二是MySQL会在有新记录插入数据表时,自动检查新记录的这个字段的值是否已经在某个记录的这个字段里出现过了;
        如果是,MySQL将拒绝插入那条新记录。也就是说,唯一索引可以保证数据记录的唯一性。事实上,在许多场合,人们创建唯一索引的目的往往不是为了提高访问速度,而只是为了避免数据出现重复。

    主键索引:

    主键是一种唯一性索引,但它必须指定为“PRIMARY KEY”。如果你曾经用过AUTO_INCREMENT类型的列,你可能已经熟悉主键之类的概念了。主键一般在创建表的时候指定,例如“CREATE TABLE tablename ( [...], PRIMARY KEY (列的列表) ); ”。但是,我们也可以通过修改表的方式加入主键,例如“ALTER TABLE tablename ADD PRIMARY KEY (列的列表); ”。每个表只能有一个主键。 

    主键索引与唯一索引的区别:

             1 一个表的主键只能有一个,而唯一索引可以建多个。
             2 主键可以作为其它表的外键。
             3 主键不可为null,唯一索引可以为null。

    聚集索引:

    表中存储的数据按照索引的顺序存储,检索效率比普通索引高,但对数据新增/修改/删除的影响比较大。逻辑顺序决定了表中相应行的物理顺序。

      (1) 一个表可以最多可以创建249个索引

      (2) 先建聚集索引才能创建非聚集索引

         (3) 非聚集索引数据与索引不同序

         (4) 数据与索引在不同位置

         (5) 索引在叶节点上存储,在叶节点上有一个"指针"直接指向要查询的数据区域

         (6) 数据不会根据索引键的顺序重新排列数据

         (7)如果在该字段上进行范围查询,或者该表很少做增删改

    创建聚集索引的语法:
       create NONCLUSTERED INDEX idximpID ON EMP(empID)

    2、非聚集索引:不影响表中的数据存储顺序,检索效率比聚集索引低,对数据新增/修改/删除的影响很少
    。是通过二叉树的数据结构来描述的,逻辑顺序,特点:
       (1) 无索引,数据无序
       (2) 有索引,数据与索引同序 
       (3) 数据会根据索引键的顺序重新排列数据
       (4) 一个表只能有一个索引
       (5) 叶节点的指针指向的数据也在同一位置存储
    语法:
    create CLUSTERED INDEX idxempID on emp(empID)

  • 相关阅读:
    Demo学习: DownloadDemo
    Demo学习: FileUpload
    Demo学习: Dialogs Anonymous Callback
    Demo学习: Cookies Demo
    Demo学习: CustomException
    Demo学习: Collapsible Panels
    Demo学习: ColumnSort
    Demo学习: ClientInfo
    Demo学习: Closable Tabs
    Demo学习: ClientEvents
  • 原文地址:https://www.cnblogs.com/wangleBlogs/p/7354075.html
Copyright © 2011-2022 走看看