zoukankan      html  css  js  c++  java
  • 谈SQL SERVER数据库中的索引

    前日,朋友说要一个表有十几个列要被用来join,问我索引应该怎么建立?
    给出的答案是:
    建一个聚集索引(在最常用的列上而且重复得很少的列上),在再几个比较用得多的列上建非聚集索引(由于手机上回复,懒得写太多的字咯..),不知道说得对不对哦,请达人请正.

    现作以下的整理,留作以后参考吧!!

    1、索引分类:

        按照存储方式分为:聚集与非聚集索引
        按照维护与管理索引角度分为:唯一索引、复合索引和系统自动创建的索引
    2、索引目的和代价:
        索引是表的一个概念部分,目的是减少全表扫描,用来提高检索数据的效率.

        它的代价. 索引需要空间来存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时, 索引本身也会被修改. 这意味着每条记录的INSERT , DELETE , UPDATE将为此多付出4 , 5 次的磁盘I/O . 因为索引需要额外的存储空间和处理,那些不必要的索引或者不合理的索引反而会使查询变慢.


    常见的两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。

    3、聚集索引:(表中存储的数据按照索引的顺序存储,检索效率比普通索引高,但对数据新增/修改/删除的影响比较大)
      
        1、一张表只能包含一个聚集索引,但并非只有一列,该索引可以包含多个列(组合索引),就像电话簿按姓氏和名字进行组织一样。

        2、在聚集索引中,表中各行的存储(物理)顺序与键值的逻辑(索引)顺序相同;

        3、聚集索引通常可加快UPDATE和DELETE操作的速度,因为这两个操作需要读取大量的数据;

        4、创建或修改聚集索引可能要花很长时间,因为执行这两个操作时要在磁盘上对表的行进行重组;

        5、另一个使用索引的好处是,它提供了主键(primary key)的唯一性验证. (其实本人也不知道为什么它就提供了唯一性验证呢,希望达人可以讲解.)
    创建聚集索引的语法:
       create CLUSTERED INDEX idximpID ON EMP(empID)

    4、非聚集索引
        1、一个表可以最多可以创建249个非聚集索引

        2、先建聚集索引才能创建非聚集索引(有待确认)

        3、非聚集索引数据的物理存储顺序与非聚集索引列不同

        4、数据存储地址与索引存储地址在不同位置

        5、索引在叶节点上存储,在叶节点上有一个“指针”直接指向要查询的数据的存储位置

        6、数据不会根据索引键的顺序重新排列数据

        语法:
        create NONCLUSTERED INDEX idxempID on emp(empID)

    5、复合索引:如果在两上以上的列上创建一个索引,则称为复合索引。
        那么,不可能有两行的姓和名是重复的
        语法:
        create index indexfullname on addressbook(firstname,lastname)

    6、惟一索引:惟一索引可以确保索引列不包含重复的值.
        可以用多个列,但是索引可以确保索引列中每个值组合都是唯一的

        举个例子:姓和名是一个很好的例子,也很容易理解.
        姓   名
        李   二
        张   三
        王   五
        语法: create unique index idxempid on emp(姓,名)

        系统自建的索引:在使用T_sql语句创建表的时候使用PRIMARY KEY或UNIQUE约束时,会在表上自动创建一个惟一索引

    7、生活中的索引--字典
        字典中按拼音查找--聚集索引
        正文内容本身就是一种按照一定规则排列的目录称为“聚集索引”。
        按部首---非聚集索引
        这种目录纯粹是目录,正文纯粹是正文的排序方式称为“非聚集索引”,可以通过目录索引到正文。


    8、何时使用聚集索引或非聚集索引
        以下,引用某位总结的表格:

    动作描述 使用聚集索引 使用非聚集索引
    列经常被分组排序
    返回某范围内的数据 不应
    一个或极少不同值 不应 不应
    小数目的不同值 不应
    大数目的不同值 不应
    频繁更新的列 不应
    外键列
    主键列
    频繁修改索引列 不应

      其实你只要知道:
    1、聚集索引是存储的顺序和索引的顺序一致
    2、非聚集索引是通过非聚集索引的指针来再来查询数据的存储位置
    从原理的角度来分析一下如何才能更快地索引到存储位置,就可以把握这种什么时候需要建立哪一种索引的原则了.

  • 相关阅读:
    【应试】数据通信与网络
    【应试】操作系统OS
    【笔记】 卷积
    【HDU 5920】 Ugly Problem
    【笔记】位运算
    【洛谷P1378】油滴扩展
    【洛谷 P1120】 小木棍[数据加强版]
    [codeforces]Round #538 (Div. 2) F. Please, another Queries on Array?
    [BZOJ]2563: 阿狸和桃子的游戏
    [BZOJ]4668: 冷战
  • 原文地址:https://www.cnblogs.com/Bluer/p/1004711.html
Copyright © 2011-2022 走看看