zoukankan      html  css  js  c++  java
  • 主键与聚集索引的区别

    有些人可能对主键和聚集索引有所混淆,其实这两个是不同的概念,下面是一个简单的描述。不想看绕口文字者,直接看两者的对比表。尤其是最后一项的比较。

    主键(PRIMARY KEY )

    来自MSDN的描述:

    表通常具有包含唯一标识表中每一行的值的一列或一组列。这样的一列或多列称为表的主键 (PK),用于强制表的实体完整性。在创建或修改表时,您可以通过定义 PRIMARY KEY 约束来创建主键。

    一个表只能有一个 PRIMARY KEY 约束,并且 PRIMARY KEY 约束中的列不能接受空值。由于 PRIMARY KEY 约束可保证数据的唯一性,因此经常对标识列定义这种约束。

    如果为表指定了 PRIMARY KEY 约束,则 SQL Server 2005 数据库引擎 将通过为主键列创建唯一索引来强制数据的唯一性。当在查询中使用主键时,此索引还可用来对数据进行快速访问。因此,所选的主键必须遵守创建唯一索引的规则。 

    创建主键时,数据库引擎 会自动创建唯一的索引来强制实施 PRIMARY KEY 约束的唯一性要求。如果表中不存在聚集索引或未显式指定非聚集索引,则将创建唯一的聚集索引以强制实施 PRIMARY KEY 约束。

    聚集索引

    聚集索引基于数据行的键值在表内排序和存储这些数据行。每个表只能有一个聚集索引,因为数据行本身只能按一个顺序存储。

    每个表几乎都对列定义聚集索引来实现下列功能:

    • 可用于经常使用的查询。
    • 提供高度唯一性。

    两者的比较

    下面是一个简单的比较表

      主键 聚集索引
    用途 强制表的实体完整性 对数据行的排序,方便查询用
    一个表多少个 一个表最多一个主键 一个表最多一个聚集索引
    是否允许多个字段来定义 一个主键可以多个字段来定义 一个索引可以多个字段来定义
         
    是否允许 null 数据行出现 如果要创建的数据列中数据存在null,无法建立主键。
    创建表时指定的 PRIMARY KEY 约束列隐式转换为 NOT NULL。
    没有限制建立聚集索引的列一定必须 not null .
    也就是可以列的数据是 null
    参看最后一项比较
    是否要求数据必须唯一 要求数据必须唯一 数据即可以唯一,也可以不唯一。看你定义这个索引的 UNIQUE 设置。
    (这一点需要看后面的一个比较,虽然你的数据列可能不唯一,但是系统会替你产生一个你看不到的唯一列)
         
    创建的逻辑 数据库在创建主键同时,会自动建立一个唯一索引。
    如果这个表之前没有聚集索引,同时建立主键时候没有强制指定使用非聚集索引,则建立主键时候,同时建立一个唯一的聚集索引
    如果未使用 UNIQUE 属性创建聚集索引,数据库引擎 将向表自动添加一个四字节 uniqueifier 列。
    必要时,数据库引擎 将向行自动添加一个 uniqueifier 值,使每个键唯一。此列和列值供内部使用,用户不能查看或访问。

    参考:

    下面这个帖子中大力的回复:
    http://topic.csdn.net/t/20021212/16/1255429.html

    关于主键,非聚集索引,聚集索引,看看好吗?!

    您好,想请教一下您以下一些问题:聚集索引对范围查询比较有用,只要找到边界值所在的位置便可以确定所查询之目标范围,但是对于单个的查询是起不到多大作用的。   
      我的很多查询是单个产品代号的在线查询,所以最好以先后时间建立聚集索引,产品代号虽然是查询条件,但是这个代号的变化范围很大,经过很多测试后代号顺序很乱,如果用它建聚集所以,如果后提交的代号较小,需要在物理位置上插到已有数据的中间,那么他后面所有数据都要向后移位,每次都挪动很多数据其不是很费资源,还不如建个非聚集索引,毕竟插入动作的频率远远高于查询动作,而以提交时间建聚集索引遵循先来先到的原则,一般不需要挪动数据的,所以这样对于插入很频繁的操作要更好一些。   
      对于每次插入前都要检查唯一性的列是不是一定要建成主键。   
      是不是每张表必须有个聚集索引索引,如果我不指定聚集索引,那么它以什么样的顺序进行物理排列呢?是不是先来先到的原则,早提交的在前面,后提交的在后面,每次插入只是追加,不用去挪动很多数据?   
      那个填充因子从0到100,范围太大,并且我一点都不知道他的意义,不知道是做什么用的,能否给我个经验值?  
      文件组也没有理解,听您的意思,如果我存放数据的逻辑盘是由多个物理硬盘构成的,可以选择文件组来进行并行处理,可以提高性能。我的数据文件是放在多个硬盘组成的磁盘阵列中的,按理因该选文件组,但是好像只有一个primary可供选择,是否选这个就行了?   
        
      是不是所有表一定得有主键,我到底有没有必要为了建立主键而去建一个毫无意义的自增列?   
        
      我对这方面懂得很少,以上是对于几位热心人回复贴的理解,不知道对不对,麻烦您给解答一下,不甚感激,谢谢!   

    1 楼jaguarcts(xzh2000)

    聚集索引对范围查询比较有用,只要找到边界值所在的位置便可以确定所查询之目标范围,但是对于单个的查询是起不到多大作用的。   
      ----应该也起作用,你可以在查询分析器查执行路径   
        
      对于每次插入前都要检查唯一性的列是不是一定要建成主键。   
      是不是每张表必须有个聚集索引索引,如果我不指定聚集索引,那么它以什么样的顺序进行物理排列呢?是不是先来先到的原则,早提交的在前面,后提交的在后面,每次插入只是追加,不用去挪动很多数据?   
      ----这个问题不一定,主要看你要达到的目的,不过作开发最好是每个表都要有主键,SQL中主键本身就是聚集索引   
        
      那个填充因子从0到100,范围太大,并且我一点都不知道他的意义,不知道是做什么用的,能否给我个经验值?  
      ----如果每个块中数据都充满了,当新的更新使比原来的数据长度大,会使索引破   
      碎,如果数据更新多,填充因子要大一些,反之。。。   
        
      文件组也没有理解,听您的意思,如果我存放数据的逻辑盘是由多个物理硬盘构成的,可以选择文件组来进行并行处理,可以提高性能。我的数据文件是放在多个硬盘组成的磁盘阵列中的,按理因该选文件组,但是好像只有一个primary可供选择,是否选这个就行了?   
      ----文件组是为了更方便管理表所用的,你可以创建很多的文件组,将文件分布在   
      不同的组,可以控制表放在某一个文件组。   
      如create   table   a_test(id   decimal(8,2))   on   [second]   
      表示a_test创建在second文件组中,而second在另一块硬盘上。   
        
        
        
       
    2 楼sky_blue(蓝天2007)

    "毕竟插入动作的频率远远高于查询动作"   这样用聚集索引的确负作用大。   
      "对于每次插入前都要检查唯一性的列是不是一定要建成主键。"不一定,可以建立唯一性约束   
      "我到底有没有必要为了建立主键而去建一个毫无意义的自增列"   
      个人意见还是建上好

    3 楼tj_dns(愉快的登山者)

    1。聚集索引对于单个的查询比没有索引要起作用;   
      2。同意建立产品代号非聚集索引;   
      3。最好将每次插入前都要检查唯一性的列建成主键;便于查错;   
      4。不是每张表必须有个聚集索引,如果不指定聚集索引,是先来先到的原则;   
      5。60%,如果建立聚集索引,且总有中间索引插入,此值就要考虑小一些,留出空间来;但值太小,索引的层次就要增加,反过来会影响速度。   
      6。在磁盘阵列中的也可以建立多个文件,但意义不很大;   
      7。不是所有表一定得有主键,要看需要,自增列也是;   
     

    4 楼ToUpdate(老六)

    UP

    5 楼pengdali()

    参考:   
      簇集索引=聚集索引:   
      聚集索引确定表中数据的物理顺序。聚集索引类似于电话簿,后者按姓氏排列数据。由于聚集索引规定数据在表中的物理存储顺序,因此一个表只能包含一个聚集索引。但该索引可以包含多个列(组合索引),就像电话簿按姓氏和名字进行组织一样。   
        
      聚集索引对于那些经常要搜索范围值的列特别有效。使用聚集索引找到包含第一个值的行后,便可以确保包含后续索引值的行在物理相邻。例如,如果应用程序执行的一个查询经常检索某一日期范围内的记录,则使用聚集索引可以迅速找到包含开始日期的行,然后检索表中所有相邻的行,直到到达结束日期。这样有助于提高此类查询的性能。同样,如果对从表中检索的数据进行排序时经常要用到某一列,则可以将该表在该列上聚集(物理排序),避免每次查询该列时都进行排序,从而节省成本。   
        
      非簇集索引:   
      非聚集索引与聚集索引一样有   B   树结构,但是有两个重大差别:     
        
      数据行不按非聚集索引键的顺序排序和存储。   
        
        
      非聚集索引的叶层不包含数据页。     
      相反,叶节点包含索引行。每个索引行包含非聚集键值以及一个或多个行定位器,这些行定位器指向有该键值的数据行(如果索引不唯一,则可能是多行)。   
        
      非聚集索引可以在有聚集索引的表、堆集或索引视图上定义。在   Microsoft®   SQL   Server™   2000   中,非聚集索引中的行定位器有两种形式:     
        
      如果表是堆集(没有聚集索引),行定位器就是指向行的指针。该指针用文件标识符   (ID)、页码和页上的行数生成。整个指针称为行   ID。   
        
        
      如果表没有聚集索引,或者索引在索引视图上,则行定位器就是行的聚集索引键。如果聚集索引不是唯一的索引,SQL   Server   2000   将添加在内部生成的值以使重复的键唯一。用户看不到这个值,它用于使非聚集索引内的键唯一。SQL   Server   通过使用聚集索引键搜索聚集索引来检索数据行,而聚集索引键存储在非聚集索引的叶行内。     
      由于非聚集索引将聚集索引键作为其行指针存储,因此使聚集索引键尽可能小很重要。如果表还有非聚集索引,请不要选择大的列作为聚集索引的键。   
        
        
      唯一索引:   
      唯一索引可以确保索引列不包含重复的值。在多列唯一索引的情况下,该索引可以确保索引列中每个值组合都是唯一的。   
      唯一索引既是索引也是约束。   
        
      复合索引:   
      索引项是多个的就叫组合索引,也叫复合索引。   
      复合索引使用时需要注意索引项的次序。

  • 相关阅读:
    #Kruskal算法 ——求最小生成树 ~20.8.17
    #最小生成树 #Prim算法 ——求最小生成树 ~20.8.15
    #Floyd #多源最短路 ~2020.08.15
    #Bellman-Ford最短路算法 #SPFA(spfa)算法 2020.08.14
    #单源最短路 #Dijkstra 学习心得 20.8.13
    #拓扑序列 学习心得 ~2020.08.13
    96.奇怪的汉诺塔
    95.费解的开关
    94.递归实现排列型枚举
    93.递归实现组合型枚举
  • 原文地址:https://www.cnblogs.com/kingCpp/p/4613767.html
Copyright © 2011-2022 走看看