zoukankan      html  css  js  c++  java
  • 对聚集表查询的时候,未显式指定排序列的时候,默认查询结果的顺序一定是按照聚集索引顺序排序的吗

    本文之外可参考另外一篇文章作为补充:http://www.cnblogs.com/wy123/p/6189100.html

    在sql server 中,如果一张表存在聚集索引的时候,
    大多数情况下,如果进行select * from TableName查询,默认的返回顺序是按照聚集所在列的顺序返回的
    但是,在一张表存在聚集索引的时候,并不一定所有的情况都是按照聚集索引列的顺序排列的,
    下面开始测试

    create table TestDefaultOrder
    (
    	Id int identity(1,1) primary key,--主键上默认会建立聚集索引
    	Col2 char(5),
    	COL3 char(5)
    )
    --写入100000条测试数据
    insert into TestDefaultOrder  values (SUBSTRING(cast(NEWID() as varchar(50)),1,5),SUBSTRING(cast(NEWID() as varchar(50)),1,5))
    go 100000
    

    如下查询完全没有问题,正如你所预料的,按照聚集索引所在的列(Id)排序的,完全没有问题,下面开始切入正题

    --创建一张同样的对照表
    create table TestDefaultOrder_Contrast
    (
    	Id int identity(1,1) primary key,--主键上默认会建立聚集索引
    	Col2 char(5),
    	COL3 char(5)
    )
    
    --将TestDefaultOrder表中的数据写入进去,目前,两张表的数据和索引结构一模一样
    insert into TestDefaultOrder_Contrast (Col2,Col3)  
    select Col2,Col3 from TestDefaultOrder
    
    --仅仅在对照表上创建一个非聚集索引,这是唯一的不同点
    Create Index idx2 on TestDefaultOrder_Contrast(Col2,Col3)
    

    接下来的查询,或许会有一点一点出乎你的意料,

    上面说了,两张表的数据是一模一样的,聚集索引结构也是一样的,只是对照表多个一个非聚集索引

    发现对照表的结果返回顺序,根本是按照聚集索引的排序返回的

    那么原因在哪里呢?我们要从不同类似索引占用的空间情况进行分析,通过dm_db_index_physical_stats发现,在数据数据完全一致的情况下,

    因为TestDefaultOrder_Contrast这个表上的非聚集索引,占用的空间更少(248个page,而TestDefaultOrder的聚集索引是285个page),

    正因为此,sqlserver在进行全表扫描的时候,会选择一个代价更小的索引(进行扫描),

    因为TestDefaultOrder表上只有一个聚集索引,按照聚集索引扫描进行查询,返回的结果的顺序是按照聚集索引列排序的

    但是TestDefaultOrder_Contrast就不同了,因为在非聚集索引idx2 上,包含了全部的数据(Col2,Col3以及指向聚集索引键值的Id),

    但idx2这个索引是占用的空间更小,所以对于TestDefaultOrder_Contrast的查询,是按照idx2这个非聚集索引进行扫描的

    因为,在TestDefaultOrder_Contrast这个表上,

    直接select * TestDefaultOrder_Contrast进行查询的话,

    跟对表TestDefaultOrder进行 select * TestDefaultOrder查询

    是用两种完全不同的方式进行的,出来的结果自然也就不同了

     

    而事实上,sqlserver在对TestDefaultOrder_Contrast进行查询的时候,通过走idx2这个索引扫描,代价确实要比TestDefaultOrder的聚集索引扫描,代价要小

    如果有兴趣的话,再次分析为什么存储同样的数据(TestDefaultOrder上的聚集索引和TestDefaultOrder_Contrast的非聚集索引idx2),

    TestDefaultOrder表上的聚集索引,要比TestDefaultOrder_Contrast上的idx2(Create Index idx2 on TestDefaultOrder_Contrast(Col2,Col3))占用的空间大呢

    这里的原因在于,一个表上的聚集索引(于非聚集索引相比),除了要存储数据,要维护的信息更多的元数据信息,占用的空间自然就较多一点

    而sqlserver在进行查询的时候,总是会选择一个代价相对较低的方式。

    总结:千万不要以为,只要表上建立了聚集索引,在查询的时候,返回结果的默认的排序方式,是按照聚集索引来的

    后记:为什么要研究这个问题?

    因为之前遇到过,某些查询没有显式指定排序列,但是借助表上聚集索引,返回结果的时候,会得一个想要的顺序。

    这种情况其实会潜在一种问题,如果发生类似上面这种情况,想要对查询结果按照聚集索引的顺序排序,而又不显式制定排序列,查询结果的显示顺序,可就不一定了。

  • 相关阅读:
    表相关操作
    表的约束
    windows平台MySQL安装
    网络编程2
    Python元类
    并发编程这个只是占位使用而已
    并发编程2
    并发编程1
    Mac装机神器Homebrew
    基于Django框架开发BBS项目
  • 原文地址:https://www.cnblogs.com/wy123/p/5425946.html
Copyright © 2011-2022 走看看