zoukankan      html  css  js  c++  java
  • SQL Server计算数据库中表、堆、聚集索引和非聚集索引的大小

    前言

    在前篇的一篇博客Sql Server中的表组织和索引组织(聚集索引结构,非聚集索引结构,堆结构)中写到了数据中表和索引的结构。当时在写聚集索引的时候说聚集索引的叶子节点就是真实的数据,而非聚集索引的叶子节点是指针,要么指向聚集索引,要么指向行号。当时就在考虑一个,如果索引都带真实数据了,那么到底是索引大还是表呢呢?

    今天在msdn上查到了如何估算数据库的大小,其中在估算表的大小时,给出了如下说明:

    可以使用下列步骤估计在表中存储数据所需的空间:

    1. 按照估计堆的大小估计聚集索引的大小中的说明计算堆或聚集索引所需的空间。
    2. 对于每个非聚集索引,按照估计非聚集索引的大小中的说明计算其所需的空间。
    3. 对步骤 1 和步骤 2 中计算的值求和。

    这就说明了表其实包含索引跟数据两部分,索引是建立在表上的。之前一直将数据跟表分割了,所以才产生开头提到的问题。现在算是明白了。那么又有新的问题了,索引跟数据,哪个大?

    计算堆的大小

    我们通过以下的一个小实验来计算数据在堆结构中的存储方式。

    use TESTDB1
    go
    --step1:创建表
    CREATE TABLE Orders2
    (
      orderid        INT,--4字节
      orderdate      DATETIME, --8字节
      freight        MONEY,--8字节
      shipname       NCHAR(40),--double-byte存储,40*2=80字节
      shipcountry    CHAR(15) --single-byte存储,15字节
    );
    go
    --step2:计算列大小
    --原先的计算这张表的列大小为:4+8+8+80+15=115字节,一页能够存储8060/115=70.08,取整为70行数据
    /*
    按照http://msdn.microsoft.com/zh-cn/library/ms189124.aspx的方法计算
    Row_Size=Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4。这里
    Fixed_Data_Size=4+8+8+80+15=115
    Variable_Data_Size=0,
    Null_Bitmap = 2 + ((Num_Cols + 7) / 8)= 2 + ((5 + 7) / 8)=3
    Row_Size=115+0+3+4=122
    Rows_Per_Page = 8096 / (Row_Size + 2)=8060/(122+2)=8060/124=65
    */
    --step3:查看表存储信息
    select * from Orders2;
    --未插入数据前,查询全部都是0
    exec sp_spaceused Orders2
    
    --step4:插入一条记录
    INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
      VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  'France');
    select * from Orders2;
    
    --step5:再次查看表存储信息
    --插入数据以后,data=8kb,index=8kb。8kb是最小的IO单位,即使只有一行,也是8kb。
    exec sp_spaceused Orders2
    
    --step6:前面插入了一行数据,我们之前算过一页能存65行,下面我们插入60行,然后再一条一条递增。看一下是不是还是8kb
    --循环插入60条记录
    declare @i int 
    set @i=1 
    while @i<=60
      begin 
        INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
                    VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  'France');
        set @i = @i + 1
      end
    
    --step7:查看表存储信息,查询结果还是data=8kb,index=8kb
    select * from Orders2;
    exec sp_spaceused Orders2
    
    --step8:再次插入一条记录,直到rows=64时,data=16kb,表示数据占用两个page了,
    --按照计算应该是65.刚刚满页.这是否表明页不能存满,存满马上分页.
     INSERT INTO Orders2(orderid, orderdate, freight, shipname,  shipcountry)
                    VALUES(10248, '20060704 00:00:00.000',  32.38, N'Ship to 85-B',  N'France');
    --step9:
    exec sp_spaceused Orders2

    疑问:按照计算,一页刚刚好能够存65条记录,但是在存到64页的时候就占用16kb,也就是两页了,这是为什么?是否表明数据不能满页。

    将上述

     shipcountry    CHAR(15)

    修改为

     shipcountry    CHAR(20)

    那么按照公式计算如下

    /*
    Row_Size=Fixed_Data_Size + Variable_Data_Size + Null_Bitmap + 4。这里
    Fixed_Data_Size=4+8+8+80+20=120
    Variable_Data_Size=0,
    Null_Bitmap = 2 + ((Num_Cols + 7) / 8)= 2 + ((5 + 7) / 8)=3
    Row_Size=120+0+3+4=127
    Rows_Per_Page = 8096 / (Row_Size + 2)=8060/(127+2)=8060/129=62.4
    */

    上述公示表明我一页能够存储62行,但是在我插入了60行数据的时候data=8kb,但是当rows=61的时候,data=16kb了。



  • 相关阅读:
    Xshell 设置右键粘贴功能
    python中dict操作集合
    mac 设置网页字体
    博客收藏
    memcache 安装与简单使用
    mac安装homebrew
    Graphviz下载 使用
    jekyll 与hexo
    js 汉字排序
    初试gem
  • 原文地址:https://www.cnblogs.com/xwdreamer/p/2588761.html
Copyright © 2011-2022 走看看