zoukankan      html  css  js  c++  java
  • IAM页,IAM链表,分配单元

    from :http://www.sqlskills.com/BLOGS/PAUL/post/Inside-the-Storage-Engine-IAM-pages-IAM-chains-and-allocation-units.aspx

    目录

    IAM... 1

    IAM链表... 3

    分配单元... 4

    包含列... 4

    宽行(Large Rows... 5

    分区... 5

     

    IAM

    一个IAMindex allocation map)页跟踪单个文件中近4GB空间,和4GB的空间对齐。这些4GB的块被叫做’GAM intervals’。一个IAM页跟踪的空间属于一个对象。

     

    一个IAM页只能跟踪一个文件中的一个GAM interval,因此如果数据库有多个文件,或者有些文件大于4gb,那么一个实例被分配到多个文件或者一个文件中有多个GAM intervals,之后你就会发现每个对象需要的IAM页数量,来跟踪使用的空间。如果对象请求多个IAM页跟踪所有的扩展,那么这些IAM页就会被串起来。这个就是IAM链表。

     

    每个IAM页有2个记录,一个是IAM头,一个是IAM位图。让我们看看DBCC PAGE。我们使用页拆分来看。运行dbcc ind 返回以下结果:

    pagetyep列,你会发现有一个IAM页,IAM页的PageType 10。你可以在 Anatomy of a page中看到 更多的pagetype 代表的意思。

    DBCC TRACEON (3604);

    GO

    DBCC PAGE ('pagesplittest', 1, 152, 3);

    GO

    m_pageId = (1:152)                   m_headerVersion = 1                  m_type = 10
    m_typeFlagBits = 0x0                 m_level = 0                          m_flagBits = 0x200
    m_objId (AllocUnitId.idObj) = 68     m_indexId (AllocUnitId.idInd) = 256
    Metadata: AllocUnitId = 72057594042384384
    Metadata: PartitionId = 72057594038386688                                 Metadata: IndexId = 1
    Metadata: ObjectId = 2073058421      m_prevPage = (0:0)                   m_nextPage = (0:0)
    pminlen = 90                         m_slotCnt = 2                        m_freeCnt = 6
    m_freeData = 8182                    m_reservedCnt = 0                    m_lsn = (18:116:13)
    m_xactReserved = 0                   m_xdesId = (0:0)                     m_ghostRecCnt = 0
    m_tornBits = -1947725876

    Allocation Status

    GAM (1:2) = ALLOCATED                SGAM (1:3) = ALLOCATED
    PFS (1:1) = 0x70 IAM_PG MIXED_EXT ALLOCATED   0_PCT_FULL                  DIFF (1:6) = CHANGED
    ML (1:7) = NOT MIN_LOGGED

    IAM: Header @0x620CC064 Slot 0, Offset 96

    sequenceNumber = 0                   status = 0x0                         objectId = 0
    indexId = 0                          page_count = 0                       start_pg = (1:0)


    IAM: Single Page Allocations @0x620CC08E

    Slot 0 = (1:143)                     Slot 1 = (1:153)                     Slot 2 = (1:154)
    Slot 3 = (0:0)                       Slot 4 = (0:0)                       Slot 5 = (0:0)
    Slot 6 = (0:0)                       Slot 7 = (0:0)


    IAM: Extent Alloc Status Slot 1 @0x620CC0C2

    (1:0)        - (1:272)      = NOT ALLOCATED

    在页头上有些东西我们需要注意:

    l  页类型为10

    l  前一页,后一页为null,因为这个iam链表中没有其他的iam

    l  Slot的个数是2,一个是iam头记录,一个是bitmap记录

    l  页几乎是空的

    IAM页头有一下元素:

    Sequencenumber

             IAM页在IAM链表中的位置。IAM链表增加IAM页的时候会递增。

    Status

             已经不使用

    Objected

    Indexed

             SQL Server 2000或者以前,表示所属的所以。在SQL Server 2005之后就未使用。

    Page_count

             未使用,以前被用来记录单页分配的页数。

    Start_pg

             保存了GAM interval的第一个page id

    Single Page Alloctions array

             这些页是从混合扩展中分配的,这个队列只用在队列中的第一个IAM

    Bitmap中每个GAM Interval 中的扩展占一个bit。当扩展被分配的时候bit被设置,如果没有就会被清除。在一个GAM interval中有两个IAM页对应不同的对象,怎么这2个不能有相同的bit设置-可是使用 dbcc checkdb检查。Dbcc page 你会发现没有扩展分配。你会发现输出直到以272页开始的扩展-这个是因为数据文件只有这么大。插入更多的列,在做dbcc page。下面是输出:

    IAM: Single Page Allocations @0x620CC08E

    Slot 0 = (1:143)                     Slot 1 = (1:153)                     Slot 2 = (1:154)
    Slot 3 = (1:155)                     Slot 4 = (1:156)                     Slot 5 = (1:157)
    Slot 6 = (1:158)                     Slot 7 = (1:159)


    IAM: Extent Alloc Status Slot 1 @0x620CC0C2

    (1:0)        - (1:152)      = NOT ALLOCATED
    (1:160)      - (1:296)      =     ALLOCATED
    (1:304)      - (1:400)      = NOT ALLOCATED

    你会看到单页分配队列满了,之后分配切换到专用扩展。第一个可用的扩展从160页开始并且所有的扩展到296开始的扩展结束是已经被分配的。注意文件肯定增长,因为输出中增长到了400页。

    IAM需要注意的信息:

             自身的从混合扩展中分配的单页不会再任何地方跟踪。

             他们可以从其他文件上被分配来跟踪任何位置的扩展。

     

     

    IAM链表

    如果我们继续增长文件填充表,之后我们需要另外一个IAM页来映射另外一个GAM interval。就形成了一个IAM链表。这个列表的IAM页分配到一个对象。链表并没有排序-IAM页被加入只是因为空间的需要。IAM页被编号,当被添加到列表的时候编号顺序排序。

    不同的对象是否使用同一个IAM链表?在sql server 2000 sql server 2005 中答案是不一样的。

    sql server 2000 中,以下状况都会有一个IAM链表:

             堆或者聚集索引

                       一个表只能有一个堆或者聚集索引。Index id的编号是分别是 0 1

             非聚集索引

                       Index id 2250(也就是你只能有249个索引)

             表完整的LOB存储

                       对于LOB列。的索引为全文索引,indexid255

    Sql server 2000 中每个对象有251iam链表。我通常会说在sql server 2000中一个索引只有一个IAM链表。

     

    分配单元

    sql server 2005 或者之后的版本,很多东西都被修改。IAM链表和IAM页几乎相同,但是2者是不同的。一个表可以有750000IAM链表一下是新的3个事情分配IAM链表:

    1.    堆或者b树(b树是index存储的内部结构)

    2.    LOB 数据

    3.    行溢出数据

    我们叫这些空间分配单元叫分配单元。3个分配单元内部的名字:

    1.       hobt分配单元(堆或b树,简称hobbit)。

    2.       LOB分配单元

    3.       SLOB分配单元(小LOB或者断LOB

    外部名称叫做:

    1.       IN_ROW_DATA分配单元

    2.       LOB_DATA 分配单元

    3.       ROW_OVERFLOW_DATA 分配单元

    他们不是真正的IAM链表,因为不在跟踪一个索引的空间分配,他们的IAM页链表还是叫做IAM链表,单元的跟踪现在被叫做分配单元。区分他们,其实没什么不同点。

     

    让我们快速的浏览sql server 2005中这3个新的特性的必要性和如何提升一个表的IAM链表数量。

     

    包含列

    非聚集索引可以把非key列加入到索引的叶子节点中。这个很有用:

    1.       允许非聚集索引真正的覆盖查询,当查询结果多余16个列的时候或者查询的结果大于900个字节的时候(记住非聚集索引的key列被限制为16个列,900个字节)。

    2.       允许被包含的列不是索引键的一部分(如 varchar(max)或者XML)。

    3.       允许非聚集索引覆盖不需要所有的列都在key中。因为key 会被包含在索引的各个非叶子节点上,这样做可以减少索引的大小

    一个空间缩小的例子:想象一个1000万行的行索引,键的长度为900字节,但是只有前面2个整型的键值被真正的使用,其他4个固定长度的列可以被保存在包含列中。900个字节8行可以填满一个数据页。也就意味着需要12500000个叶子节点,1562500倒数第二层节点等待,一共需要12500000 + 1562500 + 195313 + 24415 + 3052 + 382 + 48 + 6 + 1 = 14285717个页(包含1785717来存储非叶子节点)。

     

    如果我们使用包含列key大小被缩小为8个字节,加上行头非叶子节点的行大小下降到15个字节。注意行上面的扇出还是8,因为所有的include存储在叶子节点上。因此有12500000个叶子节点,23278个上级节点,一共有12500000 + 23278 + 44 + 1 = 12523323个页(有23323个非叶子节点)。比较900个字节的key,减小了12%或者13.6GB

     

    真正增加这个特性的理由是索引覆盖,优化器知道一个覆盖索引可以从索引中获取所有的查询结果,因此查询可以不发生额外的io,提高性能。

    非聚集索引可以包含LOB列(在2005 中只能包含varchar(max),nvarchar(max),varbinary(max),XML)。这就索引单个LOB分配单元不可能更多因为每个索引可以有自己的LOB

    所以一个索引需要2个分配单元一个是行内数据一个是LOB数据。

     

    宽行(Large Rows

    对于表设计者来说行限制大小为8060个字节是个灾难在sql server 2005这个限制就被取消了。方法是使用可变化长度列(varcharsqlvariant)超过一行最大一页的限制。

     

    但是实际上超出了吗?这些列是有效的小lob数据列。这些数据被24个字节(可能是36,48,或者72个字节替换)的指针指向超出的的数据,就像lob一样被存储在一个独立的分配单元中-行溢出(或者SLOB)分配单元。这些值和LOB值一样被存储在文本页上的原理是一样的,只是使用了独立的分配单元。当第一个列值溢出的时候SLOB分配单元才会被创建。

     

    这个特性在非聚集索引中也适用,考虑如果你把包含列加入到索引中,可能超出了一个页。使用900字节的限制被替换为8060字节的限制,没有使用扩展行溢出属性会太过短浅。

     

    现在使用新特性,每个索引可以有3个分配单元,hobtLOB,SLOB。如果单单只有这些那么一个表的扩展单元最多可以有750个(一个IAM链表为一个分配单元,映射一个存储分配因此250个索引*3分配单元= 750IAM链表)。这里只有750个链表那么其他的从哪里来呢?

     

    分区

    一个表可以有1000个分区。分区是sql server 2005的新特性允许表,索引线性的划分为几段,每段都是独立存储(和独立的文件组类似)。分区是是独立基础。

     

    每个表的分区或者表的分区是独立存储的,每个都需要自己的hobt分配单元。当然,每个分区的LOB值也需要存储。行溢出特性也是每行的,所以每个分区的行会溢出到SLOB分配单元和未分区的表和索引一样。表和索引的每个分区可以有3个分配单元(也就是3IAM链表)。

     

    这就是1000的来历,每个表或者索引可以有1000个分区。250个索引*1000分区*3个分配单元 = 750000IAM链表。当然这个事情是不会发生的,但是是有可能的。

  • 相关阅读:
    noip2016十连测round1
    [bzoj 3732] Network (Kruskal重构树)
    主席树学习笔记
    [ZKW线段树]
    [poj2182] Lost Cows (线段树)
    [模板] 线性筛逆元
    [模板] 线筛欧拉函数
    [模板] SAP
    [poj2411] Mondriaan's Dream (状压DP)
    [poj2247] Humble Numbers (DP水题)
  • 原文地址:https://www.cnblogs.com/Amaranthus/p/2635338.html
Copyright © 2011-2022 走看看