zoukankan      html  css  js  c++  java
  • 数据库空间管理 学习笔记

    SQL Server 中数据存储的基本单位是页(Page)。磁盘I/O 操作在页级执行。

    SQL Server 读取或写入数据的最小单位就是以8 KB 为单位的页。

    每页的开头是一个96 B 的页头,用于存储有关页的系统信息。包括页码、页类型、页的可用空间,以及拥有该页

    的对象的分配单元ID。不同类型的数据,存储在不同类型的页面里。

    在正常数据页上,数据行紧接着页的标头按顺序放置。页的末尾是行偏移量表,对于页中的每一行,每个行偏移表都包含一个条目。

    每个条目记录对应行的第一个字节与页首的距离。行偏移表中的条目的顺序与页中行的顺序相反。

    ------------------此处插入宋大神的注解------------------------

    除了页头占用的空间和行偏移矩阵占用的空间,中间剩下的空间就是给数据行使用的。一个数据行中还存在其他的信息用于表示该行数据,具体的结构是这样的:

    状态位A        1字节
    状态位B         1字节
    定长数据类型的长度     2字节
    定长数据的内容         具体定长数据字节
    列数              2字节
    NULL位图       列数/8个字节
    变长列的个数     2字节
    变长列的偏移矩阵    变长列个数*2个字节
    变长列的数据            具体变长数据字节

    这些最少占据1+1+2+2+1=7 

    -------------------------------------------------------------------

    输出指定的页面,可以使用:DBCC PAGE(<db_id>, <file_id>, <page_id>, <format_id>)

    Db_id 可以从sp_helpdb 的结果中得到。

    File_id 可以从sp_helpfile 的结果中得到。

    Format_id 是你指定的输出格式。

    在运行DBCC PAGE 之前,还需要打开跟踪标志(trace flag)3604

    在 SQL Server 中,行不能跨页,属于同一行的所有字段的数据都要放在同一个页面里。页的最大数据量是8 060 B(8 KB)。

    所以一般数据类型字段所组成的一行,最长加起来不能超过8 KB。

    但是,这一限制不包括Text/Image数据类型字段的数据。

    这些类型字段的数据会被单独存放在LOB(LargeObject)页面里。

    SQL Server 2005 开始的版本中,提供了varchar(max)、nvarchar(max)、varbinary(max)这样的数据类型。

    如果包含这一类数据类型字段的行,总长不超过8 KB,数据还是会一起存放在普通数据页面里。

    如果总长超过了8 KB,SQL Server 就会把这些字段的数据分开,单独存放在一种叫Row-Overflow(行溢出)的页面里。

    区(Extent)是8 个物理上连续的页的集合,用来有效地管理页。所有页都存储在区中。

    • 统一区,由单个对象所有。区中的所有8 页只能由一个对象使用。

    • 混合区,最多可由8 个对象共享。区中8 页的每页可由不同的对象所有。但是一页总是只能属于一个对象。

    通常从混合区向新表或索引分配页。当表或索引增长到8 页时,将变成使用统一区进行后续分配。

    DBCC SHOWFILESTATS

    这个命令能直接从GAM 和SGAM 这样的系统分配页面上面读取区分配信息,直接算出数据库文件里有多少区已被分配。

    sp_spaceused (+ updateusage才会准确)

    DBCC SHOWCONTIG( 慎用,SQL Server 2005 之后可以使用sys.dm_db_index_physical_stats)

    sys.dm_db_partition_stats

    可以从页面这个级别来分析检查数据库空间大小。

    日志文件不是按页/区来组织的。

    数据库引擎在内部将每一物理日志文件分成多个虚拟日志单元。虚拟日志单元没有固定大小,

    且一个物理日志文件所包含的虚拟日志单元数不固定。

    日志文件每自动增长一次,会至少增加一个虚拟日志单元。

    如果一个日志文件经历了多次小的自动增长,里面的虚拟日志单元数目会比正常的日志文件多很多。

    这种情况会影响到日志文件管理的效率,甚至造成数据库启动要花很长时间。

    事务日志是一种回绕的文件。当创建数据库时,逻辑日志文件从物理日志文件的始端开始。

    新日志记录被添加到逻辑日志的末端,然后向物理日志的末端扩张。

    当逻辑日志的末端到达物理日志文件的末端时,新的日志记录将回绕到物理日志文件的始端,继续向后写。

    DBCC SQLPERF(LOGSPACE)可以查看日志文件的使用情况。

    Tempdb 系统数据库是一个全局资源,可供连接到SQL Server 实例的所有用户使用,在SQL Server2005 中,用于保存下列各项:

    用户对象

    • 用户定义的表和索引。

    • 系统表和索引。

    • 全局临时表和索引。

    • 局部临时表和索引。

    • table 变量。

    • 表值函数中返回的表。

    内部对象

    • 用于游标或假脱机操作以及临时大型对象(LOB)存储的工作表。

    • 用于哈希联接或哈希聚合操作的工作文件。

    • 用于创建或重新生成索引等操作(如果指定了SORT_IN_TEMPDB)的中间排序结果,

    或者某些GROUP BY、ORDER BY 或UNION 查询的中间排序结果。

    每个内部对象至少使用9 页:一个IAM 页,一个8 页的区。

    版本存储区

    • 由使用快照隔离级别或已提交读隔离级别(基于行版本控制)的数据库中的数据修改事务生成的行版本。

    • 由数据修改事务为实现联机索引操作、多个活动的结果集(MARS)以及AFTER 触发器等功能而生成的行版本。

    Tempdb 空间使用的一大特点,是只有一部分对象,例如用户创建的临时表、table 变量等,

    可以用sys.allocation_units 和sys.partitions 这样的管理视图来管理。

    tempdb 的空间使用是不能用sp_spaceused 来跟踪的。(不准确)

    sys.dm_db_file_space_usage这张视图能反映tempdb 在几个大类里的空间使用分布。

    是用户对象(user_object_reserved_page_count),还是系统对象(internal_object_reserved_page_count)

    ,还是版本存储区(version_store_reserved_page_count)。

  • 相关阅读:
    HDU 1698 Just a Hook(线段树成段更新)
    HDU 1247 Hat's Words (map+string)
    python三大框架之一flask中cookie和session的相关操作
    python三大框架之一flask应用
    python三大框架之一(flask介绍)
    pandas中遍历dataframe的每一个元素
    Python中pandas dataframe删除一行或一列:drop函数
    gevent多协程运用
    利用selenium并使用gevent爬取动态网页数据
    使用selenium 模拟人操作请求网页
  • 原文地址:https://www.cnblogs.com/ajiangg/p/3578866.html
Copyright © 2011-2022 走看看