索引结构

zoukankan html css js c++ java

索引结构
页和区

　　要想做好索引优化，知道索引的存储结构是至关重要的。谈到存储就需要了解SQL中的页和区的概念:
- SQL中存储数据的基础单位就是页，一个页大小为8K，数据库可以将数据从逻辑上分成页，磁盘的I/O操作就是在页级执行。页包信三项内容：
- 数据行
  
  行偏移量
- 一个区包含8个页,它是管理空间的单位，分为如下两类
  
  统一区，由单个对象所有。
  
  混合区，最多可由八个对象共享。
- 一般情况下，给表或者索引申请新的空间时，从混合区分配，当这个表或者索引的空间超过8个页大小时，会将原本在混合区的页转移到统一区管理。
表存储结构

　　知识了区以及页的概念，再看下数据表和这两者之间的联系, 表包含一个或多个分区，每个分区在一个堆或一个聚集索引结构中包含数据行。从下图的结构中，我们就看到了索引的重要结构B-树了。

　　             聚集索引结构

　　索引中的底层节点称为叶节点。根节点与叶节点之间的任何索引级别统称为中间级。在聚集索引中，叶节点包含基础表的数据页。根节点和中间级节点包含存有索引行的索引页。每个索引行包含一个键值和一个指针，该指针指向 B -树上的某一中间级页或叶级索引中的某个数据行。每级索引中的页均被链接在双向链接列表中。



非聚集索引结构



非聚集索引与聚集索引之间的显著差别在于以下两点：
- 基础表的数据行不按非聚集键的顺序排序和存储。
- 非聚集索引的叶层是由索引页而不是由数据页组成。
问题：
- 索引的结构到底分多少层？
我们先看下B-树，这种索引结构有一个重要的参数n，它决定了索引存储页的布局，每个存储页需要存放n个节点，以及n+1个指针。这里我们来做个计算：比如我们的索引是一个整形数字，4个字节，指针需要8个字节，这里不考虑索引页标头信息的占用，算下最大的n，公式： 4n+8(n+1)<=8*1024 ，这个值是680，即最大可存放680个键，再按B-树充满度来取75%等于510,根结点有510个，那么它会有510*510个叶结点，这些叶结点会有510*510*510个指向最终记录的指针。这个数据足以说明绝多数情况下，只要三层就能够用。
- 什么是稠密索引？
索引中的键顺序与数据文件中的排序顺序相同，所以我们的索引结构中，叶级均采用稿密索引。
- 什么是稀疏索引？
它只为每个存储块设计键-指针对，比稿密索引节约空间，出现在叶级之上的结构中。
- 索引结构中会出现如下情况吗？
要想回答这个问题，就需要了解索引在维护过程中对于B-树的调整，SQL会通过一定的算法将B-树的充满度达到一定的平衡，这里就会涉及的节点的拆分以及合并，所以一般情况下无论对数据做怎样的更新，也不会出现下图中如此不平衡的情况。

注：如果问重建索引的好处时，如果你回答是为了平衡B-树，那么要谨慎回答。

总结：

数据存储的基础知识，索引结构对于我们后续理解聚集索引以及非聚集索引都非常重要，也才有可能快速准确的做出优化方案。
查看全文

相关阅读:
IDEA导入外部jar包步骤
 将本地新建工程推到git上
 【转】Memcached与Redis有什么区别
 Redis
JavaScript-Tool-lhgDialog-js：lhgdialog.js
信息安全-HTTP：HTTP 身份验证
 信息安全-HTTP：HTTP访问控制（CORS）
JavaScript-Tool-lhgDialog：框架示例
 JavaScript-Tool-lhgDialog：动画示例-源代码
 JavaScript-Tool-lhgDialog：动画示例

原文地址：https://www.cnblogs.com/wxgblogs/p/5740317.html

页和区

表存储结构

非聚集索引结构

问题：

总结：