数据库5 索引动态哈希（Dynamic Hashing）

zoukankan html css js c++ java

数据库5 索引动态哈希（Dynamic Hashing）
索引文件

聚集索引和非聚集索引

其实，我们的汉语字典的正文本身就是一个聚集索引。比如，我们要查“安”字，就会很自然地翻开字典的前几页，因为“安”的拼音是“an”，而按照拼音排序汉字的字典是以英文字母“a”开头并以“z”结尾的，那么“安”字就自然地排在字典的前部。如果您翻完了所有以“a” 开头的部分仍然找不到这个字，那么就说明您的字典中没有这个字；同样的，如果查“张”字，那您也会将您的字典翻到最后部分，因为“张”的拼音是“zhang”。也就是说，字典的正文部分本身就是一个目录，您不需要再去查其他目录来找到您需要找的内容。我们把这种正文内容本身就是一种按照一定规则排列的目录称为“聚集索引”。如果您认识某个字，您可以快速地从自动中查到这个字。但您也可能会遇到您不认识的字，不知道它的发音，这时候，您就不能按照刚才的方法找到您要查的字，而需要去根据“偏旁部首”查到您要找的字，然后根据这个字后的页码直接翻到某页来找到您要找的字。但您结合“部首目录”和“检字表”而查到的字的排序并不是真正的正文的排序方法，比如您查“张”字，我们可以看到在查部首之后的检字表中“张”的页码是672页，检字表中“张”的上面是“驰”字，但页码却是63页，“张”的下面是“弩”字，页面是390页。很显然，这些字并不是真正的分别位于“张”字的上下方，现在您看到的连续的“驰、张、弩”三字实际上就是他们在非聚集索引中的排序，是字典正文中的字在非聚集索引中的映射。我们可以通过这种方式来找到您所需要的字，但它需要两个过程，先找到目录中的结果，然后再翻到您所需要的页码。我们把这种目录纯粹是目录，正文纯粹是正文的排序方式称为“非聚集索引”。通过以上例子，我们可以理解到什么是“聚集索引”和“非聚集索引”。进一步引申一下，我们可以很容易的理解：每个表只能有一个聚集索引，因为目录只能按照一种方法进行排序。

聚集索引（Clustered Index）特点

聚集索引的叶节点就是实际的数据页

聚集索引中的排序顺序仅仅表示数据页链在逻辑上是有序的。而不是按照顺序物理的存储在磁盘上
行的物理位置和行在索引中的位置是相同的

每个表只能有一个聚集索引，但索引可以包括很多列

聚集索引的平均大小大约为表大小的5%左右

使用聚集索引或非聚集索引的场景 (注：优先级依次为推荐，应，不应)

主键和聚集索引的比较

索引的优点与缺点

创建索引可以大大提高系统的性能。

第一，通过创建唯一性索引，可以保证数据库表中每一行数据的唯一性。

第二，可以大大加快数据的检索速度，这也是创建索引的最主要的原因。

第三，可以加速表和表之间的连接，特别是在实现数据的参考完整性方面特别有意义。

第四，在使用分组和排序子句进行数据检索时，同样可以显著减少查询中分组和排序的时间。

第五，通过使用索引，可以在查询的过程中，使用优化隐藏器，提高系统的性能。

也许会有人要问：增加索引有如此多的优点，为什么不对表中的每一个列创建一个索引呢？这种想法固然有其合理性，然而也有其片面性。虽然，索引有许多优点，但是，为表中的每一个列都增加索引，是非常不明智的。这是因为，增加索引也有许多不利的一个方面。

第一，创建索引和维护索引要耗费时间，这种时间随着数据量的增加而增加。

第二，索引需要占物理空间，除了数据表占数据空间之外，每一个索引还要占一定的物理空间，如果要建立聚簇索引，那么需要的空间就会更大。

第三，当对表中的数据进行增加、删除和修改的时候，索引也要动态的维护，这样就降低了数据的维护速度。

索引是建立在数据库表中的某些列的上面。因此，在创建索引的时候，应该仔细考虑在哪些列上可以创建索引，在哪些列上不能创建索引。一般来说，应该在这些列上创建索引，例如：

在经常需要搜索的列上，可以加快搜索的速度；

在作为主键的列上，强制该列的唯一性和组织表中数据的排列结构；

在经常用在连接的列上，这些列主要是一些外键，可以加快连接的速度；

在经常需要根据范围进行搜索的列上创建索引，因为索引已经排序，其指定的范围是连续的；

在经常需要排序的列上创建索引，因为索引已经排序，这样查询可以利用索引的排序，加快排序查询时间；

在经常使用在WHERE子句中的列上面创建索引，加快条件的判断速度。

同样，对于有些列不应该创建索引。一般来说，不应该创建索引的的这些列具有下列特点：

第一，对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为，既然这些列很少使用到，因此有索引或者无索引，并不能提高查询速度。相反，由于增加了索引，反而降低了系统的维护速度和增大了空间需求。

第二，对于那些只有很少数据值的列也不应该增加索引。这是因为，由于这些列的取值很少，例如人事表的性别列，在查询的结果中，结果集的数据行占了表中数据行的很大比例，即需要在表中搜索的数据行的比例很大。增加索引，并不能明显加快检索速度。

第三，对于那些定义为text, image和bit数据类型的列不应该增加索引。这是因为，这些列的数据量要么相当大，要么取值很少。

第四，当修改性能远远大于检索性能时，不应该创建索引。这是因为，修改性能和检索性能是互相矛盾的。当增加索引时，会提高检索性能，但是会降低修改性能。当减少索引时，会提高修改性能，降低检索性能。因此，当修改性能远远大于检索性能时，不应该创建索引

创建索引

CREATE INDEX <索引的名字> ON tablename (列的列表);

修改表

ALTER TABLE tablename ADD INDEX [索引的名字] (列的列表);

创建表的时候指定索引

CREATE TABLE tablename ( [...], INDEX [索引的名字] (列的列表) );

主键 :

主键是一种唯一性索引，但它必须指定为“PRIMARY KEY”。主键一般在创建表的时候指定

动态哈希

MySQL动态hash结构

Dynamic Hashing

引用：

数据库索引的基础知识
 数据库索引
 MySQL数据库索引的4大类型以及相关的索引创建
查看全文

相关阅读:
sqli-libs(3)
python学习之路（18）
BZOJ3534：[SDOI2014]重建——题解
 洛谷省选斗兽场全通关祭~以及之后的打算！
BZOJ4596：[SHOI2016]黑暗前的幻想乡——题解
 BZOJ2732：[HNOI2012]射箭——题解
 BZOJ1486：[HNOI2009]最小圈——题解
 BZOJ4552：[HEOI2016/TJOI2016]排序——题解
 BZOJ2830 & 洛谷3830：[SHOI2012]随机树——题解
 BZOJ4889 & 洛谷3759：[TJOI2017]不勤劳的图书管理员——题解

原文地址：https://www.cnblogs.com/bishi/p/5699010.html

数据库5 索引 动态哈希（Dynamic Hashing）

索引文件

聚集索引和非聚集索引

使用聚集索引或非聚集索引的场景 (注：优先级依次为推荐，应，不应)

主键和聚集索引的比较

索引的优点与缺点

创建索引

动态哈希

MySQL动态hash结构

Dynamic Hashing

引用：

数据库5 索引动态哈希（Dynamic Hashing）