多路查找树
二叉树与B树
1.二叉树的问题分析
二叉树的操作效率高,但也存在一些问题:
1)二叉树需要加载进内存,如果二叉树的结点少,没什么问题,但是如果二叉树的结点很多,就会存在如下问题:
① 在构建二叉树时,需要多次进行I/O操作,结点海量,构建二叉树,速度又影响。
②结点海量,也会造成二叉树高度很高,会降低操作速度。
2.多叉树
1)在二叉树中,每个结点又数据项,最多有两个子节点,如果允许每个结点可以有更多的数据项和更多的子节点,就是多叉树。
2)2-3树、2-3-4树就是多叉树,多叉树通过重新组织结点,减少树的高度,能对二叉树进行优化。
2-3树
- 2-3树介绍
2-3树是最简单的B-树结构,特点:
1)2-3树的所有叶子节点都在同一层(只要是B树都满足这个条件)
2)有两个子节点的结点叫二结点,二结点要么没有子节点,要么有两个子节点。
3)有三个子节点的结点叫三节点,三节点要么没有子节点,要么有三个子节点。
4)2-3树是由二节点和三节点构成的树
- 2-3树的应用案例
将数列{16,24,12,32,14,26,34,10,8,28,38,20}构建成2-3树,并保存数据插入的大小顺序。
构建过程:
B树、B+树和B*树
B-tree树即B树,B即Balanced,,前面的2-3树和2-3-4树他们都是B树。我们在学习mysql时索引的底层基于B树或者B+树。
B树说明:
1)B数的阶:结点的最多子节点个数,比如2-3树的阶为3,2-3-4树的阶为4.
2 )B-树的搜索,从根节点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的二子结点。重复,直到所对应的儿子节点指针为空,或者已经时叶子结点。
3)关键字集合分布在整个树中,即叶子节点和非叶子节点存放数据。
4)搜索有可能在非叶子节点结束。
5)其搜索性能等价于在关键字全集内做一次二分查找。
2.B+树是B树的变体
1)B+树的搜索与B树也基本相同,区别是B+树只有达到叶子结点才命中(B树可以在非叶子节点命中),其性能也等价与在关键字全集内做一次二分查找。
2)所有的关键字都出现在叶子节点的链表中(即数据只能在叶子节点【也叫稠密索引】),且链表中的关键字恰好是有序的。
3)不可能在非叶子节点命中。
4)非叶子节点相当于是叶子结点的索引(稀疏索引),叶子节点相当于存储(关键字)数据的数据层。
5)跟适合文件索引系统。