概念解析:
红黑树是一种自平衡二叉查找树(self-balancing binary search tree)。因此,红黑树本身就是二叉树的一个变种。典型的用途是实现关联数组(Associative Array),也就是map<key,value>。
红黑树五点约束条件:(FROM 百度 & wikipedia)
Note:上述五个性质的定义来自于百度 & wikipedia。个人认为这个五个性质定义得不是很通俗易懂。既然是红黑树,则性质1是自然而然的了。再者,性质2和性质3可以合并起来一起记忆。因此,可以改为以下三个性质定义:
1.根节点和叶子节点都是黑色,其中叶子节点为NULL节点;
2.任意父子两个节点不能同时为红色;
3.从根节点到所有叶子节点的路径上的黑色节点的个数是相同的。
此外,需要记住的是红黑树本身就是二叉树的一个变种。
红黑树的性能:
AVL树因为是高平衡的,所以其查找的性能是O(logn)。但是,AVL树的插入和删除两个操作可能需要通过一次或多次树旋转来重新平衡这个树。因此,如何在插入和删除比较频繁的应用环境下,AVL树需要比较大消耗。而RB树则是既能保证查找性能的同时,也能使用相对“便宜”的操作来实现插入和删除操作。这在于RB树并不追求“高平衡”--它仅仅要求部分平衡,降低了对树旋转的要求。
其实上述的五个约束性质是强制了红黑树的关键性质: 从根到叶子的最长的可能路径不多于最短的可能路径的两倍长。证明:很容易得到RB树种最短的路径是节点全是黑色的路径,而最长的路径可能是刚刚好黑色和红色相间的路径,此时后者刚刚好是前者的两倍。结果是这个树大致上是平衡的。因为操作比如插入、删除和查找某个值的最坏情况时间都要求与树的高度成比例,这个在高度上的理论上限允许红黑树在最坏情况下都是高效的,而不同于普通的二叉查找树。【FROM 百度】
在C++ STL中,很多部分(目前包括set, multiset, map, multimap)应用了红黑树的变体(SGI STL中的红黑树有一些变化,这些修改提供了更好的性能,以及对set操作的支持)。
此外,红黑树也并不是适合于所有应用树的领域。例如:如果数据在初始化后不会有插入和删除(或者很少的插入和删除),即数据基本不变动的情况下,使用hash table结构,查找性能则更适合。
红黑树的实现:
红黑树节点的定义如下:1 typedef enum Color { 2 RED, BLACK 3 } Color; 4 5 typedef struct RB_node { 6 Color _color; 7 int _key; 8 struct RB_node *_left_child; 9 struct RB_node *_right_child; 10 struct RB_node *_parent; 11 }*RB_node_ptr, RB_node;
<待续...>