二叉树的定义
上一节我们说了树的定义与储存,这节我们稍微进阶学习一下二叉树的知识,首先我们先来了解一下什么是二叉树:二叉树( Binary Tree) 是 n ( n >= O ) 个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两颗互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
可能大家看了一下概念还有点不明白,我们通过图示来看一下:
二叉树的特点
看来二叉树是一种比较特殊的树,那么特殊在那些地方呢?我们来看看二叉树的特点:
• 每个结点最多有两棵子树,所以二叉树中不存在度大于 2 的结点。注意不是只有两棵子树,而是最多有,没有子树或者有一棵子树都是可以的。
• 左子树和右子树是有顺序的,次序不能任意颠倒。就像人是双手、双脚,但显然左手、左脚和右手、右脚是不一样的,右手戴左手套、右脚穿左鞋都会极其别扭和难受。
• 即使树中某结点只有一棵子树,也要区分它是左子树还是右子树。下图中,树 1 和树 2 是同一棵树,但它们却是不同的二叉树。 就好像你一不小心,摔伤了手,伤的是左手还是右手,对你的生活影响度是完全不同的。
二叉树具有五种基本形态:
- 空二叉树。
- 只有一个根结点。
- 根结点只有左子树。
- 根结点只有右子树。
- 根结点既有左子树又有右子树。
特殊二叉树
我们再来介绍一些特殊的二叉树。这些树可能暂时你不能理解它有什么用处,但先了解一下,以后会提到它们的实际用途。
-
斜树
顾名思义,斜树一定要是斜的,但是往哪斜还是有讲究。 所有的结点都只有左子树的二叉树叫左斜树。所有结点都是只有右子树的二叉树叫右斜树。这两者统称为斜树。 斜树有很明显的特点,就是每一层都只有一个结点,结点的个数与二叉树的深度相同。
有人会想,这也能叫树呀, 与我们的统性表结构不是一样吗。对的,其实线性表结构就可以理解为是树的一种极其特殊的表现形式。 -
满二叉树
在一棵二叉树中,如果所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上,这样的二叉树称为满二叉树。
下图就是一棵满二叉树,从样子上看就感觉它很完美。
单是每个结点都存在左右子树,不能算是满二叉树,还必须要所有的叶子都在同一层上,这就做到了整棵树的平衡。因此,满二叉树的特点有 :
(1) 叶子只能出现在最下一层。出现在其他层就不可能达成平衡。
(2) 非叶子结点的度一定是 2。否则就是"缺胳膊少腿" 了。
(3) 在同样深度的二叉树中,满二叉树的结点个数最多,叶子数最多。 -
完全二叉树
对一棵具有 n 个结点的二叉树按层序编号,如果编号为 i ( 1 <= i < n ) 的结点与同样深度的满二叉树中编号为 i 的结点在二叉树中位置完全相同,则这棵二叉树称为完全二叉树,如下图所示。
这是一种有些理解难度的特殊二叉树。
首先从字面上要区分,”完全“ 和 ”满“的差异,满二叉树一定是一棵完全二叉树,但完全二叉树不一定是满的。其次, 完全二叉树的所有结点与同样深度的满二叉树,它们按层序编号相同的结点, 是一一对应的。这里有个关键词是按层序编号。像下图中的树 1 ,因为 5 结点 没有左子树,却有右子树,那就使得按层~编号的第 10 个编号空档了。同样道理,下图中的树 2,由于 3 结点没有子树,所以使得 6、7 编号的位置空挡了。下图中的树 3 又是因为 5 编号下没有子树造成第 10 和第 11 位置空档。只有上如图中的树,尽管它不是满二叉树,但是编号是连续的,所以它是完全二叉树。
从这里我也可以得出一些完全二叉树的特点:
(1) 叶子结点只能出现在最下两层。
(2) 最下层的叶子一定集中在左部连续位置。
(3) 倒数二层,若有叶子结点,一定都在右部连续位置。
(4) 如果结点度为 1,则该结点只有左孩子,即不存在只有右子树的情况。
(5) 同样结点数的二叉树,完全二叉树的深度最小。
从上面的例子,也给了我们一个判断某二叉树是否是完全二叉树的办法,那就是看着树的示意图,心中默默给每个结点按照满二叉树的结构逐层顺序编号,如果编号出现空挡,就说明不是完全二叉树,否则就是。
二叉树的性质
-
二叉树的性质1
性质 1 :在二叉树的第 i 层上至多有 2^(i - 1) 个结点 ( i > 1 )。
第一层是根结点,只有一个,所以 2^(1 - 1) = 2^0 = 1。
第二层有两个,2^(2 -1) = 2^1 = 2。
第三层有四个,2^(3 -1) = 2^2 = 4。
第四层有八个,2^(4 -1) = 2^3 = 8。
通过数据归纳法的论证,可以很容易得出在二叉树的第 i 层上至多有 2^(i-1) 个结点 (i >= 1 ) 的结论。 -
二叉树的性质2
性质 2:深度为 k 的二叉树至多有 2^k - 1 个结点 (k >= 1 )。
注意这里一定要看清楚,是 2^k 后再减去 1,而不是 2^(k - 1)。以前很多同学不能完全理解,这样去记忆,就容易把性质 2 与性质 1 给弄混淆了。
深度为 k 意思就是有 k 层的二叉树,我们先来看看简单的。
如果有一层,至多 1 = 2^1 - 1 个结点。
如果有二层,至多 1+ 2 = 3 =2^2 - 1 个结点。
如果有三层,至多 1 + 2 + 4 = 7 = 2^3 - 1 个结点。
如果有四层, 至多 1 + 2 + 4 + 8 = 15 = 2^4 - 1 个结点。
通过数据归纳法的论证,可以得出,如果有 k 层,此二叉树至多有 2^k - 1 个结点。 -
二叉树的性质3
性质3: 对任何一棵二叉树 T,如果其终端结点数为 n0 ,度为 2 的结点数为 n2 ,则 n0 = n2 + 1。终端结点数其实就是叶子结点数,而一棵二叉树, 除了叶子结点外,剩下的就是度为 1 或 2 的结点数了,我们设 n1 为度是 1 的结点数。 则树 T 结点总数 n = n0 + n1 + n2。
比如下图的例子,结点总数为 10 ,它是由 A、B、C、D 等度为 2 结点, F、G、H、l、J 等度为 0 的叶子结点和 E 这个度为 1 的结点组成。 总和为 4 + 1 + 5 = 10。
我们换个角度,再数一数它的连接线数,由于根结点只有分支出去,没有分支进入,所以分支线总数为结点总数减去 1。上图就是 9 个分支。对于 A、B、C、D 结点来说,它们都有两个分支线出去,而 E结点只有一个分支线出去。 所以总分支线为 4 x 2 + 1 x 1 = 9。用代数表达就是分支线总数 = 0 - 1 = n1 + 2 * n2。因为刚才我们有等式 n=n0 + n1 + n2,所以可推导出 n0 + n1 + n2 - 1= n1 + 2 * n2。 结论就是 n0 = n2 + 1。
-
二叉树的性质4
性质 4:具有 n 个结点的完全二叉树的深度为 [log2^n] +1 ( [x] 表示不大于x 的最大整数)。由满二叉数的定义我们可以知道,深度为 k 的满二叉树的结点数 n 一定是 2^k -1。 因为这是最多的结点个数。那么对于 n = 2 ^k -1 倒推得到满二叉树的度数为 k = log2^ [ n + 1],比如结点数为 15 的满二叉树,度为 4。
完全二叉树我们前面已经提到,它是一棵具有 n 个结点的二叉树,若按层序编号后其编号与同样深度的满二叉树中编号结点在二叉树中位置完全相同,那它就是完全二叉树。 也就是说,它的叶子结点只会出现在最下面的两层。
它的结点数一定少于等于同样度数的满二叉树的结点数 2^k - 1 ,但一定多于 2^( k -1 ) - 1 即满足 2^( k - 1) - 1 < n <= 2^k - 1。由于结点数 n 是整数, n <= 2^k - 1 意味着 n < 2^k,n > 2^( k -1 ) - 1,意味着 n >= 2^( k - 1),所以 2^(k - 1) <= n < 2^k,不等式两边取对数,得到 k - 1 <= log2^n < k,而 k 作为度数也是整数,因此 k = [Log2^n] + 1 。
-
二叉树的性质5
性质 5:如果对一棵有 n 个结点的完全二叉树(其深度为 [Log2^n] + 1的结点按层序编号(从第 1 层到第 [Log2^n] + 1 层,每层从左到右) ,对任一结点 i (1 <= i <= n) 有:-
如果 i = 1 ,则结点 i 是二叉树的根,无双亲;如果 i > 1 ,则其双亲是结点 [ i/2 ] 。
-
如果 2i > n,则结点 i 无左孩子(结点 i 为叶子结点) ;否则其左孩子是结点 2i 。
-
如果 2i + 1> n,则结点 i 无右孩子;否则其右孩子是结点 2i + 1。
我们以下图为例,来理解这个性质。这是一个完全二叉树,度为 4,结点总数是 10.
对于第一条来说是很显然的, i = 1 时就是根结点。 i > 1 时,比如结点 7,它的双亲就是 [ 7 / 2 ] = 3, 结点 9,它的双亲就是 [ 9 / 2 ] = 4。第二条, 比如结点 6,因为 2 x 6 = 12 超过了结点总数 10 ,所以结点 6 是左孩子, 它是叶子结点。 同样,而结点 5 , 因为 2 x 5=10 正好是结点,总数 10,所以它的左孩子是结点 10。
第三条,比如结点 5,因为 2 x 5 + 1 = 11,大于结点总数 10,所以它无右孩子。 而结点 3 ,因为 2 x 3 + 1 = 7 小于 10,所以它的右孩子是结点 7。
-
二叉树的存储结构
二叉树的顺序存储结构
前面我们已经谈到了树的存储结构,并且谈到顺序存储对树这种一对多的关系结构实现起来是比较困难的。但是二叉树是一种特殊的树,由于它的特殊性,使得用顺序存储结构也可以实现。
二叉树的顺序存储结构就是用一维数组存储二叉树中的结点,井且结点的存储位置,也就是数组的下标要能体现结点之间的逻辑关系,比如双亲与孩子的关系,左右兄弟的关系等。
先来看看完全二叉树的顺序存储,一棵完全二叉树如下图所示。
将这棵二叉树存入到数组中,相应的下标对应其同样的位置, 如下图所示。
这下看出完全二叉树的优越性来了吧。由于它定义的严格, 所以用顺序结构也可以表现出二叉树的结构来。
当然对于一般的二叉树,尽管层序编号不能反映逻辑关系,但是可以将其按完全二叉树编号,只不过,把不存在的结点设置为"^"而已。如下图,注意浅色结点表示不存在。
考虑一种极端的情况,一棵深度为 k 的右斜树,它只有 k 个结点,却需要分配 2^k - 1 个存储单元空间,这显然是对存储空间的浪费, 例如图所示。所以,顺序存储结构一般只用于完全二叉树。
二叉链表
既然顺序存储适用性不强,我们就要考虑链式存储结构。 二叉树每个结点最多有两个孩子,所以为它设计一个数据域和两个指针域是比较自然的想法, 我们称这样的链表叫做二叉链表。结点结构图如下所示。
其中 data 是数据域,lchild 和 rchild 都是指针域,分别存放指向左孩子和右孩子的指针
结构示意图如图所示:
就如同树的存储结构中讨论的一样,如果有需要,还可以再增加一个指向其双亲的指针域,那样就称之为三叉链表。由于与树的存储结构类似,这里就不详述了。