1.树:Tree是n(n>=0)个结点的有限集。n=0时称为空树。在任意一棵非空树中:(1)有且仅有一个特定的称为根(root)的结点;(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集,其中每一个集合本身又是一棵树,并且称为根的子树(subtree).
2.结点拥有的子树数称为结点的度(degree).度为0的结点称为叶结点(leaf)或终端结点;度不为0的结点称为非终端结点或分枝结点。除根结点外,分枝结点也称为内部结点。树的度是树内各结点的度的最大值。
3.结点的层次(level)从根开始定义,根为第一层,根的孩子为第二层。
树中结点的最大层次称为树的深度(depth)或高度。
如果将树中结点的各子树看成是从左至右是有次序的,不能互换的,则称该树为有序树,否则称为无序树。
森林(forest)是m(m>=0)棵互不相交的树的集合。
线性结构 | 树结构 |
第一个数据元素:无前驱 | 根结点:无双亲,唯一 |
最后一个数据元素:无后继 | 叶结点:无孩子,可以多个 |
中间元素:一个前驱一个后继 | 中间结点:一个双亲多个孩子 |
4.树的存储结构:
1.双亲表示法:假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点到链表中的位置。
存储结构的设计是一个非常灵活的过程。一个存储结构设计得是否合理,取决于基于该存储结构的运算是否适合、是否方便,时间复杂度好不好等。
2.孩子表示法:每个结点有多个指针域,其中每个指针指向一个子树的根结点,我们把这种方法叫做多重链表表示法。
把每个结点的孩子结点排列起来,以单链表作存储结构,则n个结点有n个孩子链表,如果是叶子结点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。
3.孩子兄弟表示法:任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。因此,我们设计两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。
这个表示法把一棵复杂的树变成了一棵二叉树。
5.二叉树(Binary Tree)是n(n>=0)个结点的有限集合,该集合或者为空集(称为空二叉树),或者由一个根结点和两颗互不相交的、分别称为根结点的左子树和右子树的二叉树组成。
二叉树具有5种基本形态:
空二叉树 只有一个根结点 根结点只有左子树 根结点只有右子树 根结点既有左子树又有右子树
6.特殊二叉树
斜树:左斜树。 右斜树
满二叉树:在一棵二叉树中,所有分支结点都存在左子树和右子树,并且所有叶子都在同一层上。
完全二叉树:对一棵具有n个结点的二叉树按层序编号,编号为 i(1=<i<=n)的结点与同样深度的满二叉树中编号为i的结点在二叉树中的位置完全相同。
同样结点树的二叉树,完全二叉树的深度最小。
7.二叉树的性质
1.在二叉树的第i层上至多有2i-1个结点(i>=1)
2.深度为k的二叉树至多有2k-1个结点(k>=1)
3.对任何一棵二叉树T,如果其终端结点数为n0,度为2的结点数为n2,则n0=n2+1
4.具有n个结点的完全二叉树的深度为【log2n】+1([x]表示不大于x的最大整数)。
5.如果对一棵有n个结点的完全二叉树(其深度为【log2n】+1)的结点按层序编号(从第1层到第【log2n】+1层,每层从左到右),对任一结点i(1=<i<=n)有:
1.如果i= 1,则结点i是二叉树的根,无双亲;如果i>1,则其双亲是结点【i/2】
2.如果2i>n,则结点i无左孩子(结点i为叶子结点);否则其左孩子是结点2i;
3.如果2i+1>n,则结点i 无右孩子;否则其右孩子是结点2i+1;
8.二叉树的存储结构
二叉树的顺序存储结构:一般只用于完全二叉树
二叉链表:二叉树每个结点最多有两个孩子,所以为他设计一个数据域和两个指针域,称这样的链表叫做二叉链表。
如果有需要,还可以增加一个指向其双亲的指针域,那样就称为三叉链表。
9.遍历二叉树
二叉树的遍历(traversing binary tree)是指从根结点出发,按某种次序依次访问二叉树中所有结点,使得每个结点被访问一次仅被访问一次。
二叉树的遍历方法:
a.前序遍历:若二叉树为空,则空操作返回,否则先访问根结点,然后前序遍历左子树,再前序遍历右子树。
b.中序遍历:若树为空,则空操作返回,否则从根结点开始(注意并不是先访问根结点),中序遍历根结点的左子树,然后是访问根结点,最后中序遍历右子树。
c.后序遍历:若树为空,则空操作返回,否则从左到右先叶子后结点的方式遍历访问左右子树,最后访问根结点。
d.层序遍历:若树为空,则空操作返回,否则从树的第一层,也就是根结点开始访问,从上而下逐层遍历,在同一层中,按从左到右的顺序对结点逐个访问。
前序和中序>>确定二叉树
后序和中序>>确定二叉树
前序和后序无法确定一棵二叉树
10.二叉树的建立
11.线索二叉树:我们把这种指向前驱和后继的指针称为线索,加上线索的二叉链表称为线索链表,相应的二叉树就称为线索二叉树(Threaded Binary Tree).
其实线索二叉树,等于把一棵二叉树转变成了一个双向链表,这样对我们的插入删除结点、查找某个结点都带来了方便。所以我们对二叉树以某种次序遍历使其变味线索二叉树的过程称作是线索化。
线索化的实质是将二叉链表中的空指针改为指向前驱或后继的线索。由于前驱和后继的信息只有在遍历该二叉树时才能看到,所以线索化的过程就是在遍历的过程中修改空指针的过程。
在实际问题中,如果所用的二叉树需经常遍历或查找结点时需要某种遍历序列中的前驱和后继,那么采用线索二叉树链表的存储结构就是非常不错的选择。
12.树、森林与二叉树的转换
树转换为二叉树
森林转换为二叉树
二叉树转换为树
二叉树转换为森林
树的遍历:先根遍历、 后根遍历
森林的遍历:前序遍历、后序遍历
森林的前序遍历和二叉树的前序遍历结果相同、森林的后序遍历和二叉树的中序遍历结果相同。
13.赫夫曼树及其应用
从树中一个结点到另一个结点之间的分支构成两个结点之间的路径,路径上的分支数目称作路径长度。树的路径长度就是从树根到每一结点的路径长度之和。
考虑到带权的结点
假设有n个权值{w1,w2,...wn},构造一棵有n个叶子结点的二叉树,每个叶子结点带权wk,每个叶子结点的路径长度为1k,我们通常记作,则其中带权路径长度WPL最小的二叉树称作赫夫曼树。(最优二叉树)
若要设计长短不等的编码,则必须是任一字符的编码都不是另一个字符的编码的前缀,这种编码称作前缀编码。
一般地,设需要编码的字符集为{d1,d2,...,dn},各个字符在电文中出现的次数或频率集合为{w1,w2,...,wn},以d1,d2,...,dn作为叶子结点,以w1,w2,...,wn作为相应叶子结点的权值来构造一棵赫夫曼树。规定赫夫曼树的左分支代表0,右分支代表1,则从根结点到叶子结点所经过的路径分支组成的0和1的序列便为该结点对应字符的编码,这就是赫夫曼编码。