zoukankan html css js c++ java

《算法导论》读书笔记之第15章动态规划—最优二叉查找树

　　1、前言：

　　接着学习动态规划方法，最优二叉查找树问题。二叉查找树参考http://www.cnblogs.com/Anker/archive/2013/01/28/2880581.html。如果在二叉树中查找元素不考虑概率及查找不成功的情况下，可以采用红黑树或者平衡二叉树来搜索，这样可以在O(lgn)时间内完成。而现实生活中，查找的关键字是有一定的概率的，就是说有的关键字可能经常被搜索，而有的很少被搜索，而且搜索的关键字可能不存在，为此需要根据关键字出现的概率构建一个二叉树。比如中文输入法字库中各词条（单字、词组等）的先验概率，针对用户习惯可以自动调整词频——所谓动态调频、高频先现原则，以减少用户翻查次数，使得经常用的词汇被放置在前面，这样就能有效地加快查找速度。这就是最优二叉树所要解决的问题。

2、问题描述

　给定一个由n个互异的关键字组成的有序序列K={k₁<k₂<k₃<,……,<k_n}和它们被查询的概率P={p₁,p₂,p₃,……,p_n}，要求构造一棵二叉查找树T，使得查询所有元素的总的代价最小。对于一个搜索树，当搜索的元素在树内时，表示搜索成功。当不在树内时，表示搜索失败，用一个“虚叶子节点”来标示搜索失败的情况，因此需要n+1个虚叶子节点{d₀<d₁<……<d_n}，对于应d_i的概率序列是Q={q₀,q₁,……,q_n}。其中d₀表示搜索元素小于k₁的失败结果，d_n表示搜索元素大于k_n的失败情况。d_i（0<i<n）表示搜索节点在k_i和k_(i+1)之间时的失败情况。因此有如下公式：

　　由每个关键字和每个虚拟键被搜索的概率，可以确定在一棵给定的二叉查找树T内一次搜索的期望代价。设一次搜索的实际代价为检查的节点个数，即在T内搜索所发现的节点的深度加上1。所以在T内一次搜索的期望代价为：

需要注意的是：一棵最优二叉查找树不一定是一棵整体高度最小的树，也不一定总是把最大概率的关键字放在根部。

（3）动态规划求解过程

1）最优二叉查找树的结构

　　如果一棵最优二叉查找树T有一棵包含关键字k_i，……，k_j的子树T'，那么这棵子树T’对于对于关键字k_i，……k_j和虚拟键d_i-1，……，d_j的子问题也必定是最优的。

2）一个递归解

　　定义e[i,j]为搜索一棵包含关键字ki，……，kj的最优二叉查找树的期望代价，则分类讨论如下：

当j=i-1时，说明此时只有虚拟键d_i-1，故e[i,i-1] = q_i-1

当j≥i时，需要从k_i，……，k_j中选择一个跟k_r，然后用关键字k_i，……，k_r-1来构造一棵最优二叉查找树作为左子树，用关键字k_r+1，……，k_j来构造一棵最优二叉查找树作为右子树。定义一棵有关键字k_i，……，k_j的子树，定义概率的总和为：

因此如果k_r是一棵包含关键字k_i，……，k_j的最优子树的根，则有：

故e[i,j]重写为：

最终的递归式如下：

3）计算一棵最优二叉查找树的期望搜索代价

　　将e[i,j]的值保存到一个二维数组e[1..1+n,0..n]中，用root[i,j]来记录关键字ki，……，kj的子树的根，采用二维数组root[1..n,1..n]来表示。为了提高效率，防止重复计算，需要个二维数组w[1..n+1,0...n]来保存w(i,j)的值，其中w[i,j] = w[i,j-1]+p_j+q_j。数组给出了计算过程的伪代码：

 1 OPTIMAL_BST(p,q,n)
 2     for i=1 to n+1    //初始化e和w的值
 3        do e[i,i-1] = qi-1;
 4           w[i,i-1] = qi-1;
 5      for l=1 to n
 6         do for i=1 to n-l+1
 7                   do j=i+l-1;
 8                        e[i,j] = MAX;
 9                        w[i,j] = w[i,j-1]+pj+qj;
10                        for r=i to j
11                                do t=e[i,r-1]+e[r+1,j]+w[i,j]
12                                     if t<e[i,j]
13                                          then e[i,j] = t;
14                                               root[i,j] = r;
15 return e and root;

4）构造一棵最优二叉查找树

　　根据地第三步中得到的root表，可以递推出各个子树的根，从而可以构建出一棵最优二叉查找树。从root[1,n]开始向下递推，一次找出树根，及左子树和右子树。

4、编程实现

　　针对一个具体的实例编程实现，现在有5个关键字，其出现的概率P={0.15，0.10，0.05，0.10，0.20}，查找虚拟键的概率q={0.05，0.10，0.05，0.05，0.05，0.10}。采用C++语言是实现如下：

 1 #include <iostream>
 2  using namespace std;
 3  #define N 5
 4  #define MAX 999999.99999
 5  void optimal_binary_search_tree(float *p,float *q,int n,float e[N+2][N+1],int root[N+1][N+1]);
 6  void construct_optimal_bst1(int root[N+1][N+1],int i,int j);
 7  void construct_optimal_bst2(int root[N+1][N+1],int i,int j);
 8  int main()
 9  {
10      float p[N+1] = {0,0.15,0.10,0.05,0.10,0.20};
11      float q[N+1] = {0.05,0.10,0.05,0.05,0.05,0.10};
12      float e[N+2][N+1];
13      int root[N+1][N+1];
14      int i,j;
15      optimal_binary_search_tree(p,q,N,e,root);
16      cout<<"各个子树的期望代价如下所示："<<endl;
17      for(i=1;i<=N+1;i++)
18      {
19          for(j=i-1;j<=N;j++)
20              cout<<e[i][j]<<" ";
21          cout<<endl;
22      }
23      cout<<"最优二叉查找树的代价为: "<<e[1][N]<<endl;
24      cout<<"各个子树根如下表所示："<<endl;
25      for(i=1;i<=N;i++)
26      {
27          for(j=i;j<=N;j++)
28              cout<<root[i][j]<<" ";
29          cout<<endl;
30      }
31      cout<<"构造的最优二叉查找树如下所示："<<endl;
32      construct_optimal_bst1(root,1,N);
33      cout<<"\n最优二叉查找树的结构描述如下："<<endl;
34      construct_optimal_bst2(root,1,N);
35      cout<<endl;
36      return 0;
37  }
38  void optimal_binary_search_tree(float *p,float *q,int n,float e[N+2][N+1],int root[N+1][N+1])
39  {
40      int i,j,k,r;
41      float t;
42      float w[N+2][N+1];
43      for(i=1;i<=N+1;++i) //主表和根表元素的初始化
44      {
45          e[i][i-1] = q[i-1];
46          w[i][i-1] = q[i-1];
47      }
48      for(k=1;k<=n;++k)  //自底向上寻找最优子树
49          for(i=1;i<=n-k+1;i++)
50          {
51              j = i+k-1;
52              e[i][j] = MAX;
53              w[i][j] = w[i][j-1]+p[j]+q[j];
54 
55              for(r=i;r<=j;r++) //找最优根
56              {
57                  t = e[i][r-1] + e[r+1][j] +w[i][j];
58 
59                  if(t < e[i][j])
60                  {
61                      e[i][j] = t;
62                      root[i][j] = r;
63                  }
64              }
65          }
66  }
67  void construct_optimal_bst1(int root[N+1][N+1],int i,int j)
68  {
69 
70      if(i<=j)
71      {
72          int r = root[i][j];
73          cout<<r<<" ";
74          construct_optimal_bst1(root,i,r-1);
75          construct_optimal_bst1(root,r+1,j);
76      }
77  }
78  void construct_optimal_bst2(int root[N+1][N+1],int i,int j)
79  {
80       if(i==1 && j== N)
81          cout<<"k"<<root[1][N]<<"是根"<<endl;
82       if(i<j)
83       {
84           int r = root[i][j];
85           if(r != i)
86             cout<<"k"<<root[i][r-1]<<"是k"<<r<<"的左孩子"<<endl;
87           construct_optimal_bst2(root,i,r-1);
88           if(r!= j)
89             cout<<"k"<<root[r+1][j]<<"是k"<<r<<"的右孩子"<<endl;
90           construct_optimal_bst2(root,r+1,j);
91       }
92       if(i==j)
93       {
94           cout<<"d"<<i-1<<"是k"<<i<<"左孩子"<<endl;
95           cout<<"d"<<i<<"是k"<<i<<"右孩子"<<endl;
96       }
97       if(i>j)
98           cout<<"d"<<j<<"是k"<<j<<"右孩子"<<endl;
99  }

程序测试结果如下所示：

参考资料：http://www.cnblogs.com/lpshou/archive/2012/04/26/2470914.html

查看全文

相关阅读:
『转载』Git管理工具sourcetree安装与使用
 实用网站分享：全栈开发可能需要用到的网站
 低版本浏览器（IE6+）页面兼容性问题相关处理
 Git常用命令说明
 jquery的全局函数多库并存
 深浅拷贝
 localStorage
jquery中封装了三种ajax请求方式
 jquery的树状菜单
 自定义动画 jquery的结束动画

原文地址：https://www.cnblogs.com/Anker/p/2958488.html

《算法导论》读书笔记之第15章 动态规划—最优二叉查找树

《算法导论》读书笔记之第15章动态规划—最优二叉查找树