1 递归算法初探
本段内容大部分摘自《linux C一站式编程》,作者是宋劲松老师,我认为这是目前看到的国内关于linux C编程的最好的一本技术书籍,强烈推荐!
关于递归的一个简单例子是求整数阶乘,n!=n*(n-1)!,0!=1
。则可以写出如下的递归程序:
1 int factorial(int n) 2 { 3 if (n == 0) 4 return 1; 5 else { 6 int recurse = factorial(n-1); 7 int result = n * recurse; 8 return result; 9 } 10 }
factorial这个函数就是一个递归函数,它调用了它自己。自己直接或间接调用自己的函数称为递归函数。如果觉得迷惑,可以把factorial(n-1)这一步看成是在调用另一个函数--另一个有着相同函数名和相同代码的函数,调用它就是跳到它的代码里执行,然后再返回factorial(n-1)这个调用的下一步继续执行。
为了证明递归算法的正确性,我们可以一步步跟进去看执行结果。记得刚学递归算法的时候,老是有丈二和尚摸不着头脑的感觉,那时候总是想着把递归一步步跟进去看执行结果。递归层次少还算好办,但是层次一多,头就大了,完全不知道自己跟到了递归的哪一层。比如求阶乘,如果只是factorial(3)跟进去问题还不大,但是若是factorial(100)要跟进去那真的会烦死人。
事实上,我们并不是每个函数都需要跟进去看执行结果的,比如我们在自己的函数中调用printf函数时,并没有钻进去看它是怎么打印的,因为我们相信它能完成打印工作。我们在写factorial函数时有如下代码:
1 ... 2 int recurse = factorial(n-1); 3 int result = n * recurse; 4 ...
这时,如果我们相信factorial是正确的,那么传递参数为n-1它就会返回(n-1)!,那么result=n*(n-1)!=n!,从而这就是factorial(n)的结果。
当然这有点奇怪:我们还没写完factorial这个函数,凭什么要相信factorial(n-1)是正确的?如果你相信你正在写的递归函数是正确的,并调用它,然后在此基础上写完这个递归函数,那么它就会是正确的,从而值得你相信它正确。
这么说还是有点玄乎,我们从数学上严格证明一下factorial函数的正确性。刚才说了,factorial(n)的正确性依赖于factorial(n-1)的正确性,只要后者正确,在后者的结果上乘个n返回这一步显然也没有疑问,那么我们的函数实现就是正确的。因此要证明factorial(n)的正确性就是要证明factorial(n-1)的正确性,同理,要证明factorial(n-1)的正确性就是要证明factorial(n-2)的正确性,依此类推下去,最后是:要证明factorial(1)的正确性就是要证明factorial(0)的正确性。而factorial(0)的正确性不依赖于别的函数调用,它就是程序中的一个小的分支return 1;
这个1是我们根据阶乘的定义写的,肯定是正确的,因此factorial(1)的实现是正确的,因此factorial(2)也正确,依此类推,最后factorial(n)也是正确的。
其实这就是在中学时学的数学归纳法,用数学归纳法来证明只需要证明两点:Base Case正确,递推关系正确。写递归函数时一定要记得写Base Case,否则即使递推关系正确,整个函数也不正确。如果factorial函数漏掉了Base Case,那么会导致无限循环。
2 递归经典问题
从上一节的一个关于求阶乘的简单例子的论述,我们可以了解到递归算法的精髓:要从功能上理解函数,同时你要相信你正在写的函数是正确的,在此基础上调用它,那么它就是正确的。下面就从几个常见的算法题来看看如何理解递归,这是我的一些理解,欢迎大家提出更好的方法。
2.1)汉诺塔问题
汉诺塔问题是个常见问题,就是说有n个大小不等的盘子放在一个塔A上面,自底向上按照从小到大的顺序排列。要求将所有n个盘子搬到另一个塔C上面,可以借助一个塔B中转,但是要满足任何时刻大盘子不能放在小盘子上面。
基本思想分三步,先把上面的N-1个盘子经C移到B,然后将最底下的盘子移到C,再讲B上面的N-1个盘子经A移动到C。总的时间复杂度f(n)=2f(n-1)+1,所以f(n)=2^n-1。
1 void hano(char a, char b, char c, int n) { 2 if (n > 0) { 3 hano(a, c, b, n-1); 4 move(a, c); 5 hano(b, a, c, n-1); 6 } 7 } 8 9 void move(char a, char b) 10 { 11 cout << a << "->" << b << endl; 12 }
2.2)求二叉树的深度
这里的深度指的是二叉树从根结点到叶结点最大的高度,比如只有一个结点,则深度为1,如果有N层,则高度为N。
1 int depth(struct node* root) 2 { 3 if (root == NULL) 4 return 0; 5 else { 6 int lDepth = depth(root->left); //获取左子树深度 7 int rDepth = depth(root->right); //获取右子树深度 8 return lDepth>rDepth? lDepth+1: rDepth+1; //取较大值+1即为二叉树深度 9 } 10 }
那么如何从功能上理解depth函数呢?我们可以知道定义该函数的目的就是求二叉树深度,也就是说我们要是完成了函数depth,那么depth(root)就能正确返回以root为根结点的二叉树的深度。因此我们的代码中depth(root->left)返回左子树的深度,而depth(root->right)返回右子树的深度。尽管这个时候我们还没有写完depth函数,但是我们相信depth函数能够正确完成功能。因此我们得到了lDepth和rDepth,而后通过比较返回较大值加1为二叉树的深度。如果不好理解,可以想象在depth中调用的函数depth(root->left)为另外一个同样名字完成相同功能的函数,这样就好理解了。注意Base Case,这里就是当root==NULL时,则深度为0,函数返回0。
2.3)判断二叉树是否平衡
一颗平衡的二叉树是指其任意结点的左右子树深度之差不大于1。判断一棵二叉树是否是平衡的,可以使用递归算法来实现。
1 bool is_balanced(BinaryTreeNode* pRoot) 2 { 3 if(pRoot == NULL) //基本情况,为空的话,返回true 4 return true; 5 6 int left = depth(pRoot->m_pLeft); 7 int right = depth(pRoot->m_pRight); 8 int diff = left - right; //计算左右子树深度之差 9 if(diff > 1 || diff < -1) //如果深度之差大于1返回false 10 return false; 11 12 return is_balanced(pRoot->m_pLeft) && is_balanced(pRoot->m_pRight); //递归判断左右子树,注意是&&,即左右子树都必须是平衡的这棵二叉树才是平衡的 13 }
该函数的功能定义是二叉树pRoot是平衡二叉树,即它所有结点的左右子树深度之差不大于1。首先判断根结点是否满足条件,如果不满足,则直接返回false。如果满足,则需要判断左子树和右子树是否都是平衡二叉树,若都是则返回true,否则false。
上面代码性能不高,会重复遍历结点,一个改进的算法是采用后序遍历的方式遍历树的结点,在遍历到本结点前我们已经遍历完了它的左右子树,我们只需要在遍历的时候记录结点的深度,就可以一边遍历一边判断该结点是否是平衡的。代码如下:
1 bool is_balanced_2(BinaryTreeNode* pRoot, int* pDepth) 2 { 3 if(pRoot == NULL) 4 { 5 *pDepth = 0; 6 return true; 7 } 8 9 int left, right; 10 if(is_balanced_2(pRoot->m_pLeft, &left) //左子树平衡 11 && is_balanced_2(pRoot->m_pRight, &right)) //右子树平衡 12 { 13 int diff = left - right; 14 if(diff <= 1 && diff >= -1) 15 { 16 *pDepth = 1 + (left > right ? left : right); 17 return true; 18 } 19 } 20 21 return false; 22 }
该函数功能定义是返回以pRoot为根的二叉树是否是平衡二叉树,同时把树的深度保存在pDepth指向的值中。基本情况是树为NULL,则深度为0,返回true。否则只有左右子树都是平衡的情况下,深度分别存在变量left和right中,判断左右子树的深度之差是否不大于1,如果是则返回true,注意还要设置树的深度值。
调用的函数定义如下:
1 bool IsBalanced(BinaryTreeNode* pRoot) 2 { 3 int depth = 0; 4 return is_balanced_2(pRoot, &depth); 5 }
2.4)排列算法
排列算法也是递归的典范,记得当初第一次看时一层层跟代码,头都大了,现在从函数功能上来看确实好理解多了。先看代码:
1 void perm(int a[], int k, int N) { //k为起始位置,N为数组大小 2 if (k == N-1) { 3 output(a, N); //输出排列 4 } else { 5 for (int i=k; i<N; i++) { 6 swap(a, i, k); //交换 7 perm(a, k+1, N); //下一次排列 8 swap(a, i, k); //恢复原来的序列 9 } 10 } 11 }
首先明确的是perm(a, k, N)函数的功能:输出数组a从位置k开始的所有排列,数组长度为N。这样我们在调用程序的时候,调用格式为perm(a, 0, N),即输出数组从位置0开始的所有排列,也就是该数组的所有排列。基础条件是k==N-1,此时已经到达最后一个元素,一次排列已经完成,直接输出。否则,从位置k开始的每个元素都与位置k的值交换(包括自己与自己交换),然后进行下一次排列,排列完成后记得恢复原来的序列。
假定数组a大小N=3,则程序调用perm(a, 0, 3)可以如下理解: 第一次交换0,0,并执行perm(a, 1, 3),执行完再次交换0,0,数组此时又恢复成初始值。 第二次交换1,0(注意数组此时是初始值),并执行perm(a, 1, 3), 执行完再次交换1,0,数组此时又恢复成初始值。 第三次交换2,0,并执行perm(a, 1, 3),执行完成后交换2,0,数组恢复成初始值。
也就是说,从功能上看,首先确定第0个位置,然后调用perm(a, 1, 3)输出从1开始的排列,这样就可以输出所有排列。而第0个位置可能的值为a[0], a[1],a[2],这通过交换来保证第0个位置可能出现的值,记得每次交换后要恢复初始值。
如数组a={1,2,3},则程序运行输出结果为:1 2 3 ,1 3 2 ,2 1 3 ,2 3 1 ,3 2 1 ,3 1 2 。即先输出以1为排列第一个值的排列,而后是2和3为第一个值的排列。
2.5)组合算法
组合算法也可以用递归实现,只是它的原理跟0-1背包问题类似。即要么选要么不选,注意不能选重复的数。完整代码如下:
1 #include<iostream> 2 using namespace std; 3 #define N 3 //数组大小为3 4 int select[N] = {0}; //选择数组,用于存储数组哪些数字被选中。 5 /*输出数组中选中的数*/ 6 void output(int a[], int n) 7 { 8 for (int i=0; i<n; i++) { 9 if (select[i]) 10 cout << a[i] << " "; 11 } 12 cout << endl; 13 } 14 /*数组a从位置i开始选取k个数*/ 15 void combination(int a[], int i, int k) 16 { 17 if (i > N) return; //位置超出数组范围直接返回,否则非法访问会出段错误 18 if (k == 0) { //选取完了,输出选取的数字 19 output(a, N); 20 } else { 21 select[i] = 1; 22 combination(a, i+1, k-1); //第i个数字被选取,从后续i+1开始选取k-1个数 23 select[i] = 0; 24 combination(a, i+1, k); //第i个数字不选,则从后续i+1位置开始还要选取k个数 25 } 26 } 27 28 /*组合主函数,包括选取1到n个数字*/ 29 void combination_helper(int a[], int n) { 30 for (int k=1; k<=n; k++) { 31 combination(a, 0, k); 32 } 33 } 34 35 int main() 36 { 37 int a[N] = {1, 2, 3}; 38 combination_helper(a, N); 39 return 0; 40 }
2.6) 逆序打印字符串
这个比较简单,代码如下:
1 void printReverse(const char *str) { 2 if (!*str) 3 return; 4 printReverse(str + 1); 5 putchar(*str); 6 }
3 多说一句
对递归有兴趣的,还可以看看这篇文章,用递归实现链表逆序。
参考资料
- 宋劲松《Linux C编程》递归章节