zoukankan      html  css  js  c++  java
  • 分治算法详解及经典例题

    一、基本概念

        在计算机科学中,分治法是一种很重要的算法。字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础,如排序算法(快速排序,归并排序),傅立叶变换(快速傅立叶变换)……

        任何一个可以用计算机求解的问题所需的计算时间都与其规模有关。问题的规模越小,越容易直接求解,解题所需的计算时间也越少。例如,对于n个元素的排序问题,当n=1时,不需任何计算。n=2时,只要作一次比较即可排好序。n=3时只要作3次比较即可,…。而当n较大时,问题就不那么容易处理了。要想直接解决一个规模较大的问题,有时是相当困难的。

    二、基本思想及策略

        分治法的设计思想是:将一个难以直接解决的大问题,分割成一些规模较小的相同问题,以便各个击破,分而治之。

        分治策略是:对于一个规模为n的问题,若该问题可以容易地解决(比如说规模n较小)则直接解决,否则将其分解为k个规模较小的子问题,这些子问题互相独立且与原问题形式相同,递归地解这些子问题,然后将各子问题的解合并得到原问题的解。这种算法设计策略叫做分治法。

        如果原问题可分割成k个子问题,1<k≤n,且这些子问题都可解并可利用这些子问题的解求出原问题的解,那么这种分治法就是可行的。由分治法产生的子问题往往是原问题的较小模式,这就为使用递归技术提供了方便。在这种情况下,反复应用分治手段,可以使子问题与原问题类型一致而其规模却不断缩小,最终使子问题缩小到很容易直接求出其解。这自然导致递归过程的产生。分治与递归像一对孪生兄弟,经常同时应用在算法设计之中,并由此产生许多高效算法。

    三、分治法适用的情况

    分治法所能解决的问题一般具有以下几个特征:

    1) 该问题的规模缩小到一定的程度就可以容易地解决

    2) 该问题可以分解为若干个规模较小的相同问题,即该问题具有最优子结构性质。

    3) 利用该问题分解出的子问题的解可以合并为该问题的解;

    4) 该问题所分解出的各个子问题是相互独立的,即子问题之间不包含公共的子子问题。

    第一条特征是绝大多数问题都可以满足的,因为问题的计算复杂性一般是随着问题规模的增加而增加;

    第二条特征是应用分治法的前提它也是大多数问题可以满足的,此特征反映了递归思想的应用;、

    第三条特征是关键,能否利用分治法完全取决于问题是否具有第三条特征,如果具备了第一条和第二条特征,而不具备第三条特征,则可以考虑用贪心法或动态规划法。

    第四条特征涉及到分治法的效率,如果各子问题是不独立的则分治法要做许多不必要的工作,重复地解公共的子问题,此时虽然可用分治法,但一般用动态规划法较好。

    四、可使用分治法求解的一些经典问题

    (1)二分搜索
    (2)大整数乘法
    (3)Strassen矩阵乘法
    (4)棋盘覆盖
    (5)合并排序
    (6)快速排序
    (7)线性时间选择
    (8)最接近点对问题
    (9)循环赛日程表
    (10)汉诺塔
     

    五、分治法的基本步骤

    分治法在每一层递归上都有三个步骤:

    step1 分解:将原问题分解为若干个规模较小,相互独立,与原问题形式相同的子问题;

    step2 解决:若子问题规模较小而容易被解决则直接解,否则递归地解各个子问题

    step3 合并:将各个子问题的解合并为原问题的解。

    它的一般的算法设计模式如下:

    Divide-and-Conquer(P)

    1. if |P|≤n0

    2. then return(ADHOC(P))

    3. 将P分解为较小的子问题 P1 ,P2 ,…,Pk

    4. for i←1 to k

    5. do yi ← Divide-and-Conquer(Pi) △ 递归解决Pi

    6. T ← MERGE(y1,y2,…,yk) △ 合并子问题

    7. return(T)

        其中|P|表示问题P的规模;n0为一阈值,表示当问题P的规模不超过n0时,问题已容易直接解出,不必再继续分解。ADHOC(P)是该分治法中的基本子算法,用于直接解小规模的问题P。因此,当P的规模不超过n0时直接用算法ADHOC(P)求解。算法MERGE(y1,y2,…,yk)是该分治法中的合并子算法,用于将P的子问题P1 ,P2 ,…,Pk的相应的解y1,y2,…,yk合并为P的解。

    六、分治法的复杂性分析

       一个分治法将规模为n的问题分成k个规模为n/m的子问题去解。设分解阀值n0=1,且adhoc解规模为1的问题耗费1个单位时间。再设将原问题分解为k个子问题以及用merge将k个子问题的解合并为原问题的解需用f(n)个单位时间。用T(n)表示该分治法解规模为|P|=n的问题所需的计算时间,则有:

    T(n)= k T(n/m)+f(n)

    通过迭代法求得方程的解

    七、依据分治法设计程序时的思维过程

    实际上就是类似于数学归纳法,找到解决本问题的求解方程公式,然后根据方程公式设计递归程序。
    1、一定是先找到最小问题规模时的求解方法
    2、然后考虑随着问题规模增大时的求解方法
    3、找到求解的递归函数式后(各种规模或因子),设计递归程序即可。

    八、算法举例

    (1)二分查找

    二分查找也是典型的分治算法的有应用。二分查找需要一个默认的前提,那就是查找的数列是有序的。 
    二分查找的思路比较简单: 
    1) 选择一个标志i将集合分为二个子集合 
    2) 判断标志L(i)是否能与要查找的值des相等,相等则直接返回 
    3) 否则判断L(i)与des的大小 
    4) 基于判断的结果决定下步是向左查找还是向右查找 
    5) 递归记性上面的步骤

     

    (2)输油管道问题

    解题思路 
    本题目可以分为两个步骤: 

      1、找出主管道的位置; 
      2、根据主管道的位置,计算各个油井到主管道的长度之和。

    根据题意,设主管道贯穿东西,与y 轴平行。而各个子油井则分布在主输油管道的上下两侧。如下图:

    由上图,其实只需要确定主管道的y 坐标,而与各个子油井的x 坐标无关!

    根据猜测,易知:主管道的y 坐标就是所有子油井y 坐标的中位数。(可以用平面几何知识证明,略)

    求中位数的方法可以用排序后取a[(left+right)/2],当然更推荐用书上的线性时间选择算法解决。记求得的主管道为Ym,

    最后要输出的结果只需要计算,每个油井与中位数的差值之和。

    #include <stdio.h> 
    
    #include <stdlib.h> 
    
    void swap(int &a,int &b)
    
    { 
     int tmp = a; 
    
            a = b;  
    
            b = tmp; 
    
    }
    
     //(此处的划分就体现了分治的思想)本函数求arr[p:q]的一个划分i,使arr[p:i-1]都小于arr[i],arr[i+1,q]都大于arr[i]
    
    int partition(int *arr,int p,int q) { 
    
       int index = p-1,
    
        start = p,
    
        base = arr[q];
    
      for(;start<q;start++)  { 
          if(arr[start]<=base) {
    
            swap(arr[start],arr[++index]);
    
          }
    
        }
    
        swap(arr[++index],arr[q]);
        return index;
    
    }
    
     
    
    //快速排序
    
    void qsort (int *arr,int p ,int q) {
    
      if (p<=q) {
    
        int pos = partition(arr,p,q);
    
        qsort(arr,p,pos-1);
    
        qsort(arr,pos+1,q);
    
       }
    
    }
    
    int arr[1000];
    
    int main() {
    
      int n;
    
      while(scanf("%d",&n)!=EOF){
    
        for(int i=0;i<n;i++){
    
          scanf("%d %d",&arr[i],&arr[i]);
    
        }
    
        qsort(arr,0,n-1);
    
        long long sum = 0;
    
        int mid = arr[n/2];
    
        for(int i=0;i<n;i++){
    
          sum+=abs(mid - arr[i]);
    
        }
    
        printf("%I64d
    ",sum);
    
      }
    
    return 0;
    
    }

     说明:类似的还有邮局选址问题:与之类似,这次是要找出在居民点中邮局的最佳位置。很容易想到,这次不仅要确定y的坐标,还要确定x的坐标。当然均为其对应坐标的中位数;最终的计算结果,要求距离之和,即向量模的计算方法加和即可。

     (3)集合的划分

    F(n,m)表示把n个元素的集合分为m个子集,有多少种分法?

    n个元素的集合可以划为F(n,m)个不同的由m个非空子集组成的集合。

    考虑3个元素的集合,可划分为:

    ① 1个子集的集合:{ {1,2,3} }

    ② 2个子集的集合:{{1,2} ,{3}}  ,  {{1,3},{2}}  ,  {{2,3},{1}}

    ③ 3个子集的集合:{{1},{2},{3}}

    所以 F(3,1)=1

       F(3,2)=3

       F(3,3)=1

     如果要求F(4,2)该怎么办呢?

    A.往①里添加一个元素 {4} ,得到{{1,2,3},{4}}

    B.往②里的任意一个子集添一个4,得到

    {{1,2,4},{3}}  ,  {{1,2},{3,4}}

    {{1,3,4},{2}}  ,  {{1,3},{2,4}}

    {{2,3,4},{1}}  ,  {{2,3},{1,4}}

    所以F(4,2) = F(3,1)+2*F(3,2) = 7

    以此推广得,F(n,m) =  F (n-1,m-1)+ m * F(n-1,m)

    #include <stdio.h>
    
    long long divide( int  n,int  m) {
    
      if (m==1 || m ==n){
    
        return 1;
      }else{
    
        return divide(n-1,m-1)+m*divide(n-1,m);
      }
    
    }
    
    int main(){
    
      int  n,m;
    
      while (scanf("%d%d",&n,&m) != EOF){
    
        printf("%I64d
    ",divide(n,m));
      }
    
      return 0;
    
    }

    (4)求复杂度为O(lg n)的X的 n 次幂

    #include "stdio.h"
    #include "stdlib.h"
    
    int power(int x, int n)
    {
        int result;
        if(n == 1)
            return x;
        if( n % 2 == 0)
            result = power(x, n/2) * power(x, n / 2);
        else
            result = power(x, (n+1) / 2) * power(x, (n-1) / 2);
    
        return result;
    }
    
    int main()
    {
        int x = 5;
        int n = 3;
    
        printf("power(%d,%d) = %d 
    ",x, n, power(x, n));
    }

    (5)二路归并排序

    描述:
    时间复杂度是O(NlogN),空间复制度为O(N)(归并排序的最大缺陷)
    归并排序(Merge Sort)完全遵循上述分治法三个步骤:
    1、分解:将要排序的n个元素的序列分解成两个具有n/2个元素的子序列;
    2、解决:使用归并排序分别递归地排序两个子序列;
    3、合并:合并两个已排序的子序列,产生原问题的解。

    数组代码实现:

    #include "stdio.h"
    #include "stdlib.h"
    #include "assert.h"
    #include "string.h"
    
    void print_arr(int *arr, int len)
    {
        int i = 0;
    
        for(i = 0; i < len; i ++)
            printf("%d ",arr[i]);
        printf("
    ");
    }
    
    void merge(int *arr, int low, int mid, int hight, int *tmp)
    {
        assert(arr && low >= 0 && low <= mid && mid <= hight);
    
    
        int i = low;
        int j = mid + 1;
        int index = 0;
    
        while(i <= mid && j <= hight)
        {
            if(arr[i] <= arr[j])
                tmp[index++] = arr[i++];
            else
                tmp[index++] = arr[j++];
        }
    
        while(i <= mid) //拷贝剩下的左半部分
            tmp[index++] = arr[i++];
    
        while(j <= hight) //拷贝剩下的右半部分
            tmp[index++] = arr[j++];
    
    
        memcpy((void *)(arr + low), (void *)tmp, (hight - low + 1) * sizeof(int));
    
    
    
    }
    
    void mergesort(int *arr, int low, int hight, int *tmp)
    {
        assert(arr && low >= 0);
        int mid;
        if(low < hight)
        {
            mid = (hight + low) >> 1;
            mergesort(arr, low, mid,tmp);
            mergesort(arr, mid + 1, hight,tmp);
            merge(arr, low, mid, hight,tmp);
        }
    }
    //只分配一次内存,避免内存操作开销
    void mergesort_drive(int *arr, int len)
    {
        int *tmp = (int *)malloc(len * sizeof(int));
        if(!tmp)
        {
            printf("out of memory
    ");
            exit(0);
        }
    
        mergesort(arr, 0, len - 1, tmp);
    
        free(tmp);
    }
    
    int main()
    {
        int data[10]={8,7,2,6,9,10,3,4,5,1};
    
        int len = sizeof(data)/sizeof(data[0]);
        mergesort_drive(data, len);
        print_arr(data,len);
    
        return 0;
    }

    (6)整数划分问题

    /*
    整数划分问题
    :将一个整数划分为若干个数相加
    例子:
    整数4 最大加数 4
    4=4
    1+3=4
    1+1+2=4
    2+2=4
    1+1+1+1=4
    一共五种划分方案
    注意:1+3=4,3+1=4被认为是同一种划分方案
    */
    
    #include<stdio.h>
    int q(int n,int m)//n表示需要划分的数字,m表示最大的加数不超过m
    {
        if(m==1||n==1)//只要存在一个为1,那么划分的方法数肯定只有一种,那就是n个1相加
        {
            return 1;
        }else if(n==m&&n>1)//二者相等且大于1的时候,问题等价于:q(n,n-1)+1;意味着将最大加数减一之后n的划分数,然后加一,最后面那个一代表的是:0+n,这个划分的方案
        {
            return q(n,n-1)+1;
        }else if(n<m)//如果m>n,那么令m=n就ok,因为最大加数在逻辑上不可能超过n
        {
            return q(n,n);
        }else if(n>m)
        {
            return q(n,m-1)+q(n-m,m);//分为两种:划分方案没有m的情况+划分方案有m的情况
        }
        return 0;
    }
    int main()
    {
        printf("请输入需要划分的数字和最大家数:
    ");
        int n,m;
        scanf("%d %d",&n,&m);
        int r=q(n,m);
        printf("%d
    ",r);
        return 0;
    }

    给你一个数,问你所有的划分方式,比如4,4=1+3,4=1+1+2,4=2+2,4=1+1+1+1

    我们来分析一下,我们想用分治的话,就要找子问题,假设n是要划分的数,m说最大的加数,n=4,m=3

    分解成两类的子问题,一个是:一个是有m的情况,一个是没有m的情况,然后将有m的情况继续划分,分

    解成有m-1和没有m-1的情况,一直划分下去,直到m=1。比如n=4,m=3,划分成的子问题:有3,无

    3,有2,无2,有1,无1(没有意义,除非0+4=4),将这些子问题合并起来大问题就解决了。

    九、总结   

        分治算法的一个核心在于子问题的规模大小是否接近,如果接近则算法效率较高。

        分治算法和动态规划都是解决子问题,然后对解进行合并;但是分治算法是寻找远小于原问题的子问题(因为对于计算机来说计算小数据的问题还是很快的),同时分治算法的效率并不一定好,而动态规划的效率取决于子问题的个数的多少,子问题的个数远小于子问题的总数的情况下(也就是重复子问题多),算法才会很高效。

  • 相关阅读:
    python算法:嵌套数组转变成一维数组
    python算法:约瑟夫问题
    python的加密算法(1):反转加密
    算法:桶排序
    正则表达式学习(3):相关符号解释
    代码这样写更优雅(1)
    正则表达式学习(2)
    神奇的Bank系统之旅哦
    C#之第五单元的项目打印购物单
    C#语言的基础
  • 原文地址:https://www.cnblogs.com/chihaoyuIsnotHere/p/10129475.html
Copyright © 2011-2022 走看看