zoukankan      html  css  js  c++  java
  • “《编程珠玑》(第2版)第8章”:连续子向量的最大和(扫描算法)

      问题是这样子的:

      输入是具有n个浮点数的向量x,输出是输入向量的任何子向量中的最大和。

      本文部分参考自一博文

      对于这道题,作者给出了总共4种不同方法:

      1. 直接解法

      最直接的方式是遍历所有可能的连续子向量,用i和j分别表示向量的首元和最后的尾元,k表示真实的尾元:

     1 int maxsum1(int * arr, int len)
     2 {
     3     assert(len > 0);
     4     int maxsofar = 0;
     5     int sum = 0;
     6     for (int i = 0; i < len; i++)
     7     {
     8         for (int j = i; j < len; j++)
     9         {
    10             sum = 0;
    11             for (int k = i; k < j + 1; k++)
    12             {
    13                 sum += *(arr + k);
    14             }
    15             maxsofar = max(maxsofar, sum);
    16         }
    17     }
    18     return maxsofar;
    19 }

      2. O(n2)的解法

      第1种方法的代码具有显而易见的浪费:对于一个子序列可能重复计算了多次。并且具有O(n3)的时间复杂度。其实k是多余的,依靠首尾两个变量i、j足以表示一个子向量。同时,j增长时,可以直接使用上一次的计算和与新增元素相加。因此改写为:

     1 int maxsum2(int * arr, int len)
     2 {
     3     assert(len > 0);
     4     int maxsofar = 0;
     5     int sum = 0;
     6     for (int i = 0; i < len; i++)
     7     {
     8         sum = 0;
     9         for (int j = i; j < len; j++)
    10         {
    11             sum += *(arr + j);
    12             maxsofar = max(maxsofar, sum);
    13         }
    14     }
    15     return maxsofar;
    16 }

      另外一方面,由这个避免重复计算累加和的角度出发,构造一个累加和数组cumarr,cumarr[i]表示array[0...i]各个数的累加和,这样,array[i...j]的和就可以用cumarr[j]-cumarr[i-1]来表示了。考虑到边界值,令cumarr[-1]=0。在C/C++中的做法是令cumarr指向一个数组的第1个元素,cumarr = recumarr +1。有了cumarr[]就可以遍历所有的i、j来求最大值了:

     1 int maxsum3(int * arr, int len)
     2 {
     3     assert(len > 0);
     4     int maxsofar = 0;
     5     int sum = 0;
     6     int * cumarr = new int[len + 1];
     7     cumarr[0] = 0;
     8     for (int i = 0; i < len; i++)
     9     {
    10         cumarr[i + 1] = cumarr[i] + *(arr + i);
    11     }
    12 
    13     for (int i = 0; i < len; i++)
    14     {
    15         for (int j = i; j < len; j++)
    16         {
    17             sum = cumarr[j + 1] - cumarr[i];
    18             maxsofar = max(maxsofar, sum);
    19         }
    20     }
    21 
    22     delete cumarr;
    23     return maxsofar;
    24 }

      虽然这个累加和数组的解法与后面两个相比,时间复杂度远不是最优的,然而这种数据结构很有用。

      累积表这种想法值得注意!

      3. 分治法(nlogn)

      分治法的基本思想是,把n个元素的向量分成两个n/2的子向量,递归地解决问题再把答案合并。

      分容易,合并就要花点心思了。因为对于初始大小为n的向量,它的最大连续子向量可能整体在分成的两个子向量中之一,也可能跨越了两个子向量。每次合并都需要计算这个跨越分界点的最大连续子向量,占据了很大的开销。

     1 int maxsum4(int * arr, int len)
     2 {
     3     assert(len > 0);
     4     int maxsofar = 0;
     5     if (len == 1)
     6     {
     7         maxsofar = arr[0];
     8     }
     9     else
    10     {
    11         int sum = 0;
    12         int l = 0;
    13         int u = len - 1;
    14         int m = (l + u) / 2;
    15 
    16         // find max crossing to left
    17         int lmax = 0;
    18         for (int i = m; i >= 0; i--)
    19         {
    20             sum += *(arr + i);
    21             lmax = max(lmax, sum);
    22         }
    23 
    24         // find max crossing to right
    25         int rmax = 0;
    26         sum = 0;
    27         for (int i = m + 1; i <= u; i++)
    28         {
    29             sum += *(arr + i);
    30             rmax = max(rmax, sum);
    31         }
    32 
    33         maxsofar = max(lmax + rmax, maxsum4(arr, m + 1), maxsum4(arr + m + 1, u - m));
    34     }
    35 
    36     return maxsofar;
    37 }

      延伸:分治法的最坏情况讨论

      根据合并过程,如果每次的最长子向量都恰好位于边界,即下图中灰色部分,两者其中之一:

      

      结果导致每次合并时都重复计算了在左边和右边的最长子向量,相当的浪费。解决方法是返回值中给出边界,如果边界在分界点上,合并时就不需要重复计算了。

      4. 扫描算法

      从头到尾扫描数组,扫描至array[i]时,可能的最长子向量有两种情况:要么在前i-1个元素中,要么以i结尾。前者的大小记为maxsofar,后者记为maxendinghere。

     1 int maxsum5(int * arr, int len)
     2 {
     3     assert(len > 0);
     4     int maxsofar = 0;
     5     int maxendinghere = 0;
     6     for (int i = 0; i < len; i++)
     7     {
     8         maxendinghere = max(maxendinghere + *(arr + i), 0);
     9         maxsofar = max(maxsofar, maxendinghere);
    10     }
    11     return maxsofar;
    12 }

      这个算法可以看做是动态规划,把长度为n的数组化成了递归的子结构,并从首开始扫描求解。时间复杂度只有O(n)。

      注:直到最近做到LeetCode的题目,才发现这个扫描算法并不适用于存在负数的数组。对于存在负数的数组,可用下述解法:

     1     int maxSubArray(vector<int>& nums) {
     2         int sz = nums.size();
     3         if(sz == 0)
     4             return 0;
     5             
     6         int maxsofar = INT_MIN;
     7         int sum = 0;
     8         for(int i = 0; i < sz; i++)
     9         {
    10             sum += nums[i];
    11             if(sum > maxsofar)
    12                 maxsofar = sum;
    13             if(sum < 0)
    14                 sum = 0;
    15         }
    16         
    17         return maxsofar;
    18     }

      

      同样的,利用该算法,我们还可以求总共最小的连续子向量:

     1 int minsum(int * arr, int len)
     2 {
     3     assert(len > 0);
     4     int minsofar = 0;
     5     int minendinghere = 0;
     6     for (int i = 0; i < len; i++)
     7     {
     8         minendinghere = min(minendinghere + *(arr + i), 0);
     9         minsofar = min(minsofar, minendinghere);
    10     }
    11 
    12     return minsofar;
    13 }

      

      附整个程序:

      1 #include <iostream>
      2 #include <stdlib.h>
      3 #include <cassert>
      4 using namespace std;
      5 
      6 int max(int a, int b);
      7 int max(int a, int b, int c);
      8 int min(int a, int b);
      9 
     10 int maxsum1(int * arr, int len);
     11 int maxsum2(int * arr, int len);
     12 int maxsum3(int * arr, int len);
     13 int maxsum4(int * arr, int len);
     14 int maxsum5(int * arr, int len);
     15 
     16 int minsum(int * arr, int len);
     17 
     18 int main()
     19 {
     20     int arr[8] = {5, -2, -3, 4, -2, -8, 10, -5};
     21     int len = sizeof(arr) / sizeof(int);
     22 
     23     int maxsofar1 = maxsum1(arr, len);
     24     cout << "Maxsofar1 = " << maxsofar1 << endl;
     25 
     26     int maxsofar2 = maxsum2(arr, len);
     27     cout << "Maxsofar2 = " << maxsofar2 << endl;
     28 
     29     int maxsofar3 = maxsum3(arr, len);
     30     cout << "Maxsofar3 = " << maxsofar3 << endl;
     31 
     32     int maxsofar4 = maxsum4(arr, len);
     33     cout << "Maxsofar4 = " << maxsofar4 << endl;
     34 
     35     int maxsofar5 = maxsum5(arr, len);
     36     cout << "Maxsofar5 = " << maxsofar5 << endl;
     37 
     38     int minsofar = minsum(arr, len);
     39     cout << "Minsofar = " << minsofar << endl;
     40 
     41     return 0;
     42 }
     43 
     44 int max(int a, int b)
     45 {
     46     return (a > b) ? a : b;
     47 }
     48 
     49 int max(int a, int b, int c)
     50 {
     51     int temp = max(a, b);
     52     return (temp > c) ? temp : c;
     53 }
     54 
     55 int min(int a, int b)
     56 {
     57     return (a < b) ? a : b;
     58 }
     59 
     60 int maxsum1(int * arr, int len)
     61 {
     62     assert(len > 0);
     63     int maxsofar = 0;
     64     int sum = 0;
     65     for (int i = 0; i < len; i++)
     66     {
     67         for (int j = i; j < len; j++)
     68         {
     69             sum = 0;
     70             for (int k = i; k < j + 1; k++)
     71             {
     72                 sum += *(arr + k);
     73             }
     74             maxsofar = max(maxsofar, sum);
     75         }
     76     }
     77     return maxsofar;
     78 }
     79 
     80 int maxsum2(int * arr, int len)
     81 {
     82     assert(len > 0);
     83     int maxsofar = 0;
     84     int sum = 0;
     85     for (int i = 0; i < len; i++)
     86     {
     87         sum = 0;
     88         for (int j = i; j < len; j++)
     89         {
     90             sum += *(arr + j);
     91             maxsofar = max(maxsofar, sum);
     92         }
     93     }
     94     return maxsofar;
     95 }
     96 
     97 int maxsum3(int * arr, int len)
     98 {
     99     assert(len > 0);
    100     int maxsofar = 0;
    101     int sum = 0;
    102     int * cumarr = new int[len + 1];
    103     cumarr[0] = 0;
    104     for (int i = 0; i < len; i++)
    105     {
    106         cumarr[i + 1] = cumarr[i] + *(arr + i);
    107     }
    108 
    109     for (int i = 0; i < len; i++)
    110     {
    111         for (int j = i; j < len; j++)
    112         {
    113             sum = cumarr[j + 1] - cumarr[i];
    114             maxsofar = max(maxsofar, sum);
    115         }
    116     }
    117 
    118     delete cumarr;
    119     return maxsofar;
    120 }
    121 
    122 int maxsum4(int * arr, int len)
    123 {
    124     assert(len > 0);
    125     int maxsofar = 0;
    126     if (len == 1)
    127     {
    128         maxsofar = arr[0];
    129     }
    130     else
    131     {
    132         int sum = 0;
    133         int l = 0;
    134         int u = len - 1;
    135         int m = (l + u) / 2;
    136 
    137         // find max crossing to left
    138         int lmax = 0;
    139         for (int i = m; i >= 0; i--)
    140         {
    141             sum += *(arr + i);
    142             lmax = max(lmax, sum);
    143         }
    144 
    145         // find max crossing to right
    146         int rmax = 0;
    147         sum = 0;
    148         for (int i = m + 1; i <= u; i++)
    149         {
    150             sum += *(arr + i);
    151             rmax = max(rmax, sum);
    152         }
    153 
    154         maxsofar = max(lmax + rmax, maxsum4(arr, m + 1), maxsum4(arr + m + 1, u - m));
    155     }
    156 
    157     return maxsofar;
    158 }
    159 
    160 int maxsum5(int * arr, int len)
    161 {
    162     assert(len > 0);
    163     int maxsofar = 0;
    164     int maxendinghere = 0;
    165     for (int i = 0; i < len; i++)
    166     {
    167         maxendinghere = max(maxendinghere + *(arr + i), 0);
    168         maxsofar = max(maxsofar, maxendinghere);
    169     }
    170     return maxsofar;
    171 }
    172 
    173 int minsum(int * arr, int len)
    174 {
    175     assert(len > 0);
    176     int minsofar = 0;
    177     int minendinghere = 0;
    178     for (int i = 0; i < len; i++)
    179     {
    180         minendinghere = min(minendinghere + *(arr + i), 0);
    181         minsofar = min(minsofar, minendinghere);
    182     }
    183 
    184     return minsofar;
    185 }
    View Code

     课后相关习题

      10. 假设我们想要查找的是总和最接近0的子向量,而不是具有最大总和的子向量。你能设计出的最有效的算法是什么?可以应用哪些算法设计技术?如果我们希望查找总和最接近某一给定实数t的子向量,结果又将怎样?

      法一:利用累积表。我们定义cumarr[i]=arr[0]+arr[0]+...+arr[i]。如果有arr[l]=arr[u](l != u),则l..u之间的元素(不包括第l、u元素)总和为0。这个就也能够拓展到查找总和接近某一给定实数t的子向量。

      法二:如果我们不考虑子向量一定要连续这个要求,我们可以先将原向量按升序进行排序,再求cumarr向量。如果cumarr[i]=0,则表示0..i(包括第0、i元素)为所求子向量。这个同样也能够拓展到查找总和接近某一给定实数t的子向量。

       注:此题若用扫描算法来解决,问题比较多。

      13. 在最大子数组问题中,给定n*n的实数数组,我们需要求出矩形子数组的最大总和。该问题的复杂度如何?

      个人觉得很简单的就是把二维的降为一维的。如果是要求连续子向量,按照扫描算法就可以做到;如果不要求连续,则先按降序进行排序,很快就能够求出最大总和的子向量。

  • 相关阅读:
    基于密度的dbScan轨迹聚类
    更新yum 源
    搭建git linux 服务器
    富文本编辑器
    轨迹聚类分析问题
    hdu3078(lca / RMQ在线)
    zoj3195(lca / RMQ在线)
    hdu2874(lca / tarjan离线 + RMQ在线)
    hdu2586(lca模板 / tarjan离线 + RMQ在线)
    高斯消元求解方程组(模板)
  • 原文地址:https://www.cnblogs.com/xiehongfeng100/p/4385535.html
Copyright © 2011-2022 走看看