zoukankan      html  css  js  c++  java
  • 最大二位子数组和问题(homework-02)

      前面已经谈过最大一维子数组和问题,这里面扩展到二维。

    一. 常规情况

    一个矩形的数组,找到一个矩形的子数组有最大的元素和,求这个和。

      1. 从朴素算法入手,枚举矩形数组的4个顶点,以此计算其数组和。同样,时间复杂度很大,我们仅以此入手逐步优化。

    2. 参照一维数组的思路,保存中间结果,利用动态规划优化算法。优化点就是子数组求和一处,二维数组的求和不同于一维,但是仍然能找到方法:

    先声明这个方法是参考《编程之美》书中的讲解的,鄙人大脑迟钝,尚无法独创:

    令二维数组的起点不是0,而是1,使用PS[i][j]表示以[0][0], [i][0], [0][j], [i][j]四个顶点围起来的子数组和,边界上的PS[*][0]和PS[0][*]全置零。则有:

    PS[i][j] = PS[i - 1][j] + PS[i][j - 1] - PS[i - 1][j - 1] + A[i][j]

    其中,A为整个二维数组,Row_num, Clm_num分别为数组行数、列数。

    void cal_PS(){
        int i, j;
        for (i = 0; i <= Row_num; i++){
            PS[i][0] = 0;
        }
        for (j = 0; j <= Clm_num; j++){
            PS[0][j] = 0;
        }
        for (i = 1; i <= Row_num; i++){
            for (j = 1; j <= Clm_num; j++){
                PS[i][j] = PS[i - 1][j] + PS[i][j - 1] - PS[i - 1][j - 1] + A[i][j];
            }
        }
    }

    上面的函数处理了部分和,这部分时间复杂度O(Row_num2 * Clm_num2).

    3. 有了部分和,下面寻找最大和的数组。我们的核心思路是把未知问题归结到已知的一维问题上。即,首先循环二维子数组数组的上下界,在每个上下界确定的情况下,用一维数组的方法确定其左右边界。形象一点说,就是先假定数组上下界已知,然后把每一列上的元素压扁,变成一维的。BC(a, c, j)就是a, c两行之间第j列元素加在一起的和。

                      核心代码如下:

     1 int MaxSum_mode1(int isCalled){
     2     if(isCalled == 0){ //有时候不需要读取文件,见后文
     3         readArray(file);
     4         cal_PS();
     5     }
     6     int maximum = -2147483648;
     7     int Start, All;
     8     for (int a = 1; a <= Row_num; a++){//起始行
     9         for (int c = a; c <= Row_num; c++){ //终结行
    10             Start = BC(a, c, Clm_num); //下面就是阐述的算法
    11             All = Start;
    12             for (int i = Clm_num - 1; i >= 1; i--){
    13                 if(Start < 0)
    14                     Start = 0;
    15                 Start += BC(a, c, i);
    16                 if(Start > All)
    17                     All = Start;
    18             }
    19             if(All > maximum)
    20                 maximum = All;
    21         }
    22     }
    23     return maximum;
    24 }

    至此,我们完成了新问题的求解和优化,时间复杂度 O(Row_num2 * Clm_num)

    下面的动图展示了BS扫描的部分,左上角表示当前的All值:

     二. 拓展模式

    这里面我们进行两种拓展:二维数组水平方向收尾相接成环,和竖直方向相接成环。

      1. /h 模式,水平成环

    冷静的分析这种拓展造成了什么不同,我们发现拓展之后,问题仅是原始问题+新情况而已。如果最大和子数组不是跨越边界拼接在一起的情况,那就和上面的老问题相同;另一种情况就是,最大和子数组是跨越边界拼接在一起的。这种情况,即子数组分为A[1][*]~A[i][*], A[j][*]~A[Clm_num-1][*]两段,跨越边界接在一起。其中A[1][*],A[Clm_num-1[*] 分别是数组的左右边界那列。

    换一句话说,假设a,c上下界已经固定,第二种情况就是从全局内剔除中间一段留下两边。被剔除的要求和小于0,且最小。接下来的问题就转化为求中间部分的子数组的最小值了。故,分两种情况讨论,取大值为最终答案。第二种情况就是修改第一种情况而来。注意求和部分。

     1 int MaxSum_mode3(int isCalled){ // /h
     2     if(isCalled == 0){
     3         readArray(file);
     4         cal_PS();
     5     }
     6     int MaxSum_noJump = MaxSum_mode1(1); // 不跨越的和最大子数组
     7     int MaxSum_Jump; //跨越的和最大子数组
     8     
     9     int minimum = 2147483647;
    10     int Start, All;
    11     int WholeSum = 0;
    12     int tmpSum = 0;
    13     for (int a = 1; a <= Row_num; a++){//起始行
    14         for (int c = a; c <= Row_num; c++){ //终结行
    15             tmpSum = 0;
    16             Start = BC(a, c, Clm_num - 1);
    17             All = Start;
    18             for (int i = Clm_num - 2; i > 1; i--){
    19                 if(Start > 0)
    20                     Start = 0;
    21                 Start += BC(a, c, i);
    22                 if(Start < All)
    23                     All = Start;
    24                 tmpSum += BC(a, c, i);//累加去除头尾后的 中间元素的和
    25             }
    26             if(All <= minimum){
    27                 int newSum = tmpSum + BC(a, c, 1) + BC(a, c, Clm_num) + BC(a, c, Clm_num - 1);
    28                 if (newSum - All > WholeSum - minimum){
    29                     minimum = All;
    30                     WholeSum = newSum; //当找到更小的 中间元素的和,重新算a,c两行之间全部元素的和
    31                 }
    32             }
    33         }
    34     }
    35     MaxSum_Jump = WholeSum - minimum; //有跨越情况,子数组分头尾两半。两半的和等于全部元素和 减 中间踢出去的元素和的小于零的最小值
    36     return MaxSum_noJump > MaxSum_Jump ? MaxSum_noJump : MaxSum_Jump;
    37 }

    下面的动图展示了BS扫描的步骤。左上角显示的是All的值:  

    2. /v 模式,竖直成环。

    到目前,我们一直坚守“归结法”的思想,在简单问题找到优化解法后,将新问题化归到老问题,同样,/v的情况也不例外。在读取文件时,我们将数组存储成与前面沿对角线对称的形式,就可以利用水平成环的解法而不做任何改动。因为调换后的新数组的水平方向就是原来的竖直方向。下面只需要展示读文件存数组时的步骤即可:

    1 for (i = 1; i <= Row_num; i++){
    2         for (j = 1; j <= Clm_num; j++){
    3             A[i][j] = fgint(file);           //这里仅需换成A[j][i]即可
    4         }
    5     }

       3. /h /v 模式,将二维数组变成轮胎形状。

    这个笔者确实想了很久。受前面启发,依旧分情况讨论,以运用归结法化简。轮胎形状,首先考虑最大子数组不是竖直、水平均跨越的情况,细分为3种情况,即前文三种情况。第四种情况我们专门来讨论,即最大和子数组两个方向均跨越。数组的形状就是二维数组的四个角。

    这里我们的思路是,仿照前面的思路,a表示左上、右上两块子数组的下界,c表示下面两块子数组的上届,在假定a,c已知的情况下,在原数组中删去a, c之间的行,新的子数组将被接成上下连续、左右分开的形状,这正好是之前处理过的水平相接成环的情况。因此,这部分的代码为:

     1 int MaxSum_mode5(){ // /h /v
     2     readArray();
     3     cal_PS();
     4     int Max_md1 = MaxSum_mode1(1);
     5     int Max_md3 = MaxSum_mode3(1);
     6     int Max_md4 = MaxSum_mode4();
     7     swap(&Clm_num, &Row_num); //  /v情况颠倒了数组,这里还原行、列数目
     8     int Max_md5;
     9 
    10     Max_md5 = -2147483648;
    11     int a, c, tmp = Max_md5;
    12     for (a = 2; a < Row_numB; a++){
    13         for (c = a; c < Row_numB; c++){
    14             makeA(a, c); //删去数组a,c行之间的行(含a, c
    15             tmp = MaxSum_mode3(1);
    16             if (tmp > Max_md5){
    17                 Max_md5 = tmp;
    18             }
    19         }
    20     }
    21     if(Max_md1 > Max_md5)
    22         Max_md5 = Max_md1;
    23     if(Max_md3 > Max_md5)
    24         Max_md5 = Max_md3;
    25     if(Max_md4 > Max_md5)
    26         Max_md5 = Max_md4;
    27     return Max_md5;
    28 }

    三. 以上的总结

    描述在这么多相似的需求面前, 你怎么维护你的设计 (父类/子类/基类, UML, 设计模式,  或者其它方法) 让整个程序的架构不至于崩溃的?

    程序的核心在于算法,因此并未使用面型对象的方法。为使得代码易于维护,且在归结法密集使用的本程序中,我通过将程序模块化增加的扩展性和可维护性。这具体表现在单独功能独自成函数,在能够使用已完成函数的情况下,调用函数而非重写代码。上述从mode1到mode5,后面的模式均使用了前面的模式的代码。

    给出你做单元测试/代码覆盖率的最终覆盖率的报告, 用截屏显示你的代码覆盖率

    首先给出上述各情况的测试截屏。从下图可以看到测试用例、模式和结果。

     

    /h /v的测试,通过调试发现各个情况的值都正确,故可证明程序正确。

    阅读 工程师的能力评估和发展 和相关文章, 在完成作业的时候记录自己花费的时间, 并填下表。如果你对有些术语不太清楚,请查看教材和其它资料。如果你认为你不需要做某个步骤, 那就跳过去。

     

    Personal Software Process Stages

    时间百分比(%)

    实际花费的时间 (分钟)

    原来估计的时间 (分钟)

    Planning

    计划

         

    ·         Estimate

    ·         估计这个任务需要多少时间,把工作细化并大致排序

    230%   700   300

    Development

    开发

         

    ·         Analysis

    ·         需求分析 (包括学习新技术)

     100%  60  60

    ·         Design Spec

    ·         生成设计文档(博客)

     100%  90  90

    ·         Design Review

    ·         设计复审 (和同事审核设计文档)

     0  0  0

    ·         Coding Standard

    ·         代码规范 (制定合适的规范)

     0  0  0

    ·         Design

    ·         具体设计

     150%  240  360

    ·         Coding

    ·         具体编码

     100%  180  180

    ·         Code Review

    ·         代码复审

     100%  30  30

    ·         Test

    ·         测试(自我测试,修改代码,提交修改)

     100%  60 60 

    Reporting

    总结报告

         
    • Test Report
    • 测试报告
       (博客)  
    • Size Measurement
    • 计算工作量
    • Postmortem & Improvement Plan
    • 事后总结, 并提出改进
       100%  40  40
             
    Total 总计 220%

    总用时

    约11小时

    总估计的用时

    5小时

    你在这个作业中学到了什么?  有什么好的设计值得分享?  感想如何 (太容易 / 太难 / 太无趣)?

    本次作业中,我深入体会了“归结法”的思想,也为自己独自从学习到思考最后解决问题而愉快。因为之前较少接触这样算法类的问题,也没有这样专业而完整的开发过程,本次作业让我学会了如何学习、如何思考问题,并在完成后总结。当然,我也有不足,就是deadline之前没能抓紧时间,导致最后的任务量异常繁重。编程序不能等deadline,是我应该明白的道理。

    至于好的设计,我已经尽力写出能想到的最好的了...当然我还会继续欣赏其他高分同学的作品并学习。上面的设计,也是受《编程之美》一书和很多人的博客启发而想到的。

    这次作业的感想是,过程很充实,让人学到很多,但是任务量有点大... 因为个人选的课程有点多,所以不得不在国庆节坐到腰酸背疼..也许熟练了能好点吧..

    四. 其他

    关于/a的情况.. 没有什么好算法,只好用退火随机化算法了,没什么能分享的了。

    然后关于“单元测试”,“代码覆盖率”,因为本程序应对5种模式,代码覆盖率会比较低。因为没采用面向对象的类,暂时未找到代码覆盖率的查看方法,我会下节课请教助教大人或者老师的。

    为了便于理解,上面的代码并不是最终的代码。程序不断扩充,代码也有少许变化。

    感谢阅读,祝中秋快乐!

  • 相关阅读:
    Struts2中There is no Action mapped for namespace错误解决方法
    String字符串常量池简介
    main方法中参数"String[ ] args"详解
    自定义异常基本用法
    finally关键字执行的底层原理
    Linux环境下安装mysql5.6(二进制包不是rpm格式)
    finalize关键字小结
    "=="和equals小结
    super关键字小结(构造方法的执行是不是一定会创建对象?)
    冒泡排序
  • 原文地址:https://www.cnblogs.com/shone/p/3348372.html
Copyright © 2011-2022 走看看