zoukankan      html  css  js  c++  java
  • 【51NOD】1006 最长公共子序列Lcs(动态规划)

    给出两个字符串A B,求A与B的最长公共子序列(子序列不要求是连续的)。

    比如两个串为:
     
    abcicba
    abdkscab
     
    ab是两个串的子序列,abc也是,abca也是,其中abca是这两个字符串最长的子序列。
    Input
    第1行:字符串A
    第2行:字符串B
    (A,B的长度 <= 1000)
    Output
    输出最长的子序列,如果有多个,随意输出1个。
    Input示例
    abcicba
    abdkscab
    Output示例
    abca

    问题定义
    • 子序列
    – X=(A, B, C, B, D, B)
    – Z=(B, C, D, B)是X的子序例
    – W=(B, D, A)不是X的子序例
    • 公共子序列
    –Z是序列X与Y的公共子序列如果Z是X的
    子序也是Y的子序列。
    最长公共子序列(LCS)问题
    输入:X = (x1,x2,...,xn),Y =
    (y1,y2,...ym)
    输出:Z = X与Y的最长公共子序

    最长公共子序列结构分析
    • 第i前缀
    – 设X=(x1, x2, ..., xn)是一个序列,X的第i前
    缀Xi
    是一个序列,定义为Xi=(x1, ..., xi )
    例. X=(A, B, D, C, A), X1=(A), X2=(A, B), X3=(A,
    B, D)
    优化子结构
    定理1(优化子结构)设X=(x1, ..., xm)、
    Y=(y1, ..., yn) 是两个序列,Z=(z1, ..., zk)是X与Y的
    LCS,我们有:
    ⑴ 如果xm=yn, 则zk=xm=yn, Zk-1
    是Xm-1
    和Yn-1

    LCS,即,LCSXY = LCSXm-1Yn-1
    + <xm=yn>.
    ⑵ 如果xm.yn
    ,且zk.xm
    ,则Z是Xm-1
    和Y的
    LCS,即 LCSXY= LCSXm-1Y
    ⑶ 如果xm.yn,且zk.yn,则Z是X与Yn-1
    的LCS,
    即 LCSXY= LCSXYn-1
    证明:
    ⑴. X=<x1, …, xm-1, xm>, Y=<y1, …, yn-1, xm>,则
    LCSXY = LCSXm-1Yn-1
    + <xm=yn>.
    设zkxm
    ,则可加xm=yn
    到Z,得到一个长为k+1的
    X与Y的公共序列,与Z是X和Y的LCS矛盾。于是
    zk=xm=yn

    现在证明Zk-1
    是Xm-1
    与Yn-1
    的LCS。显然Zk-1
    是Xm-
    1
    与Yn-1
    的公共序列。我们需要证明Zk-1
    是LCS。
    设不然,则存在Xm-1
    与Yn-1
    的公共子序列W,W
    的长大于k-1。增加xm=yn
    到W,我们得到一个长
    大于k的X与Y的公共序列,与Z是LCS矛盾。于
    是,Zk-1
    是Xm-1
    与Yn-1
    的LCS.
    ⑵ X=<x1, …, xm-1, xm>, Y=<y1, …, yn-1, yn>,
    xmyn
    ,zkxm
    ,则 LCSXY= LCSXm-1Y
    由于zkxm
    ,Z是Xm-1
    与Y的公共子序列。我
    们来证Z是Xm-1
    与Y的LCS。设Xm-1
    与Y有一
    个公共子序列W,W的长大于k, 则W也是X
    与Y 的公共子序列,与Z是LCS矛盾。
    ⑶ 同⑵可证。
    X和Y的LCS的优化解结构为
    LCSXY=LCSXm-1Yn-1
    + <xm=yn> if xm=yn
    LCSXY=LCSXm-1Y if xm≠yn, zk≠xm
    LCSXY=LCSXYn-1 if xm≠yn, zk≠yn

    建立LCS长度的递归方程
    • C[i, j] = Xi与Yj 的LCS的长度
    • LCS长度的递归方程
    C[i, j] = 0 if i=0 或 j=0
    C[i, j] = C[i-1, j-1] + 1 if i, j>0 且 xi = yj
    C[i, j] = Max(C[i, j-1], C[i-1, j]) if i, j>0 且 xi ≠ yj


    自底向上计算LCS的长度

    计算LCS长度的算法
    – 数据结构
    C[0:m,0:n]: C[i,j]是Xi
    与Yj
    的LCS的长度
    B[1:m,1:n]: B[i,j] 是指针, 指向计算
    C[i,j]时所选择的子问题的优化解所对
    应的C表的表项

    LCS-length(X, Y)
    m←length(X);n←length(Y);
    For i←1 To m Do C[i,0]←0;
    For j←1 To n Do C[0,j]←0;
    For i←1 To m Do
    For j←1 To n Do
    If xi = yj
    Then C[i,j]←C[i-1,j-1]+1;B[i,j]←“↖”;
    Else If C[i-1,j]≥C[i,j-1]
    Then C[i,j]≥C[i-1,j]; B[i,j]←“↑”;
    Else C[i,j]≥C[i,j-1]; B[i,j]←“←”;
    Return C and B.
    构造优化解
    • 基本思想
    – 从B[m, n]开始按指针搜索
    – 若B[i, j]=“↖”,则xi=yj
    是LCS的一个元

    – 如此找到的“LCS”是X与Y的LCS
    Print-LCS(B, X, i, j)
    IF i=0 or j=0 THEN Return;
    IF B[i, j]=“↖”
    THEN Print-LCS(B, X, i-1, j-1);
    Print xi;
    ELSE If B[i, j]=“↑”
    THEN Print-LCS(B, X, i-1, j);
    ELSE Print-LCS(B, X, i, j-1).

    Print-LCS(B, X, length(X), length(Y))
    可打印出X与Y的LCS。
     1      /*功能:计算最优值
     2       *参数:
     3       *        x:字符串x  X:字符串x最大长度
     4       *        y:字符串y   Y:字符串y最大长度
     5       *        b:标志数组
     6       *        xlen:字符串x的长度
     7       *        ylen:字符串y的长度
     8       *返回值:最长公共子序列的长度
     9       *
    10       */
    11      int Lcs_Length(string x, string y, int b[][Y+1],int xlen,int ylen)
    12      {
    13          int i = 0;
    14          int j = 0;
    15 
    16          int c[X+1][Y+1];
    17          for (i = 0; i<=xlen; i++)
    18          {
    19              c[i][0]=0;
    20          }
    21          for (i = 0; i <= ylen; i++ )
    22          {
    23              c[0][i]=0;
    24          }
    25          for (i = 1; i <= xlen; i++)
    26          {
    27             
    28              for (j = 1; j <= ylen; j++)
    29              {
    30                  if (x[i - 1] == y[j - 1])
    31                  {
    32                      c[i][j] = c[i-1][j-1]+1;
    33                      b[i][j] = 1;
    34                  }
    35                  else
    36                      if (c[i-1][j] > c[i][j-1])
    37                      {
    38                          c[i][j] = c[i-1][j];
    39                          b[i][j] = 2;
    40                      }
    41                      else
    42                          if(c[i-1][j] <= c[i][j-1])
    43                          {
    44                              c[i][j] = c[i][j-1];
    45                              b[i][j] = 3;
    46                          }
    47                          
    48              }
    49          }
    50          
    51          cout << "计算最优值效果图如下所示:" << endl;
    52          for(i = 1; i <= xlen; i++)
    53          {
    54              for(j = 1; j < ylen; j++)
    55              {
    56                  cout << c[i][j] << " ";
    57              }
    58              cout << endl;
    59          }
    60          
    61          return c[xlen][ylen];
    62      }

    完整代码

        //只能打印一个最长公共子序列
        #include <iostream>
        using namespace std;
         
         const int X = 1000, Y = 1000;        //串的最大长度
         char result[X+1];                    //用于保存结果
         int count=0;                        //用于保存公共最长公共子串的个数
     	 int c[X+1][Y+1];
     	 int b[X + 1][Y + 1];
         /*功能:计算最优值
          *参数:
          *        x:字符串x
          *        y:字符串y
          *        b:标志数组
          *        xlen:字符串x的长度
          *        ylen:字符串y的长度
          *返回值:最长公共子序列的长度
          *
          */
         int Lcs_Length(string x, string y, int b[][Y+1],int xlen,int ylen)
         {
             int i = 0;
             int j = 0;
    
             //int c[X+1][Y+1];
             for (i = 0; i<=xlen; i++)
             {
                 c[i][0]=0;
             }
             for (i = 0; i <= ylen; i++ )
             {
                 c[0][i]=0;
             }
             for (i = 1; i <= xlen; i++)
             {
                
                 for (j = 1; j <= ylen; j++)
                 {
                     if (x[i - 1] == y[j - 1])
                     {
                         c[i][j] = c[i-1][j-1]+1;
                         b[i][j] = 1;
                     }
                     else
                         if (c[i-1][j] > c[i][j-1])
                         {
                             c[i][j] = c[i-1][j];
                             b[i][j] = 2;
                         }
                         else
                             if(c[i-1][j] <= c[i][j-1])
                             {
                                 c[i][j] = c[i][j-1];
                                 b[i][j] = 3;
                             }
                             
                 }
             }
             /*
             cout << "计算最优值效果图如下所示:" << endl;
             for(i = 1; i <= xlen; i++)
             {
                 for(j = 1; j < ylen; j++)
                 {
                     cout << c[i][j] << " ";
                 }
                 cout << endl;
             }
             */
             return c[xlen][ylen];
         }
         
        void Display_Lcs(int i, int j, string x, int b[][Y+1],int current_Len)
         {
             if (i ==0 || j==0)
             {
                 return;
             }
             if(b[i][j]== 1)
             {
                 current_Len--;
                 result[current_Len]=x[i- 1];
                 Display_Lcs(i-1, j-1, x, b, current_Len);
             }
             else
             {
                 if(b[i][j] == 2)
                 {
                     Display_Lcs(i-1, j, x, b, current_Len);
                 }
                 else
                 {
                     if(b[i][j]==3)
                     {
                         Display_Lcs(i, j-1, x, b, current_Len);
                     }
                     else
                     {
                         Display_Lcs(i-1,j,x,b, current_Len);
                     }
                 }
             }
         }
         
         int main(int argc, char* argv[])
         {
             string x;
             string y;
             cin>>x>>y;
             int xlen = x.length();
             int ylen = y.length();
    
             //int b[X + 1][Y + 1];
    
             int lcs_max_len = Lcs_Length( x, y, b, xlen,ylen );
             //cout << lcs_max_len << endl;
    
             Display_Lcs( xlen, ylen, x, b, lcs_max_len );
             
             //打印结果如下所示
            for(int i = 0; i < lcs_max_len; i++)
            {
                cout << result[i];
            }
            cout << endl;
             return 0;
         }
    

     算法复杂性:

    • 时间复杂性
    – 计算代价的时间
    • (i, j)两层循环,i循环m步, j循环n步
    • O(mn)
    – 构造最优解的时间: O(m+n)
    – 总时间复杂性为:O(mn)
    • 空降复杂性
    – 使用数组C和B
    – 需要空间O(mn)

     
  • 相关阅读:
    [工作中的设计模式]中介模式模式Mediator
    [工作中的设计模式]责任链模式chain
    [工作中的设计模式]迭代子模式Iterator
    [工作中的设计模式]组合模式compnent
    TI IPNC Web网页之流程分析
    TI IPNC Web网页之GoDB开发环境
    安装ubuntu时将boot目录单独挂载的意义
    ubuntu添加自定义vga输出分辨率
    GCC编译默认的头文件搜索路径
    设置搜狗输入法在任何时候按左右两侧的shift激活
  • 原文地址:https://www.cnblogs.com/KID-XiaoYuan/p/6349131.html
Copyright © 2011-2022 走看看