最长公共递增子序列(LCIS)
给定两个字符串,除了会求最长公共子序列(LCS),会求最长递增子序列(LIS),还要会求最长公共递增子序列(LCIS)
题目描述:
熊大妈的奶牛在小沐沐的熏陶下开始研究信息题目。小沐沐先让奶牛研究了最长上升子序列,再让他们研究了最长公共子序列,现在又让他们要研究最长公共上升子序列了。
小沐沐说,对于两个串A,B,如果它们都包含一段位置不一定连续的数字,且数字是严格递增的,那么称这一段数字是两个串的公共上升子串,而所有的公共上升子串中最长的就是最长公共上升子串了。
奶牛半懂不懂,小沐沐要你来告诉奶牛什么是最长公共上升子串。不过,只要告诉奶牛它的长度就可以了。
最长公共上升子序列(LCIS)的O(n^2)算法解析(转)
预备知识:动态规划的基本思想,LCS,LIS。
问题:
字符串a,字符串b,求a和b的LCIS(最长公共上升子序列)。
首先我们可以看到,这个问题具有相当多的重叠子问题。于是我们想到用DP搞。DP的首要任务是什么?定义状态。
1定义状态F[i][j]表示以a串的前i个字符b串的前j个字符且以b[j]为结尾构成的LCIS的长度。
为什么是这个而不是其他的状态定义?最重要的原因是我只会这个,还有一个原因是我知道这个定义能搞到平方的算法。而我这只会这个的原因是,这个状态定义实在是太好用了。这一点我后面再说。
我们来考察一下这个这个状态。思考这个状态能转移到哪些状态似乎有些棘手,如果把思路逆转一下,考察这个状态的最优值依赖于哪些状态,就容易许多了。这个状态依赖于哪些状态呢?
首先,在a[i]!=b[j]的时候有F[i][j]=F[i-1][j]。为什么呢?因为F[i][j]是以b[j]为结尾的LCIS,如果F[i][j]>0那么就说明a[1]..a[i]中必然有一个字符a[k]等于b[j](如果F[i][j]等于0呢?那赋值与否都没有什么影响了)。因为a[k]!=a[i],那么a[i]对F[i][j]没有贡献,于是我们不考虑它照样能得出F[i][j]的最优值。所以在a[i]!=b[j]的情况下必然有F[i][j]=F[i-1][j]。这一点参考LCS的处理方法。
那如果a[i]==b[j]呢?首先,这个等于起码保证了长度为1的LCIS。然后我们还需要去找一个最长的且能让b[j]接在其末尾的LCIS。之前最长的LCIS在哪呢?首先我们要去找的F数组的第一维必然是i-1。因为i已经拿去和b[j]配对去了,不能用了。并且也不能是i-2,因为i-1必然比i-2更优。第二维呢?那就需要枚举b[1]..b[j-1]了,因为你不知道这里面哪个最长且哪个小于b[j]。这里还有一个问题,可不可能不配对呢?也就是在a[i]==b[j]的情况下,需不需要考虑F[i][j]=F[i-1][j]的决策呢?答案是不需要。因为如果b[j]不和a[i]配对,那就是和之前的a[1]..a[j-1]配对(假设F[i-1][j]>0,等于0不考虑),这样必然没有和a[i]配对优越。(为什么必然呢?因为b[j]和a[i]配对之后的转移是max(F[i-1][k])+1,而和之前的i`配对则是max(F[i`-1][k])+1。显然有F[i][j]>F[i`][j],i`>i)
于是我们得出了状态转移方程:
a[i]!=b[j]: F[i][j]=F[i-1][j]
a[i]==b[j]: F[i][j]=max(F[i-1][k])+1 1<=k<=j-1&&b[j]>b[k]
不难看到,这是一个时间复杂度为O(n^3)的DP,离平方还有一段距离。
但是,这个算法最关键的是,如果按照一个合理的递推顺序,max(F[i-1][k])的值我们可以在之前访问F[i][k]的时候通过维护更新一个max变量得到。怎么得到呢?首先递推的顺序必须是状态的第一维在外层循环,第二维在内层循环。也就是算好了F[1][len(b)]再去算F[2][1]。
如果按照这个递推顺序我们可以在每次外层循环的开始加上令一个max变量为0,然后开始内层循环。当a[i]>b[j]的时候令max=F[i-1][j]。如果循环到了a[i]==b[j]的时候,则令F[i][j]=max+1。
最后答案是F[len(a)][1]..F[len(a)][len(b)]的最大值。
代码一: O(n^3) 算法
1 #include <cstdio> 2 #include <iostream> 3 4 using namespace std; 5 6 char s1[1000], s2[1000]; 7 int dp[1000][1000]; 8 9 int Lcis() 10 { 11 memset(dp, 0, sizeof(dp)); 12 int len1 = strlen(s1+1); 13 int len2 = strlen(s2+1); 14 for(int i = 1; i <= len1; ++i) 15 { 16 for(int j = 1; j <= len2; ++j) 17 { 18 if(s1[i] != s2[j]) 19 dp[i][j] = dp[i-1][j]; 20 else //s1[i-1] == s2[j-1] 21 { 22 for(int k = 0; k < j; ++k) 23 { 24 if(s2[j]>s2[k] && dp[i-1][k]+1>dp[i][j]) 25 dp[i][j] = dp[i-1][k] + 1; 26 } 27 } 28 } 29 } 30 int max = 0; 31 for(i = 1; i <= len2; ++i) 32 { 33 //printf("%d ", dp[len1][i]); 34 if(max < dp[len1][i]) 35 max = dp[len1][i]; 36 } 37 return max; 38 } 39 40 int main() 41 { 42 int T; 43 //freopen("input.txt", "r", stdin); 44 scanf("%d", &T); 45 while(T--) 46 { 47 scanf("%s%s", s1+1, s2+1); 48 printf("%d\n", Lcis()); 49 } 50 return 0; 51 }
代码二: O(n^2) 算法
1 #include <cstdio> 2 #include <iostream> 3 4 using namespace std; 5 6 char s1[1000], s2[1000]; 7 int dp[1000][1000]; 8 9 int Lcis() 10 { 11 memset(dp, 0, sizeof(dp)); 12 int max = 0; 13 int len1 = strlen(s1+1); 14 int len2 = strlen(s2+1); 15 for(int i = 1; i <= len1; ++i) 16 { 17 max = 0; 18 for(int j = 1; j <= len2; ++j) 19 { 20 dp[i][j] = dp[i-1][j]; // 首先把dp[i][j]等于dp[i-1][j] 21 if(s1[i] > s2[j] && max<dp[i-1][j])// 如果s1[i]!=s2[j]则对于dp[i][j]没有任何影响,只需更新max 22 max = dp[i-1][j]; 23 if(s1[i] == s2[j]) 24 dp[i][j] = max + 1; 25 } 26 } 27 max = 0; 28 for(int i = 1; i <= len2; ++i) 29 { 30 if(max < dp[len1][i]) 31 max = dp[len1][i]; 32 } 33 return max; 34 } 35 36 int main() 37 { 38 int T; 39 //freopen("input.txt", "r", stdin); 40 scanf("%d", &T); 41 while(T--) 42 { 43 scanf("%s%s", s1+1, s2+1); 44 printf("%d\n", Lcis()); 45 } 46 return 0; 47 }
其实还有一个很风骚的一维的算法。在此基础上压掉了一维空间(时间还是平方)。i循环到x的时候,F[i]表示原来F[x][j]。之所以可以这样,是因为如果a[i]!=b[j],因为F[x][j]=F[x-1][j]值不变,F[x]不用改变,沿用过去的就好了,和这个比较维护更新得到的max值依然是我们要的。而a[i]==b[j]的时候,就改变F[x]的值好了。具体结合代码理解
代码三: O(n^2) 算法空间优化
1 #include <cstdio> 2 #include <iostream> 3 4 using namespace std; 5 6 char s1[1000], s2[1000]; 7 int dp[1000]; 8 9 int Lcis() 10 { 11 memset(dp, 0, sizeof(dp)); 12 int max = 0; 13 int len1 = strlen(s1+1); 14 int len2 = strlen(s2+1); 15 for(int i = 1; i <= len1; ++i) 16 { 17 max = 0; 18 for(int j = 1; j <= len2; ++j) 19 { 20 if(s1[i] > s2[j] && max<dp[j])// 如果s1[i]!=s2[j]则对于dp[i][j]没有任何影响,只需更新max 21 max = dp[j]; 22 if(s1[i] == s2[j]) 23 dp[j] = max + 1; 24 } 25 } 26 max = 0; 27 for(int i = 1; i <= len2; ++i) 28 { 29 if(max < dp[i]) 30 max = dp[i]; 31 } 32 return max; 33 } 34 35 int main() 36 { 37 int T; 38 //freopen("input.txt", "r", stdin); 39 scanf("%d", &T); 40 while(T--) 41 { 42 scanf("%s%s", s1+1, s2+1); 43 printf("%d\n", Lcis()); 44 } 45 return 0; 46 }