POJ1458 Common Subsequence(最长公共子序列LCS)
http://poj.org/problem?id=1458
题意:
给你两个字符串, 要你求出两个字符串的最长公共子序列长度.
分析:
本题不用输出子序列,非常easy,直接处理就可以.
首先令dp[i][j]==x表示A串的前i个字符和B串的前j个字符的最长公共子序列长度为x.
初始化: dp全为0.
状态转移:
IfA[i]==B[j] then
dp[i][j]= dp[i-1][j-1]+1
else
dp[i][j]= max( dp[i-1][j] , dp[i][j-1] )
上述公式: 当A[i]==B[j]时, A的第i个字符和B的第j个字符必定在A[1..i]和B[1..j]的最长公共子序列中, 所以dp[i][j]==dp[i-1][j-1]+1.
当A[i]!=B[j]时, A[i]和B[j]至少有一个是不可能在A[1..i]和B[1..j]的最长公共子序列中的, 所以dp[i][j] = max( dp[i-1][j] , dp[i][j-1] )
终于所求: dp[n][m].
AC代码:
#include<iostream> #include<cstdio> #include<algorithm> #include<cstring> using namespace std; const int maxn=1000+5; int n,m; int dp[maxn][maxn]; char s1[maxn],s2[maxn]; int main() { while(scanf("%s%s",s1,s2)==2) { n=strlen(s1);//s1串长度 m=strlen(s2);//s2串长度 memset(dp,0,sizeof(dp)); for(int i=1;i<=n;i++) for(int j=1;j<=m;j++) { if(s1[i-1]==s2[j-1]) dp[i][j]=dp[i-1][j-1]+1; else dp[i][j]=max( dp[i-1][j] , dp[i][j-1] ); } printf("%d ",dp[n][m]); } return 0; }
如今的问题是怎样按字典序输出全部的LCS串呢?
能够看到假设我们想求A[1..i]与B[1..j]的LCS, 那么当A[i]==B[j]时,
A[i](也是B[j]字符)这个字符是必定要被选的, 那么我们以下考虑A[1..i-1]和B[1..j-1]的LCS就可以. 我写了一个DFS逆序递推求出全部串的方法, 然后把串保存入set中, 就是按字典序排序且去重后的结果了.
DFS过程事实上就是一个逆序递推的过程. S字符数组保存了我们当前已经确定了LCS的末尾num个字符. 假设当前A[i]==B[j], 那么A[i]就是一个我们须要保存入S的字符数组. 假设A[i]!=B[j], 那么我们最多有两条不同的路继续前进. 每一个DFS都是一条可行路, 必定会找到一个可行的LCS.
只是上面方法会出现非常多反复的串, 所以效率比較低. 假设想提高效率还须要记录每一个字符出现的位置并做一定的优化.
代码例如以下:
#include<iostream> #include<cstdio> #include<algorithm> #include<cstring> #include<string> #include<set> using namespace std; const int maxn=100+5; int n,m; int dp[maxn][maxn]; char s1[maxn],s2[maxn]; set<string> st; char s[maxn]; char stmp[maxn]; int cnt; //dfs从s1串的i位置和s2串的j位置開始逆序递推 //num是当前已经确定了LCS的末尾num个字符 //全部LCS保存到st中排序去重最后输出. void dfs(int i,int j,int num) { if(num>=cnt)//已经找到了一个LCS { for(int i=num;i>=1;i--) stmp[num-i]=s[i]; stmp[num]='