http://blog.csdn.net/kk303/article/details/6929641
http://blog.csdn.net/human_ck/article/details/6577142
建立AC自动机以后,把所有单词结点标记出来,不要忘记,如果某个结点虽然原本不是单词结点,但其fail指针指向了一个单词结点,那么其也需要被标记为单词结点。
然后对于每个空的儿子本来应该在Trie上跳跃,但是我们可以直接让空的儿子指向其父的fail的那个对应的儿子,就没必要跳了,这样可以不用重复计算。
具体怎么转移网上到处都有。
要说明的一点是,这个dp是你对于原串的每一个前缀,都考虑了其所对应的一切可能的“安全序列”,并且这个状态没有后效性,从而保证了dp的正确性。
#include<cstdio> #include<cstring> #include<queue> using namespace std; #define INF 2147483647 queue<int>q; int child[1010][4],fail[1010],size,ma[1010],f[1010][1010],ans; bool word[1010]; void Insert(char S[]) { int len=strlen(S); int now=0; for(int i=0;i<len;++i) { if(!child[now][ma[S[i]]]) child[now][ma[S[i]]]=size++; now=child[now][ma[S[i]]]; } word[now]=1; } void build() { fail[0]=-1; q.push(0); while(!q.empty()) { int U=q.front(); q.pop(); for(int i=0;i<4;++i) if(child[U][i]) { int V=fail[U]; while(V!=-1) { if(child[V][i]) { fail[child[U][i]]=child[V][i]; break; } V=fail[V]; } if(V==-1) fail[child[U][i]]=0; if(word[fail[child[U][i]]]) word[child[U][i]]=1;//如果某个单词是该结点所在单词的前缀,那么该结点也应被标记为单词结点 q.push(child[U][i]); } else if(U) child[U][i]=child[fail[U]][i];//当然你在dp过程中在Trie上跳也行,但这样就避免了重复计算 //由于BFS,其实形成了一个类似链表的结构 } } void Init() { memset(child,0,sizeof(child)); memset(fail,0,sizeof(fail)); memset(word,0,sizeof(word)); size=1; } int T,n,m; char s[1010]; int main() { //freopen("poj3691.in","r",stdin); ma['A']=0; ma['G']=1; ma['C']=2; ma['T']=3; while(1) { scanf("%d",&n); if(!n) break; Init(); for(int i=1;i<=n;++i) { scanf("%s",s); Insert(s); } build(); memset(f,0x7f,sizeof(f)); f[0][0]=0; scanf("%s",s); m=strlen(s); for(int i=0;i<m;++i) for(int j=0;j<size;++j) for(int k=0;k<4;++k) if(!word[child[j][k]]) f[i+1][child[j][k]]=min(f[i+1][child[j][k]],f[i][j]+(ma[s[i]]!=k)); ans=INF; for(int i=0;i<size;++i) ans=min(ans,f[m][i]); printf("Case %d: %d ",++T,ans<=1000 ? ans : (-1)); } return 0; }