扩展KMP指的是
对于给出的串S和T,以O(n)的时间求出。
对于所有0<=i<len(S),S(i,i+1,...,len(s)-1)与T的最长前缀长度。
next[i]为满足B[i..i+z-1]==B[0..z-1]的最大的z值。
以下是模板:
#include <iostream> #include <string> #include <stdio.h> #include <string.h> using namespace std; const int MM=100005; int mynext[MM],extand[MM]; char S[MM],T[MM]; void Getmynext(const char *T){ int len=strlen(T),a=0; mynext[0]=len; while(a<len-1 && T[a]==T[a+1]) a++; mynext[1]=a; a=1; for(int k=2;k<len;k++){ int p=a+mynext[a]-1,L=mynext[k-a]; if( (k-1)+L >= p){ int j = (p-k+1)>0 ? (p-k+1) : 0; while(k+j<len && T[k+j]==T[j]) j++; mynext[k]=j; a=k; } else mynext[k]=L; } } void GetExtand(const char *S,const char *T){ Getmynext(T); int slen=strlen(S),tlen=strlen(T),a=0; int MinLen = slen < tlen ? slen : tlen; while(a<MinLen && S[a]==T[a]) a++; extand[0]=a; a=0; for(int k=1;k<slen;k++){ int p=a+extand[a]-1, L=mynext[k-a]; if( (k-1)+L >= p){ int j= (p-k+1) > 0 ? (p-k+1) : 0; while(k+j<slen && j<tlen && S[k+j]==T[j]) j++; extand[k]=j; a=k; } else extand[k]=L; } } int main(){ int tt; cin>>tt; while(tt--) { scanf("%s%s",S,T); GetExtand(S,T); //接下来用mynext 和 extand 即可. } return 0; }
下面举一个例子,S=”aaaabaa”,T=”aaaaa”,首先,计算extend[0]时,需要进行5次匹配,直到发生失配。
从而得知extend[0]=4,下面计算extend[1],在计算extend[1]时,是否还需要像计算extend[0]时从头开始匹配呢?答案是否定的,因为通过计算extend[0]=4,从而可以得出S[0,3]=T[0,3],进一步可以得到 S[1,3]=T[1,3],计算extend[1]时,事实上是从S[1]开始匹配,设辅助数组next[i]表示T[i,m-1]和T的最长公共前缀长度。在这个例子中,next[1]=4,即T[0,3]=T[1,4],进一步得到T[1,3]=T[0,2],所以S[1,3]=T[0,2],所以在计算extend[1]时,通过extend[0]的计算,已经知道S[1,3]=T[0,2],所以前面3个字符已经不需要匹配,直接匹配S[4]和T[3]即可,这时一次就发生失配,所以extend[1]=3。
另带一张自己理解的图: