用的是后缀数组,对于串s1,s2求最长公共子串,最原始的想法就是比较两个串的所有后缀之间的最长公共前缀,可有通过后缀数组优化,先把s1,s2连起来,中间加一个不在s1,s2中的任意一个字符。这样,新形成的串的后缀可以分为两类,一类是包含s1中字符的后缀,一类就是不包含s1中字符的后缀,最后的结果也就是这两类后缀之间的最长公共前缀。额外添加的那个字符的作用就体现于此,这两类后缀的最长公共前缀,也就是s1和s2之间的最长公共前缀,因为这两类后缀的最长公共前缀,肯定在额外添加的那个字符之前就已经匹配结束了,理由显而易。然后接下来就是求这两类后缀的最长公共前缀,只要在得height数组时,比较一下就可以了,理由很容易就可证出。
#include <iostream> #include <cstdio> #include <cstring> using namespace std; const int maxn=200000+10; char s1[maxn],s2[maxn]; int sa[maxn],c[maxn],t[maxn*2],t2[maxn*2],ran[maxn],height[maxn]; int n,len1,len2; void build_sa(int m) { int i ,*x=t,*y=t2; for(i=1;i<m;i++) c[i]=0; for(i=0;i<n;i++) c[x[i]=s1[i]-'a'+1]++; for(i=2;i<m;i++) c[i]+=c[i-1]; for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i; for(int k=1;k<=n;k<<=1) { int p=0; for(i=n-k;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k; for(i=1;i<m;i++) c[i]=0; for(i=0;i<n;i++) c[x[y[i]]]++; for(i=1;i<m;i++) c[i]+=c[i-1]; for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i]; swap(x,y); p=2; x[sa[0]]=1; for(i=1;i<n;i++) x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++; if(p>=n) break; m=p; } } int getHeight() { int i,j,k=0; int ans=0; for(i=0;i<n;i++) ran[sa[i]]=i; for(i=0;i<n;i++) { if(k) k--; if(ran[i]) { int j=sa[ran[i]-1]; while(s1[i+k]==s1[j+k]) k++; height[ran[i]]=k; if((sa[ran[i]]>len1&&sa[ran[i]-1]<len1)||(sa[ran[i]]<len1&&sa[ran[i]-1]>len1)) ans=max(ans,height[ran[i]]); } } return ans; } int main() { scanf("%s%s",s1,s2); len1=strlen(s1),len2=strlen(s2); s1[len1]='a'+26; int i,j; for(i=0;i<len2;i++) s1[len1+i+1]=s2[i]; n=len1+i+1; build_sa(28); int ans=getHeight(); printf("%d\n",ans); return 0; }