如果不存在模糊点,那么答案就是两个串的最长公共子串。
如果模糊点是某个串的开头或者结尾,那么可以暴力枚举另一个串中的某个前后缀更新答案。
否则,假设模糊点在第一个串里是$i$,在第二个串里是$j$,那么此时对答案的贡献为$lcp(i+1,j+1)+lcs(i-1,j-1)+1$。
将两个串用特殊字符拼接,求出正串的后缀数组以及反串的后缀数组,那么$lcp(i+1,j+1)+lcs(i-1,j-1)+1$等价于两个height数组的区间最小值的和。
考虑从大到小枚举第一个数,每次把所有大于等于它的部分全部合并,那么在另一个数组里显然只有相邻的后缀有用。
所以对于每个集合建立两棵平衡树,维护两个串在反串里的rank。
在启发式合并的时候,只需要在另一个串对应的平衡树里找到前驱后继然后更新答案即可。
时间复杂度$O(nlog^2n)$。
#include<cstdio> #include<algorithm> #include<cstring> #include<set> using namespace std; const int N=400010,M=200005; char sa[N],sb[N],s[N];int na,nb,n,i,j,Log[N],ans; struct DS{ char s[N]; int rk[N],sa[N],height[N],tmp[N],cnt[N],f[18][M]; void suffixarray(int n,int m){ int i,j,k;n++; for(i=0;i<n*2+5;i++)rk[i]=sa[i]=height[i]=tmp[i]=0; for(i=0;i<m;i++)cnt[i]=0; for(i=0;i<n;i++)cnt[rk[i]=s[i]]++; for(i=1;i<m;i++)cnt[i]+=cnt[i-1]; for(i=0;i<n;i++)sa[--cnt[rk[i]]]=i; for(k=1;k<=n;k<<=1){ for(i=0;i<n;i++){ j=sa[i]-k; if(j<0)j+=n; tmp[cnt[rk[j]]++]=j; } sa[tmp[cnt[0]=0]]=j=0; for(i=1;i<n;i++){ if(rk[tmp[i]]!=rk[tmp[i-1]]||rk[tmp[i]+k]!=rk[tmp[i-1]+k])cnt[++j]=i; sa[tmp[i]]=j; } memcpy(rk,sa,n*sizeof(int)); memcpy(sa,tmp,n*sizeof(int)); if(j>=n-1)break; } for(j=rk[height[i=k=0]=0];i<n-1;i++,k++) while(~k&&s[i]!=s[sa[j-1]+k])height[j]=k--,j=rk[sa[j]+1]; } void build(){ int i,j; for(i=1;i<=n;i++)f[0][i]=height[i]; for(j=1;j<18;j++)for(i=1;i+(1<<j-1)<=n;i++)f[j][i]=min(f[j-1][i],f[j-1][i+(1<<j-1)]); } inline int ask(int x,int y){ int k=Log[y-x+1]; return min(f[k][x],f[k][y-(1<<k)+1]); } inline int lcp(int x,int y){ if(x>y)swap(x,y); return ask(x+1,y); } }A,B; int q[M],f[M],ca[M],cb[M],size[M],g[M],v[M<<1],nxt[M<<1],ed,lcp; set<int>TA[M],TB[M]; inline bool cmp(int x,int y){return A.height[x]>A.height[y];} inline void add(int x,int y){v[++ed]=y;nxt[ed]=g[x];g[x]=ed;} void dfs(int x,int y,int z){ f[x]=z; if(A.sa[x]<na){ int j=A.sa[x]-2; if(j>=0){ j=B.rk[n-1-j]; TA[z].insert(j); set<int>::iterator k=TB[z].lower_bound(j); if(k!=TB[z].end())ans=max(ans,lcp+B.lcp(j,*k)); if(k!=TB[z].begin())k--,ans=max(ans,lcp+B.lcp(j,*k)); } } if(A.sa[x]>na){ int j=A.sa[x]-2; if(j>na){ j=B.rk[n-1-j]; TB[z].insert(j); set<int>::iterator k=TA[z].lower_bound(j); if(k!=TA[z].end())ans=max(ans,lcp+B.lcp(j,*k)); if(k!=TA[z].begin())k--,ans=max(ans,lcp+B.lcp(j,*k)); } } for(int i=g[x];i;i=nxt[i])if(v[i]!=y)dfs(v[i],x,z); } inline void merge(int x,int y){ x=f[x],y=f[y]; if(size[x]>size[y])swap(x,y); if(ca[x]&&cb[y]||cb[x]&&ca[y])ans=max(ans,lcp-1); ca[y]|=ca[x],cb[y]|=cb[x],size[y]+=size[x]; TA[x].clear(),TB[x].clear(); add(x,y),add(y,x); dfs(x,y,y); } int main(){ for(i=2;i<N;i++)Log[i]=Log[i>>1]+1; scanf("%s%s",sa,sb); na=strlen(sa); nb=strlen(sb); if(na==1||nb==1)return puts("1"),0; for(i=0;i<na;i++)s[n++]=sa[i]; s[n++]='#'; for(i=0;i<nb;i++)s[n++]=sb[i]; for(i=0;i<n;i++)A.s[i]=B.s[n-i-1]=s[i]; A.suffixarray(n,128); B.suffixarray(n,128); B.build(); for(i=1;i<=n;i++){ f[i]=i,size[i]=1; if(A.sa[i]<na){ ca[i]=1; j=A.sa[i]-2; if(j>=0)TA[i].insert(B.rk[n-1-j]); } if(A.sa[i]>na){ cb[i]=1; j=A.sa[i]-2; if(j>na)TB[i].insert(B.rk[n-1-j]); } } for(i=1;i<n;i++)q[i]=i+1; sort(q+1,q+n,cmp); for(i=1;i<n;i++)lcp=A.height[q[i]],merge(q[i]-1,q[i]); j=A.rk[1]; for(lcp=N,i=j-1;i;i--){ lcp=min(lcp,A.height[i+1]); if(A.sa[i]>na+1)ans=max(ans,lcp); } for(lcp=N,i=j+1;i<=n;i++){ lcp=min(lcp,A.height[i]); if(A.sa[i]>na+1)ans=max(ans,lcp); } j=A.rk[na+2]; for(lcp=N,i=j-1;i;i--){ lcp=min(lcp,A.height[i+1]); if(A.sa[i]&&A.sa[i]<na)ans=max(ans,lcp); } for(lcp=N,i=j+1;i<=n;i++){ lcp=min(lcp,A.height[i]); if(A.sa[i]&&A.sa[i]<na)ans=max(ans,lcp); } j=B.rk[nb+2]; for(lcp=N,i=j-1;i;i--){ lcp=min(lcp,B.height[i+1]); if(B.sa[i]&&B.sa[i]<nb)ans=max(ans,lcp); } for(lcp=N,i=j+1;i<=n;i++){ lcp=min(lcp,B.height[i]); if(B.sa[i]&&B.sa[i]<nb)ans=max(ans,lcp); } j=B.rk[1]; for(lcp=N,i=j-1;i;i--){ lcp=min(lcp,B.height[i+1]); if(B.sa[i]>nb+1)ans=max(ans,lcp); } for(lcp=N,i=j+1;i<=n;i++){ lcp=min(lcp,B.height[i]); if(B.sa[i]>nb+1)ans=max(ans,lcp); } return printf("%d",ans+1),0; }