IV.[POI2000]公共串
后缀数组如何应对多个串的情况呢?
答案很简单:把所有串都拼起来!
但这又有个问题,拼起来的串不会出现一些错误吗?
没关系,这里就有解决方案了:在相邻的串间插入一个从未出现过的字符。
我们考虑在拼起来的字符串中求出\(ht\)数组。则仍然考虑二分公共子串长度\(ip\),在\(ht\)数组里面按照\(ht_x<ip\)的位置分段。然后,如果有一段内部包含了来自所有串的后缀,则当前二分值合法;否则,则不合法。
当然这里还有一种不需要二分的方法,即用two-pointers
求出所有出现所有串的区间,并对于每个区间求出内部所有\(ht_x\)的\(\min\)(可以用单调队列),对每个区间的结果求\(\max\)即可。但是因为这个方法省略不了后缀数组的\(\log\)(除非你用神奇的DC3),所以复杂度仍为\(O(n\log n)\)。
代码:
#include<bits/stdc++.h>
using namespace std;
int all,n,m,x[200100],y[200100],buc[200100],sa[200100],ht[200100],rk[200100],id[200100],s[200100];
bool occ[200100];
char str[200100];
void SA(){
for(int i=0;i<n;i++)buc[x[i]=s[i]]++;
for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
for(int i=n-1;i>=0;i--)sa[--buc[x[i]]]=i;
for(int k=1;k<n;k<<=1){
int num=0;
for(int i=n-k;i<n;i++)y[num++]=i;
for(int i=0;i<n;i++)if(sa[i]>=k)y[num++]=sa[i]-k;
for(int i=0;i<=m;i++)buc[i]=0;
for(int i=0;i<n;i++)buc[x[y[i]]]++;
for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
for(int i=n-1;i>=0;i--)sa[--buc[x[y[i]]]]=y[i];
swap(x,y);
x[sa[0]]=num=0;
for(int i=1;i<n;i++)x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k])?num:++num;
m=num;
}
for(int i=0;i<n;i++)rk[sa[i]]=i;
for(int i=0,k=0;i<n;i++){
if(!rk[i])continue;
if(k)k--;
int j=sa[rk[i]-1];
while(i+k<n&&j+k<n&&s[i+k]==s[j+k])k++;
ht[rk[i]]=k;
}
}
bool che(int ip){
for(int i=0,j=0;i<n;i=j){
if(id[sa[i]]==-1){j++;continue;}
int k=0;
k+=!occ[id[sa[i]]],occ[id[sa[i]]]=true;
for(j=i+1;j<n&&ht[j]>=ip;j++)k+=!occ[id[sa[j]]],occ[id[sa[j]]]=true;
for(int l=i;l<j;l++)occ[id[sa[l]]]=false;
if(k==all)return true;
}
return false;
}
int main(){
scanf("%d",&all);
for(int i=1;i<=all;i++){
scanf("%s",str);
m=strlen(str);
for(int j=0;j<m;j++)id[n]=i,s[n]=(int)str[j]+5,n++;
id[n]=-1,s[n]=i,n++;
}
m='z'+5;
SA();
// for(int i=0;i<n;i++)printf("%d ",s[i]);puts("");
// for(int i=0;i<n;i++)printf("%d ",rk[i]);puts("");
// for(int i=0;i<n;i++)printf("%d ",ht[i]);puts("");
int l=0,r=n;
while(l<r){
int mid=(l+r+1)>>1;
if(che(mid))l=mid;
else r=mid-1;
}
printf("%d\n",l);
return 0;
}