题目
题目大意
给你两个字符串(A)和(B),可以修改(A)中的一个字符,求修改后最长的(A)的前缀,使它是(B)的子串。
思考历程
看到这道题之后,第一眼想到的就是后缀自动机!
(B)的子串,意味着可以把(B)建立一个后缀自动机,然后在上面跑……
刚开始的想法是将(A)在上面跑,并且试着修改后面一个字符,看看剩下的可以跑多长……
于是问题就转化成求这样的一个东西:问(A)的某个后缀从后缀自动机上的某个节点开始最多能跑多远。
我试着将这个东西预处理出来……可是没有成功……
交了个错误的程序上去,居然还有点分。
水法
这题不得不开“水法”这一栏目。
题目的数据真是太水了,各种暴力都能过。
最简单的暴力:枚举子串的左端点,然后暴力匹配,遇见的第一个不同就用掉修改机会,求出匹配的最大长度。
还有一种(O(n))的正确性显然错误的DP……
跑得都比正解快……
正解
有个exkmp的方法,虽然说时间可能会有点玄学,但既然是郑姐讲的方法,就把它归为“正解”这一栏吧……
求出(A)的(next),以(A)为模式串求出(B)的(extend)。
枚举子串的开头(i),则后面相同的子串长度为(extend_i)。
后面那个位置用修改操作,所以要从(A_{extend_i+2})和(B_{i+extend_i+1})开始继续匹配。
接下来取(min(next_{extend_i+2},extend_{i+extend_i+1}))。后面这个长度的串一定是相同的,因为前者等于(A)前面一段,后者也等于(A)前面一段,其中的最小值就是它们相等的长度。
然而这可能不是极限,所以后面的,就暴力判断吧……
时间应该比较优秀,虽然说那一部分暴力判断有点玄学……
然后是题解中的(LCP)做法。
先枚举子串的左端点(i),求(LCP(B_{i..m},A)),设为(x)。(x+1)位可以用修改机会,然后求(LCP(A_{x+2..n},B_{i+x+1..m})),就是后面能继续延伸的长度。
当然,记得判断一下到达边界的情况。
至于求(LCP),最典型的做法是用后缀数组,将(A)和(B)并在一起,中间用特殊字符隔开,然后求后缀数组和(height)数组,然后用数据结构维护区间(height)最小值。
还有一种做法是用后缀自动机。考虑利用(fail)指针,如果跳两个节点在(fail)树上的(LCA),它的(len)就是它们的最长公共后缀。要求最长公共前缀,就把字符串倒过来建后缀自动机就行了……((fail)树实际上是逆序字符串的后缀树)这是两个字符串,所以要建广义后缀自动机。
最后是许多人使用的二分和(hash)做法。
首先二分答案(k),将(B)串中长度为(k)的子串存入(hash)表。
然后(26n)来枚举修改的方案,每次修改后再(hash)表中查询。
代码
后缀自动机的做法……
using namespace std;
#include <cstdio>
#include <cstring>
#include <algorithm>
#include <cassert>
#define N 50010
int n,m;
char a[N],b[N];
struct Node{
Node *c[26],*fail;
int len;
} d[N*4];
int cnt;
Node *S,*last;
inline void insert(int ch){
if (last->c[ch] && last->c[ch]->len==last->len+1){
last=last->c[ch];
return;
}
Node *nw=&d[++cnt],*p;
nw->len=last->len+1;
for (p=last;p && !p->c[ch];p=p->fail)
p->c[ch]=nw;
if (!p)
nw->fail=S;
else{
Node *q=p->c[ch];
if (p->len+1==q->len)
nw->fail=q;
else{
Node *clone=&d[++cnt];
memcpy(clone,q,sizeof(Node));
clone->len=p->len+1;
for (;p && p->c[ch]==q;p=p->fail)
p->c[ch]=clone;
nw->fail=q->fail=clone;
}
}
last=nw;
}
int sta[N],stb[N];
int fa[N*4][17],dep[N*4];
int get_dep(int x){
if (dep[x])
return dep[x];
if (!fa[x][0])
return dep[x]=1;
return dep[x]=get_dep(fa[x][0])+1;
}
int LCP(int u,int v){
if (dep[u]<dep[v])
swap(u,v);
for (int k=dep[u]-dep[v],i=0;k;k>>=1,++i)
if (k&1)
u=fa[u][i];
if (u==v)
return d[u].len;
for (int i=16;i>=0;--i)
if (fa[u][i]!=fa[v][i])
u=fa[u][i],v=fa[v][i];
return d[fa[u][0]].len;
}
int main(){
scanf("%s%s",a+1,b+1);
n=strlen(a+1),m=strlen(b+1);
n=min(n,m);
last=S=&d[++cnt];
for (int i=m;i>=1;--i){
insert(b[i]-'a');
stb[i]=last-d;
}
last=S;
for (int i=n;i>=1;--i){
insert(a[i]-'a');
sta[i]=last-d;
}
fa[1][0]=0;
for (int i=2;i<=cnt;++i)
fa[i][0]=d[i].fail-d;
for (int i=1;i<=cnt;++i)
get_dep(i);
for (int i=1;i<=16;++i)
for (int j=1;j<=cnt;++j)
fa[j][i]=fa[fa[j][i-1]][i-1];
int ans=0;
for (int i=1;i<=m;++i){
int lcp=LCP(stb[i],sta[1]);
if (lcp==n || lcp==n-1){
printf("%d
",n);
return 0;
}
ans=max(ans,lcp+(i+lcp<=m?1:0)+(i+lcp+1<=m?LCP(stb[i+lcp+1],sta[1+lcp+1]):0));
}
printf("%d
",ans);
return 0;
}
总结
这题应该算是一道套路题吧……
所以看题的时候,不要试着死磕一个地方,要多方面地去考虑……
比如,枚举左端点右端点什么的……