BZOJ_3998_[TJOI2015]弦论_后缀自动机
Description
对于一个给定长度为N的字符串,求它的第K小子串是什么。
Input
第一行是一个仅由小写英文字母构成的字符串S
第二行为两个整数T和K,T为0则表示不同位置的相同子串算作一个。T=1则表示不同位置的相同子串算作多个。K的意义如题所述。
Output
输出仅一行,为一个数字串,为第K小的子串。如果子串数目不足K个,则输出-1
Sample Input
aabc
0 3
0 3
Sample Output
aab
HINT
N<=5*10^5
T<2
K<=10^9
首先肯定是要一位一位确定字符,这样我们就需要两个标记。
建出后缀自动机。
设siz[i]表示i对应状态在串中出现了多少次,f[i]表示i对应子串有多少种转移方法。
siz[i]比较好求,如果表示不同位置的相同子串算作一个所有siz都为1,否则siz可以通过后缀树DP出来。
f[i]用拓扑序DP出来,初始值为siz。
然后按位确定每一位的字符即可。
代码:
#include <cstdio>
#include <string.h>
#include <algorithm>
using namespace std;
#define N 1000050
int ch[N][26],fa[N],dep[N],siz[N],cnt=1,lst=1,f[N];
int ws[N],a[N];
char w[N];
void insert(int x) {
int p=lst,np=++cnt,q,nq;
lst=np; dep[np]=dep[p]+1;
for(;p&&!ch[p][x];p=fa[p]) ch[p][x]=np;
if(!p) fa[np]=1;
else {
q=ch[p][x];
if(dep[q]==dep[p]+1) fa[np]=q;
else {
fa[nq=++cnt]=fa[q];
dep[nq]=dep[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
fa[q]=fa[np]=nq;
for(;p&&ch[p][x]==q;p=fa[p]) ch[p][x]=nq;
}
}
siz[np]=1;
}
void print() {
int i,j;
printf("test-------------------------------------------
");
for(i=1;i<=cnt;i++) {
printf("p=%d,siz=%d,dep=%d,fa=%d
",i,siz[i],dep[i],fa[i]);
for(j=0;j<26;j++) {
if(ch[i][j]) {
printf("ch(%d)(%c)=%d
",i,j+'a',ch[i][j]);
}
}
}
printf("lst=%d
",lst);
}
int main() {
int T,K;
scanf("%s%d%d",w+1,&T,&K);
int n=strlen(w+1);
int i,j,p;
for(i=1;i<=n;i++) insert(w[i]-'a');
for(i=1;i<=cnt;i++) ws[dep[i]]++;
for(i=1;i<=n;i++) ws[i]+=ws[i-1];
for(i=cnt;i;i--) a[ws[dep[i]]--]=i;
if(T) {
for(i=cnt;i;i--) {
p=a[i]; siz[fa[p]]+=siz[p];
}
}else for(i=cnt;i;i--) siz[a[i]]=1;
for(siz[1]=0,i=cnt;i;i--) {
p=a[i];
for(f[p]=siz[p],j=0;j<26;j++) f[p]+=f[ch[p][j]];
}
if(f[1]<K) puts("-1");
else {
p=1;
while(K>siz[p]) {
K-=siz[p];
for(i=0;i<26;i++) {
if(K<=f[ch[p][i]]) {printf("%c",i+'a'),p=ch[p][i]; break;}
else K-=f[ch[p][i]];
}
}
puts("");
}
}