题目
对于一个给定长度为N的字符串,求它的第K小子串是什么。
输入格式
第一行是一个仅由小写英文字母构成的字符串S
第二行为两个整数T和K,T为0则表示不同位置的相同子串算作一个。T=1则表示不同位置的相同子串算作多个。K的意义如题所述。
输出格式
输出仅一行,为一个数字串,为第K小的子串。如果子串数目不足K个,则输出-1
输入样例
aabc
0 3
输出样例
aab
提示
N<=5*10^5
T<2
K<=10^9
题解
肝了一个中午的论文还是想了好久这种裸题。。
由后缀自动机从根节点走每个节点都是一种子串的性质,我们能很快解决T=0的问题
T=0:
令每个节点值都为1【除了根】,按拓扑逆序向儿子统计
T=1:
每个点不再只是代表一个串了,其代表的串的个数等于其Right集合的大小
那么在parent树上统计每个点子树中的结束节点有多少个
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define LL long long int
#define REP(i,n) for (int i = 1; i <= (n); i++)
#define Redge(u) for (int k = h[u]; k; k = ed[k].nxt)
using namespace std;
const int maxn = 1000005,maxm = 100005,INF = 1000000000;
int pre[maxn],step[maxn],ch[maxn][26],last,cnt,n,sz[maxn];
int a[maxn],b[maxn],sum[maxn];
char s[maxn];
void ins(int x){
int p = last,np = ++cnt;
last = np; step[np] = step[p] + 1;
while (p && !ch[p][x]) ch[p][x] = np,p = pre[p];
if (!p) pre[np] = 1;
else {
int q = ch[p][x];
if (step[q] == step[p] + 1) pre[np] = q;
else {
int nq = ++cnt; step[nq] = step[p] + 1;
for (int i = 0; i < 26; i++) ch[nq][i] = ch[q][i];
pre[nq] = pre[q]; pre[np] = pre[q] = nq;
while (ch[p][x] == q) ch[p][x] = nq,p = pre[p];
}
}
sz[np] = 1;
}
void dfs(int u,int k){
if (k <= sz[u]) return;
k -= sz[u];
for (int i = 0; i < 26; i++){
if (int t = ch[u][i]){
if (k <= sum[t]){
putchar('a'+ i);
dfs(t,k);
return;
}
k -= sum[t];
}
}
}
void solve(){
int T,k;
scanf("%d%d",&T,&k);
REP(i,cnt) b[step[i]]++;
REP(i,cnt) b[i] += b[i - 1];
REP(i,cnt) a[b[step[i]]--] = i;
for (int i = cnt; i; i--){
int u = a[i];
if (T == 1) sz[pre[u]] += sz[u];
else sz[u] = 1;
}
sz[1] = 0;
for (int i = cnt; i; i--){
int u = a[i]; sum[u] = sz[u];
for (int j = 0; j < 26; j++)
sum[u] += sum[ch[u][j]];
}
REP(i,cnt) printf("%d ",sum[i]); puts("");
if (k > sum[1]) {puts("-1"); return;}
dfs(1,k);
}
int main(){
scanf("%s",s + 1);
n = strlen(s + 1); last = cnt = 1;
REP(i,n) ins(s[i] - 'a');
solve();
return 0;
}