Sam 的一些总结
注意在子串在某个节点的性质,其 father 上也会有相同的性质
1. 统计子串出现的次数
- 在 (parent) 树上做 (dp),对于每一个节点,初始化为 (dp[i] = 1),然后 (dp[father] = sum dp[son])。
2. 子串的个数
- 利用后缀数组,(sum_{i=2}^{n} len-sa[i]+1-height[i]) 就是答案
- 利用后缀自动机,(dp[i]) 表示第 (i) 个节点拥有的字符串个数,可以让 (v in u'next),(dp[u] = sum dp[v]),最后的 (dp[1]-1) 就是答案。
- 利用后缀自动机,(sum_{i=2}^{sz} node[i].len - node[father].len) 就是答案。
3. 子串出现的最左和最后位置
- 在构建后缀自动机的时候,令 (left[np] = right[np] = id),如此可以求出最左位置。
- 在 (parent) 树上跑,(right[father] = max(right[father], right[son])),如此可以求出最右位置。
4. 求 LCS
- 每次匹配的的时候看当前匹配的时候 (p) 有没有往一条 (char) 的边,没有的话往 (fa[p]),如果一直跳到 (p=0),就重新赋值 (p=1,res=0),否则就往 (node[p][char]) 跳,并让 (res++)。
- 求多个字符串的时候,就要考虑往 (father) 上的更新。
5. 求字典序第 k 小
- 先 (dfs) 出每个节点往后有多少子串,然后从小到大在 (dfs) 一边找到第 (k) 大。
- 如果 (v) 往后的字符串比 (k) 小,那么直接 (k-cnt[v])
- 否则往下走一步,并让 (k-)(-)。
6. Sam 上的基数排序
for(int i=0; i<=sz; i++) tax[i] = 0;
for(int i=1; i<=sz; i++) tax[step[i]]++;
for(int i=1; i<=sz; i++) tax[i] += tax[i-1];
for(int i=1; i<=sz; i++) gid[tax[step[i]]--] = i;
7. Sam模板
struct Sam {
int node[maxn<<1][27], fa[maxn<<1], step[maxn<<1];
int sz, last;
int newnode() {
mes(node[++sz], 0);
fa[sz] = step[sz] = 0;
return sz;
}
void init() {
sz = 0;
last = newnode();
}
void insert(int k) {
int p = last, np = last = newnode();
step[np] = step[p]+1;
for(; p&&!node[p][k]; p=fa[p])
node[p][k] = np;
if(p==0) {
fa[np] = 1;
} else {
int q = node[p][k];
if(step[q] == step[p]+1) {
fa[np] = q;
} else {
int nq = ++sz;
memcpy(node[nq], node[q], sizeof(node[q]));
fa[nq] = fa[q];
step[nq] = step[p]+1;
fa[np] = fa[q] = nq;
for(; p&&node[p][k]==q; p=fa[p])
node[p][k] = nq;
}
}
}
} sam;