zoukankan      html  css  js  c++  java
  • 后缀自动机板子和一些用法

    后缀自动姬

    是什么?
    博主不想写反正没人看
    直接去(hihocoder)
    概念1
    算法2

    模板

    # include <bits/stdc++.h>
    # define IL inline
    # define RG register
    # define Fill(a, b) memset(a, b, sizeof(a))
    using namespace std;
    typedef long long ll;
    
    template <class Int>
    IL void Input(RG Int &x){
    	RG int z = 1; RG char c = getchar(); x = 0;
    	for(; c < '0' || c > '9'; c = getchar()) z = c == '-' ? -1 : 1;
    	for(; c >= '0' && c <= '9'; c = getchar()) x = (x << 1) + (x << 3) + (c ^ 48);
    	x *= z;
    }
    
    const int maxn(2e6 + 5);
    
    int n, trans[26][maxn], fa[maxn], len[maxn], tot = 1, last = 1;
    char s[maxn];
    
    IL void Extend(RG int c){
    	RG int np = ++tot, p = last; last = np;
    	len[np] = len[p] + 1;
    	while(p && !trans[c][p]) trans[c][p] = np, p = fa[p];
    	if(!p) fa[np] = 1;
    	else{
    		RG int q = trans[c][p];
    		if(len[p] + 1 == len[q]) fa[np] = q;
    		else{
    			RG int nq = ++tot;
    			len[nq] = len[p] + 1, fa[nq] = fa[q];
    			for(RG int i = 0; i < 26; ++i) trans[i][nq] = trans[i][q];
    			fa[q] = fa[np] = nq;
    			while(p && trans[c][p] == q) trans[c][p] = nq, p = fa[p];
    		}
    	}
    }
    
    int main(RG int argc, RG char* argv[]){
    	scanf(" %s", s), n = strlen(s);
    	for(RG int i = 0; i < n; ++i) Extend(s[i] - 'a');
    	return 0;
    }
    
    

    用法

    一个串不同子串的个数

    就是(endpos(right))集合的大小和
    就是(sum_{i}len[i]-len[fa[i]])

    两个串的最长公共子串长度

    一个串建立(sam)
    另一个串匹配就好啦

    for(RG int i = 0, nw = 1, cnt = 0; i < n; ++i){
        RG int c = s[i] - 'a';
        if(trans[c][nw]) ++cnt, nw = trans[c][nw];
        else{
            while(nw && !trans[c][nw]) nw = fa[nw];
            if(!nw) nw = 1, cnt = 0;
            else cnt = len[nw] + 1, nw = trans[c][nw];
        }
        ans = max(ans, cnt);
    }
    

    拓扑序的快速求法

    (len)来个桶排序

    for(RG int i = 1; i <= tot; ++i) ++t[len[i]];
    for(RG int i = 1; i <= tot; ++i) t[i] += t[i - 1];
    for(RG int i = 1; i <= tot; ++i) id[t[len[i]]--] = i;
    

    多个串的最长公共子串

    一个串建立(sam)
    其它的串在上面匹配
    可以类似(DP)的在拓扑序上转移

    for(RG int i = 1; i <= tot; ++i) ++t[g[i] = len[i]];
    for(RG int i = 1; i <= tot; ++i) t[i] += t[i - 1];
    for(RG int i = 1; i <= tot; ++i) id[t[len[i]]--] = i;
    while(scanf(" %s", s) != EOF){
        n = strlen(s);
        for(RG int i = 1; i <= tot; ++i) f[i] = 0;
        for(RG int i = 0, nw = 1, cnt = 0; i < n; ++i){
            RG int c = s[i] - 'a';
            if(trans[c][nw]) ++cnt, nw = trans[c][nw];
            else{
                while(nw && !trans[c][nw]) nw = fa[nw];
                if(!nw) nw = 1, cnt = 0;
                else cnt = len[nw] + 1, nw = trans[c][nw];
            }
            f[nw] = max(f[nw], cnt);
        }
        for(RG int i = tot; i; --i) f[fa[id[i]]] = max(f[fa[id[i]]], f[id[i]]);
        for(RG int i = 1; i <= tot; ++i) g[i] = min(g[i], f[i]);
    }
    for(RG int i = 1; i <= tot; ++i) ans = max(ans, g[i]);
    

    某一字符串出现的次数

    大概就是求出(parent)树上每个点的子树大小,就是这个点的(endpos(right))集合的串的出现次数
    然后搞一搞就好了

    第k小子串

    相同的不算

    每条从起点开始的路径都是一个子串
    那么就是求出第(k)小的路径,跑一遍就好了

    相同的算多个

    也就是一个(endpos(right))集合内的串要算上出现次数
    其它的基本和上面相似

  • 相关阅读:
    团队作业2 需求分析与原型设计
    团队作业1
    获取公众号关注二维码url
    用户绑定公众号列表与未绑定公众号列表
    修改个人信息
    公众号登录
    idea去掉右侧小窗口代码块预览,idea去掉右侧代码预览
    微信退款 订单金额或退款金额与之前请求不一致,请核实后再试
    取消支付
    linux命令发送请求
  • 原文地址:https://www.cnblogs.com/cjoieryl/p/8870149.html
Copyright © 2011-2022 走看看