zoukankan      html  css  js  c++  java
  • SPOJ NSUBSTR Substrings 子串计数

    vjudge传送门


    题面:给以个长度为(2.5*10^5)的小写字母组成的字符串,令(F(x))表示长度为(x)的子串出现次数的最大值,求(F(i)).


    这个算是SAM的裸题吧。
    先把SAM建出来,然后统计每一个节点的endpos个数(siz[u]),那么(max {siz[u] }(len[u]=i))就是(F(i))


    有人会问,这样只是把长度为(len[u])的子串更新了,但是这个节点包含了长度在([len[fa[u]]]+1,len[u]])的子串啊,这些子串没有更新!
    事实上,这些子串虽然没有在这个节点被更新,也一定会在其他节点更新。
    拿"bcaab"为例:假如这个节点存的串是"aab"到"bcaab",那么我们只更新了"bcaab"代表的长度,即(F(5)),而"caab"和"aab",即(F(4))(F(3))都没有被更新。但是所有出现(bcaab)的位置,"bcaa"和"bca"(即前缀)也都出现了呀,所以可能在"bcaa"和"bca"所在的节点更新(F(4))(F(3)),而且这个值肯定不小于(bcaab)的出现次数。不过有可能"bcaa"也不是该等价类中长度最大的串,比如前面还有一个'a',我们仍然可以用“替换”的思想,将“bcaa”替换成“abcaa”中的“abca”,同样可以用来更新(F(4)).
    值得一提的是,一直这么替换下去,不仅能保证最后会更新(F(4)),还保证了出现次数不递减,因为这个替换的条件就是被替换的串出现的位置替换后的串一定都会出现。
    因此,最后求出的(F(i))一定是出现次数的最大值。

    #include<cstdio>
    #include<iostream>
    #include<cmath>
    #include<algorithm>
    #include<cstring>
    #include<cstdlib>
    #include<cctype>
    #include<vector>
    #include<queue>
    using namespace std;
    #define enter puts("") 
    #define space putchar(' ')
    #define Mem(a, x) memset(a, x, sizeof(a))
    #define In inline
    typedef long long ll;
    const int maxn = 2.5e5 + 5;
    const int maxs = 27;
    In ll read()
    {
    	ll ans = 0;
    	char ch = getchar(), las = ' ';
    	while(!isdigit(ch)) las = ch, ch = getchar();
    	while(isdigit(ch)) ans = (ans << 1) + (ans << 3) + ch - '0', ch = getchar();
    	if(las == '-') ans = -ans;
    	return ans;
    }
    In void write(ll x)
    {
    	if(x < 0) x = -x, putchar('-');
    	if(x >= 10) write(x / 10);
    	putchar(x % 10 + '0');
    }
    
    char s[maxn];
    int Max[maxn];
    struct Sam
    {
    	int tra[maxn << 1][maxs], link[maxn << 1], len[maxn << 1], siz[maxn << 1], cnt, las;
    	In void init() {link[cnt = las = 0] = -1;}	
    	In void insert(int c)
    	{
    		int now = ++cnt, p = las;
    		len[now] = len[p] + 1, siz[now] = 1;
    		while(~p && !tra[p][c]) tra[p][c] = now, p = link[p];
    		if(p == -1) link[now] = 0;
    		else
    		{
    			int q = tra[p][c];
    			if(len[q] == len[p] + 1) link[now] = q;
    			else
    			{
    				int clo = ++cnt;
    				memcpy(tra[clo], tra[q], sizeof(tra[q]));
    				len[clo] = len[p] + 1;
    				link[clo] = link[q]; link[q] = link[now] = clo;
    				while(~p && tra[p][c] == q) tra[p][c] = clo, p = link[p];
    			}
    		}
    		las = now;
    	}
    	int buc[maxn << 1], pos[maxn << 1];
    	In void solve()
    	{
    		for(int i = 1; i <= cnt; ++i) buc[len[i]]++;
    		for(int i = 1; i <= cnt; ++i) buc[i] += buc[i - 1];
    		for(int i = 1; i <= cnt; ++i) pos[buc[len[i]]--] = i;
    		for(int i = cnt; i; --i)
    		{
    			int now = pos[i], fa = link[now];
    			siz[fa] += siz[now];
    			Max[len[now]] = max(Max[len[now]], siz[now]);
    		}
    	}
    }S;
    
    int main()
    {
    	scanf("%s", s);
    	int n = strlen(s); S.init();
    	for(int i = 0; i < n; ++i) S.insert(s[i] - 'a'); 
    	S.solve();
    //	for(int i = n - 1; i; --i) Max[i] = max(Max[i], Max[i + 1]);	//这句话不用加 
    	for(int i = 1; i <= n; ++i) write(Max[i]), enter;
    	return 0;
    }
    
  • 相关阅读:
    Anaconda 换国内源、删源最全集锦(转载)
    【2019】安装anaconda及环境变量的配置(安装第三方库测试)(转载)
    python 中 urlparse 模块介绍
    正则表达式之前瞻后顾
    indows下如何安装python第三方库lxml
    Ubuntu下开启SSH服务 vs:18
    Linux终端访问网页
    关于ubuntu无线网络配置
    SQL语句报错,无法绑定由多个部分组成的标识符解决
    "@P0"附近有语法错误解释及定位修复
  • 原文地址:https://www.cnblogs.com/mrclr/p/14556404.html
Copyright © 2011-2022 走看看