zoukankan      html  css  js  c++  java
  • [NOI2016]优秀的拆分

    XXI.[NOI2016]优秀的拆分

    这后缀数组越来越像一个用来求\(\operatorname{LCP}\)的工具人了……

    对于一个\(\text{AABB}\)的拆分,我们可以在中间切一刀,变成\(\text{AA}\)\(\text{BB}\)两半。这时,我们只需要设\(a_i\)表示以\(i\)为结尾的\(\text{AA}\)串数量,\(b_i\)表示以\(i\)开头的\(\text{BB}\)串数量,则答案即为\(\sum a_ib_{i+1}\)

    显然,这个可以通过hash做到\(n^2\),并且可以取得\(95\%\)的好成绩,毫无区分意义

    然后就是一个非常神仙的思路了:

    我们枚举一个长度\(len\),然后每隔\(len\)个字符设立一个关键点。则任何长度\(\geq2len\)的子串都经过且只经过两个关键点。则我们枚举每一对相邻的关键点,并尝试求出有多少个合法子串经过了它。

    我们求出这两个关键点的\(\operatorname{LCP}\)\(\operatorname{LCS(Longest Common Suffix)}\),这可以直接使用后缀数组+ST表求出。如果它们的和\(\geq len\),则显然就有合法的串经过它们,这一数量为\(\operatorname{LCP}+\operatorname{LCS}-len+1\)个。我们只需要差分就可以得到\(a\)\(b\)数组。

    因为\(\sum\limits_{i=1}^n\dfrac{n}{i}=n\log n\),所以该算法复杂度即为\(O(n\log n)\)

    记得清空所有数组!!!

    代码:

    #include<bits/stdc++.h>
    using namespace std;
    typedef long long ll;
    const int N=30100;
    int T,n,a[N],b[N];
    ll res;
    char str[N];
    struct Suffix_Array{
    	int x[N],y[N],buc[N],sa[N],ht[N],rk[N],LG[N],mn[N][16],m;
    	char s[N];
    	void init(){
    		for(int i=0;i<N;i++)x[i]=y[i]=buc[i]=sa[i]=ht[i]=rk[i]=LG[i]=0;
    		memset(mn,0,sizeof(mn));
    		m='z';
    	}
    	bool mat(int a,int b,int k){
    		if(y[a]!=y[b])return false;
    		if((a+k<n)^(b+k<n))return false;
    		if((a+k<n)&&(b+k<n))return y[a+k]==y[b+k];
    		return true;
    	}
    	void SA(){
    		for(int i=0;i<n;i++)buc[x[i]=s[i]]++;
    		for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
    		for(int i=n-1;i>=0;i--)sa[--buc[x[i]]]=i;
    		for(int k=1;k<n;k<<=1){
    			int num=0;
    			for(int i=n-k;i<n;i++)y[num++]=i;
    			for(int i=0;i<n;i++)if(sa[i]>=k)y[num++]=sa[i]-k;
    			for(int i=0;i<=m;i++)buc[i]=0;
    			for(int i=0;i<n;i++)buc[x[y[i]]]++;
    			for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
    			for(int i=n-1;i>=0;i--)sa[--buc[x[y[i]]]]=y[i];
    			swap(x,y);
    			x[sa[0]]=num=0;
    			for(int i=1;i<n;i++)x[sa[i]]=mat(sa[i],sa[i-1],k)?num:++num;
    			if(num>=n-1)break;
    			m=num;
    		}
    		for(int i=0;i<n;i++)rk[sa[i]]=i;
    		for(int i=0,k=0;i<n;i++){
    			if(!rk[i])continue;
    			if(k)k--;
    			int j=sa[rk[i]-1];
    			while(i+k<n&&j+k<n&&s[i+k]==s[j+k])k++;
    			ht[rk[i]]=k;
    		}
    		for(int i=2;i<n;i++)LG[i]=LG[i>>1]+1;
    		for(int i=1;i<n;i++)mn[i][0]=ht[i];
    		for(int j=1;j<=LG[n-1];j++)for(int i=1;i+(1<<j)-1<n;i++)mn[i][j]=min(mn[i][j-1],mn[i+(1<<(j-1))][j-1]);
    	}
    	int RMQ(int l,int r){
    		if(l>=n||r>=n||l<0||r<0)return 0;
    		l=rk[l],r=rk[r];
    		if(l>r)swap(l,r);
    		l++;
    		int k=LG[r-l+1];
    		return min(mn[l][k],mn[r-(1<<k)+1][k]);
    	}
    }pre,suf;
    int main(){
    	scanf("%d",&T);
    	while(T--){
    		scanf("%s",str),n=strlen(str),memset(a,0,sizeof(a)),memset(b,0,sizeof(b)),res=0;
    		pre.init(),suf.init();
    		memcpy(pre.s,str,sizeof(str)),memcpy(suf.s,str,sizeof(str)),reverse(pre.s,pre.s+n);
    //		printf("%s\n%s\n",pre.s,suf.s);
    		pre.SA(),suf.SA();
    //		for(int i=0;i<n;i++)printf("%d ",pre.rk[i]);puts("");
    //		for(int i=0;i<n;i++)printf("%d ",suf.rk[i]);puts("");
    		for(int len=1;len<=n/2;len++)for(int i=0;i+len<n;i+=len){
    			int p=i,q=i+len,r=n-q,s=n-p;
    			int LCP=min(suf.RMQ(p,q),len);
    			int LCS=min(pre.RMQ(r,s),len-1);
    			int Delta=LCP+LCS-len+1;
    			if(Delta>=0)b[p-LCS]++,b[p-LCS+Delta]--,a[q+LCP-Delta]++,a[q+LCP]--;
    		}
    //		for(int i=0;i<n;i++)printf("(%d %d)\n",a[i],b[i]);
    		for(int i=1;i<n;i++)a[i]+=a[i-1],b[i]+=b[i-1];
    		for(int i=1;i<n;i++)res+=a[i-1]*b[i];
    		printf("%lld\n",res);
    	}
    	return 0;
    }
    

  • 相关阅读:
    mysql高级查询
    RabbitMq应用一的补充(RabbitMQ的应用场景)
    LNMP的并发配置和资源分配
    大神教你Nginx常用基础配置方案
    案例:配置apache和nginx的SSL加密传输协议
    Nginx配置服务器静态文件支持跨域访问
    菜鸟学习计划浅谈之Linux系统
    细述:nginx http内核模块提供的变量和解释
    如何在Linux中使用Firejail运行应用程序
    一款用于对 WiFi 接入点安全进行渗透测试的工具
  • 原文地址:https://www.cnblogs.com/Troverld/p/14605320.html
Copyright © 2011-2022 走看看