zoukankan      html  css  js  c++  java
  • HDU 3948 The Number of Palindromes(Manacher+后缀数组)

    题意

    求一个字符串中本质不同的回文子串的个数。

    $ 1leq |string| leq 100000$

    思路

    好像是回文自动机的裸题,但是可以用 ( ext{Manacher}) (马拉车)算法配合后缀数组(或配合哈希表)解决。

    ( ext{Manacher}) 算法非常短小精悍,它可以在线性时空内求出以每个点为中心拓展的最远距离,筛出与 (n) 同阶个数个回文串,这些回文串包含原串所有本质不同的回文串。

    为了判掉奇偶串的问题,我们为字符串穿插一个特殊字符,如字符串 abccba,就变成了 #a#b#c#c#b#a#。

    设每个点向两边拓展形成的最远距离(包含本身)为数组 (p) ,那么上述字符串对应的 (p) 数组如下:

    str # a # b # c # c # b # a #
    p 1 2 1 2 1 2 7 2 1 2 1 2 1

    不难看出,(max{p}-1) 就是原串的最长回文串长度,同理每个字符向两边拓展的最远距离也可以得到。

    算法流程也比较简短,首先维护两个变量,(mr( ext{max right}))(pos( ext{mid position})) ,分别表示已经求出右端点最靠右的子串的右端点和中心位置。如果目前要求的 (i) 节点没有超过 (mr),那么 (p[i]) 就可以是 (p[2*pos-i]) (对称点),但要对 (mr-i+1)(min),因为在 (mr) 右边的字符还不知道。如果 (i) 节点超过了 (mr) ,那就先直接取 (1) 。接下来就暴力继续匹配,因为一次成功匹配必然会带动右端点的推动,所以复杂度是 (O(n)) 的,代码如下:

    void Manacher(char *str,int len)
    {
    	int n=1;
    	mnc[1]='#';
    	FOR(i,1,len)mnc[++n]=str[i],mnc[++n]='#';
    	int mr=0,pos;
    	FOR(i,1,n)
    	{
    		if(i<=mr)p[i]=std::min(p[(pos<<1)-i],mr-i+1);
    		else p[i]=1;
    		while(i-p[i]>=1&&i+p[i]<=n&&mnc[i-p[i]]==mnc[i+p[i]])p[i]++;
    		if(chk_max(mr,i+p[i]-1))pos=i;
    	}
    }
    

    ( ext{Manacher}) 算法进行 p[i]++ 时可以得到所有本质不同的回文串(不保证无重复)。

    注意到一个与已经找过的串本质不同的回文串,一定能通过一次推动右端点得到,并且一次推动右端点最多增加一个回文串(如果以这个位置为右端点存在多个回文串,那么不是最长的串肯定在之前算过),这也同时证明了一个串内本质不同的回文子串是 (O(n)) 级别的。

    那么可以利用 ( ext{Manacher}) 求出若干个回文串,这一定包含了所有本质不同的回文子串,我们只用对它进行去重即可,后缀数组可以很方便的实现它,对长度相同的串,按 (rk) 进行排序,比较 ( ext{lcp}) 是否为串长即可。

    代码

    #include<bits/stdc++.h>
    #define FOR(i,x,y) for(int i=(x),i##END=(y);i<=i##END;++i)
    #define DOR(i,x,y) for(int i=(x),i##END=(y);i>=i##END;--i)
    template<typename T,typename _T>inline bool chk_min(T &x,const _T y){return y<x?x=y,1:0;}
    template<typename T,typename _T>inline bool chk_max(T &x,const _T y){return x<y?x=y,1:0;}
    typedef long long ll;
    const int N=2e5+5;
    struct SparseTable
    {
    	int st[N][19],bin[(1<<18)+5];
    	void init(int *arr,int n)
    	{
    		bin[1]=0;FOR(i,2,1<<18)bin[i]=bin[i>>1]+1;
    		FOR(i,1,n)st[i][0]=arr[i];
    		FOR(j,1,18)FOR(i,1,n-(1<<j)+1)
    			st[i][j]=std::min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
    	}
    	int query(int l,int r)
    	{
    		int k=bin[r-l+1];
    		return std::min(st[l][k],st[r-(1<<k)+1][k]);
    	}
    }SH;
    int sa[N],rk[N],H[N],tmp[3][N];
    char str[N];
    char mnc[N];int p[N];
    int n;
    
    struct node 
    {
    	int l,r;
    	bool operator <(const node &_)const
    	{
    		if(r-l+1!=_.r-_.l+1)return r-l+1<_.r-_.l+1;
    		else return rk[l]<rk[_.l];
    	}
    }pld[N];int pc;
    
    void get_SA(char *s,int n,int m)
    {
    	int *x=tmp[0],*y=tmp[1],*c=tmp[2];
    	memset(tmp,0,sizeof(tmp));
    	x[n+1]=y[n+1]=0;
    	FOR(i,1,m)c[i]=0;
    	FOR(i,1,n)c[x[i]=s[i]]++;
    	FOR(i,2,m)c[i]+=c[i-1];
    	DOR(i,n,1)sa[c[x[i]]--]=i;
    	for(int k=1;k<=n;k<<=1)
    	{
    		int p=0;
    		FOR(i,n-k+1,n)y[++p]=i;
    		FOR(i,1,n)if(sa[i]>k)y[++p]=sa[i]-k;
    		FOR(i,1,m)c[i]=0;
    		FOR(i,1,n)c[x[y[i]]]++;
    		FOR(i,2,m)c[i]+=c[i-1];
    		DOR(i,n,1)sa[c[x[y[i]]]--]=y[i];
    		std::swap(x,y);
    		p=x[sa[1]]=1;
    		FOR(i,2,n)x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p:++p;
    		if(n==p)break;
    		m=p;
    	}
    	FOR(i,1,n)rk[sa[i]]=i;
    	int k=0;
    	FOR(i,1,n)
    	{
    		if(k)k--;
    		if(rk[i]==1)continue;
    		int j=sa[rk[i]-1];
    		while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k])k++;
    		H[rk[i]]=k;
    	}
    	SH.init(H,n);
    }
    
    int get_lcp(int x,int y)
    {
    	if(x==y)return n-x+1;
    	x=rk[x],y=rk[y];
    	if(x>y)std::swap(x,y);
    	return SH.query(x+1,y);
    }
    
    void Manacher(char *str,int len)
    {
    	int n=1;
    	mnc[1]='#';
    	FOR(i,1,len)mnc[++n]=str[i],mnc[++n]='#';
    	pc=0;
    	int mr=0,pos;
    	FOR(i,1,n)
    	{
    		if(i<=mr)p[i]=std::min(p[(pos<<1)-i],mr-i+1);
    		else p[i]=1;
    		while(i-p[i]>=1&&i+p[i]<=n&&mnc[i-p[i]]==mnc[i+p[i]])
    		{
    			p[i]++;
    			if(mnc[i-p[i]+1]=='#')
    				pld[++pc]=(node){(i-p[i]+1+1)/2,(i+p[i]-1-1)/2};
    		}
    		if(chk_max(mr,i+p[i]-1))pos=i;
    	}
    }
    
    int main()
    {
    	int T;
    	scanf("%d",&T);
    	FOR(Ti,1,T)
    	{
    		scanf("%s",str+1);
    		n=strlen(str+1);
    		get_SA(str,n,256);
    		Manacher(str,n);
    		std::sort(pld+1,pld+1+pc);
    		int ans=1;
    		FOR(i,2,pc)
    		{
    			if(pld[i].r-pld[i].l+1==pld[i-1].r-pld[i-1].l+1&&get_lcp(pld[i].l,pld[i-1].l)>=pld[i].r-pld[i].l+1)
    				continue;
    			else ans++;
    		}
    		printf("Case #%d: %d
    ",Ti,ans);
    	}
    	return 0;
    }
    
  • 相关阅读:
    在二元树中查找和为某一值的所有路径
    求整数的二进制表示1的个数
    Javascript AJAX 解析XML 兼容FIREFOX/IE
    DOM解析XML笔记
    Linux c 共享内存
    C Socket 发送/接收数据结构
    Linux c 获取系统内存
    7.5备忘
    linux c 唤醒进程 获取子进程结束状态
    7.1-7.2备忘
  • 原文地址:https://www.cnblogs.com/Paulliant/p/10750500.html
Copyright © 2011-2022 走看看