zoukankan      html  css  js  c++  java
  • POJ 3693 Maximum repetition substring(后缀数组+ST表)

    【题目链接】 poj.org/problem?id=3693

     

    【题目大意】

      求一个串重复次数最多的连续重复子串并输出,要求字典序最小。

    【题解】

      考虑错位匹配,设重复部分长度为l,记s[i]和s[i+l]前缀匹配得到的最长长度为r,
      枚举所有的l和i,得到r,那么答案就是r/l+1的最大值。
      计算任意后缀的最长公共前缀可以利用后缀数组+ST表来解决,  
      两个后缀的最长公共前缀就是他们名次之间的h数组的最小值。
      显然,枚举i和l的复杂度达到了O(n2),是没有办法完成统计的,
      我们发现每个区段只会存在一个最大值,所以我们以l为步长枚举i,
      通过计算一次LCP获得这个最长长度的起始位置k,
      再求一次k位置和k+l位置的LCP,就可以得到这个区段的答案。
      最后考虑字典序的问题,我们将所有的最大值的长度保存在来,
      根据sa数组进行LCP验证,因为是按照sa进行,
      所以找到的第一个符合答案的位置就是字典序最小的。

    【代码】

    #include <cstdio>
    #include <cstring>
    #include <algorithm>
    using namespace std;
    const int N=4000010;
    int n,m,Rank[N],sa[N],h[N],tmp[N],cnt[N],ans;char s[N],t[N];
    void suffixarray(int n,int m){
        int i,j,k;n++;
        for(i=0;i<2*n+5;i++)Rank[i]=sa[i]=h[i]=tmp[i]=0;
        for(i=0;i<m;i++)cnt[i]=0;
        for(i=0;i<n;i++)cnt[Rank[i]=s[i]]++;
        for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
        for(i=0;i<n;i++)sa[--cnt[Rank[i]]]=i;
        for(k=1;k<=n;k<<=1){
            for(i=0;i<n;i++){
                j=sa[i]-k;
                if(j<0)j+=n;
                tmp[cnt[Rank[j]]++]=j;
            }sa[tmp[cnt[0]=0]]=j=0;
            for(i=1;i<n;i++){
                if(Rank[tmp[i]]!=Rank[tmp[i-1]]||Rank[tmp[i]+k]!=Rank[tmp[i-1]+k])cnt[++j]=i;
                sa[tmp[i]]=j;
            }memcpy(Rank,sa,n*sizeof(int));
            memcpy(sa,tmp,n*sizeof(int));
            if(j>=n-1)break;
        }for(j=Rank[h[i=k=0]=0];i<n-1;i++,k++)
        while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=Rank[sa[j]+1];
    }
    int f[N][30],lg2[N];
    void rmq_init(int n){  
        for(int i=2;i<=n;i++)lg2[i]=lg2[i/2]+1;
        for(int i=1;i<=n;i++)f[i][0]=h[i];
        for(int j=1;(1<<j)<=n;j++)  
        for(int i=1;i+(1<<j)-1<=n;i++)
            f[i][j]=min(f[i][j-1],f[i+(1<<(j-1))][j-1]);
    } 
    int rmq_min(int l,int r){
        if(l>r)swap(l,r);l++;
        int k=lg2[r-l+1];
        return min(f[l][k],f[r-(1<<k)+1][k]);
    }
    int Cas=1,a[N];
    int main(){
        while(~scanf("%s",s)&&s[0]!='#'){
            n=strlen(s);
            suffixarray(n,128);
            rmq_init(n);
            int cnt=0,Max=0;
            for(int l=1;l<n;l++){
                for(int i=0;i+l<n;i+=l){
                    int r=rmq_min(Rank[i],Rank[i+l]),step=r/l+1,k=i-(l-r%l);
                    if(k>=0&&r%l)if(rmq_min(Rank[k],Rank[k+l])>=r)step++;
                    if(step>Max){Max=step;cnt=0;a[cnt++]=l;}
                    else if(step==Max)a[cnt++]=l;
                }
            }int len=-1,st;
            for(int i=1;i<=n&&len==-1;i++){
                for(int j=0;j<cnt;j++){
                    int l=a[j];
                    if(rmq_min(Rank[sa[i]],Rank[sa[i]+l])>=(Max-1)*l){
                        len=l;st=sa[i];break;
                    }
                }
            }printf("Case %d: ",Cas++);
            for(int i=st,j=0;j<len*Max;j++,i++)printf("%c",s[i]);
            puts("");
        }return 0;
    }
    

      

  • 相关阅读:
    C语言中static修饰符的意义
    网络字节序
    socket接口详解
    Python实现常见算法[3]——汉罗塔递归
    Python实现常见算法[2]——快速排序
    Python实现常见算法[1]——冒泡排序
    关于钛星设备主动推送报文的解析
    2015自我提升计划
    python 基础(函数 命名空间和作用域,嵌套和作用域链,闭包)
    python 基础(文件操作,注册,以及函数)
  • 原文地址:https://www.cnblogs.com/forever97/p/poj3693.html
Copyright © 2011-2022 走看看