zoukankan      html  css  js  c++  java
  • hdu 2459 (后缀数组+RMQ)

    题意:让你求一个串中连续重复次数最多的串(不重叠),如果重复的次数一样多的话就输出字典序小的那一串。

    分析:有一道比这个简单一些的题spoj 687,

    假设一个长度为l的子串重复出现两次,那么它必然会包含s[0]、s[l]、s[l*2]...之中的相邻的两个。不难看出,该重复子串必然会包含s[0..l]或s[l..l*2]或s[l*2..l*3]...。所以,我们可以枚举一个i,对于每个i*l的位置,利用后缀数组可以求出s[i*l..(i+1)*l]向后延伸的长度k。k/l+1即i*l..(i+1)*l这一段重复出现的次数。但还有一种情况。考虑以下的字符串:

    aababababab

    假设现在l=2,i=1。则当前得到的子串为ba.用后缀数组可以求得k=7,则ba共重复出现了4次。但实际上,长度为2的子串重复出现最多的应该是“ab”,出现了5次。可以看出来,上述方法求得的k不能整除l,故可能在i的左边位置存在一个子串能完整重复覆盖i这个子串后面的子串。这里是i左边一位的“ab”子串。分析下这种情况,可以得知,如果以i-(l-k%l)开头的长度为l的子串,向后延伸的长度能大于k的话,那么有一个子串出现次数为k/l+2。就这样,问题得到解决。

    这是根据罗xx大牛的论文里的解题报告得出的做法。我现在对于这种方法不是很理解,总感觉有可能会漏掉某些串,既然无话理解的话那就把它当做结论吧!!

    代码实现:

    #include<cstdio>
    #include<cstring>
    #include<iostream>
    #include<cmath>
    using namespace std;
    #define N 100005
    int ws1[N],wv[N],wa[N],wb[N];
    int rank[N],height[N],sa[N],len;
    char str[N],xiao;
    int dp[N][25];
    
    int min(int x,int y)
    {
        return x<y?x:y;
    }
    
    int cmp(int *r,int a,int b,int l)
    {
        return r[a]==r[b] && r[a+l]==r[b+l];
    }
    
    void da(char *r,int *sa,int n,int m)
    {
        int i,j,p,*x=wa,*y=wb,*t;
        for(i=0;i<m;i++)
            ws1[i]=0;
        for(i=0;i<n;i++)
            ws1[x[i]=r[i]]++;
        for(i=1;i<m;i++)
            ws1[i]+=ws1[i-1];
        for(i=n-1;i>=0;i--)
            sa[--ws1[x[i]]]=i;
        for(j=1,p=1;p<n;j*=2,m=p)
        {
            for(p=0,i=n-j;i<n;i++)
                y[p++]=i;
            for(i=0;i<n;i++)
                if(sa[i]>=j)
                    y[p++]=sa[i]-j;
            for(i=0;i<n;i++)
                wv[i]=x[y[i]];
            for(i=0;i<m;i++)
                ws1[i]=0;
            for(i=0;i<n;i++)
                ws1[wv[i]]++;
            for(i=1;i<m;i++)
                ws1[i]+=ws1[i-1];
            for(i=n-1;i>=0;i--)
                sa[--ws1[wv[i]]]=y[i];
            for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
                x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        }
    }
    
    void calheight(char *r,int *sa,int n)
    {
         int i,j,k=0;
         for(i=1;i<=n;i++)
             rank[sa[i]]=i;
         for(i=0;i<n;height[rank[i++]]=k)
             for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++) ;
    }
    
    void RMQ()//RMQ初始化
    {
        int i,j,m;
        m=(int)(log((double)len)/log(2.00));
        for(i=1;i<=len;i++)
           dp[i][0]=height[i];
        for(j=1;j<=m;j++)
            for(i=1;i+(1<<j)-1<=len;i++)
                dp[i][j]=min(dp[i][j-1],dp[i+(1<<(j-1))][j-1]);
    }
    
    int lcp(int x,int y)//求最长公共前缀
    {
        int t;
        x=rank[x];y=rank[y];
        if(x>y)
            swap(x,y);
        x++;
        t=(int)(log(double(y-x+1))/log(2.00));
        return min(dp[x][t],dp[y-(1<<t)+1][t]);
    }
    
    void solve()
    {
        int i,j,max=1,f=0,l1,num=0,t,node=1,k,cnt,p;
        for(i=1;i<=len/2;i++)//i<=len/2优化了,枚举长度不同的循环节
        {
            for(j=0;j+i<len;j+=i)
            {
               if(str[j]!=str[j+i])//这里也优化了
                   continue;
               l1=lcp(j,j+i);
               num=l1/i+1;
               p=j;
               t=i-l1%i;
               cnt=0;
               for(k=j-1;k>=0&&k+i>j&&str[k]==str[k+i];k--)//这个for循环我也不是很理解,但是大体的意思明白
               {
                   cnt++;
                   if(cnt==t)
                   {
                       num++;
                       p=k;
                   }
                   else if(rank[k]<rank[p])
                       p=k;
               }
               if(max<num)
               {
                   f=p;
                   max=num;
                   node=i;
               }
               else if(max==num&&rank[f]>rank[p])
               {
                   f=p;
                   node=i;
               }
            }
        }
        if(max==1)
        {
            printf("%c
    ",xiao);
            return ;
        }
        for(i=f;i<=f+max*node-1;i++)
            printf("%c",str[i]);
        printf("
    ");
    } 
    
    int main()
    {
        int T=0,i;
        while(scanf("%s",str)!=EOF&&str[0]!='#')
        {
            T++;
            len=strlen(str);
            xiao='z'+1;
            for(i=0;i<len;i++)
               if(str[i]<xiao)
                   xiao=str[i];
            str[len]='0';
            da(str,sa,len+1,'z'+1);
            calheight(str,sa,len);
            RMQ();
            printf("Case %d: ",T);
            solve();
        }
        return 0;
    }
  • 相关阅读:
    AndroidStudio打开新项目后解决下载某版本gradle慢的问题
    GeoServer怎样修改线性地图的颜色样式
    GeoServer简介、下载、配置启动、发布shapefile全流程(图文实践)
    AndroidStudio中打开新项目提示:This version of the Android Support plugin for IntelliJ IDEA (or Android Studio) cannot o
    若依微服务版在Windows上通过jar包运行业务模块时提示:Failed to determine s suitable driver class
    若依微服务版后台服务通过jar包部署到Windows服务器
    腾讯云centos7安装MySQL
    使用Navicat for MySQL把本地数据库上传到服务器
    浏览器页面乱码
    事务的配置
  • 原文地址:https://www.cnblogs.com/jiangjing/p/3251719.html
Copyright © 2011-2022 走看看