zoukankan      html  css  js  c++  java
  • 2016vijos 1-1 兔子的字符串(后缀数组 + 二分 + 哈希)

    题意:

    给出一个字符串,至多将其划分为n部分,每一部分取出字典序最大的子串ci,最小化 最大的ci

    先看一个简化版的问题:

    给一个串s,再给一个s的子串t,问能否通过将串划分为k个部分,使t成为划分后的s的字典序最大子串

     
    对于这个问题,从串s的最后面开始,一个字符一个字符的向前推
    如果当前[l,r]字典序比t大,那么[l+1,r]就要单独成为一段
    比较子串字典序大小用二分+哈希
    因为我们是一个字符一个字符的向前推的,所以一定是新的l使当前[l,r]字典序比t大
    所以如果此时l==r,那么这个t不可能成为字典序最大子串
    如果最后部分数<=k,则这个t可以
     
    那么本题只需要二分子串t就好了
    所以现在问题变成如何获取字典序 排名第k的子串
    这个可以通过后缀数组的height求出
    [sa[1],sa[1]] 是字典序第1小
    [sa[1],sa[1]+1]是字典序第2小
    ……
    [sa[1],n]是字典序第n-sa[1]+1 小
    [sa[2],sa[2]+height[2]] 是下一个
    再下一个是 [sa[2],sa[2]+height[2]+1]
    …… 
     
    #include<cstdio>
    #include<cstring>
    #include<algorithm>
    
    using namespace std;
    
    #define N 100001
    
    typedef long long LL;
    
    const int base=13331;
    
    int n,m;
    char s[N];
    
    int a[N];
    int v[N];
    int p,q=1,k;
    int sa[2][N],rk[2][N];
    int h[N];
    
    unsigned long long Pow[N],has[N];
    
    pair<int,int>interval[N];
    
    void mul(int *sa,int*rk,int *SA,int *RK)
    {
        for(int i=1;i<=n;++i) v[rk[sa[i]]]=i;
        for(int i=n;i;--i) if(sa[i]>k) SA[v[rk[sa[i]-k]]--]=sa[i]-k;
        for(int i=n-k+1;i<=n;++i) SA[v[rk[i]]--]=i;
        for(int i=1;i<=n;++i) RK[SA[i]]=RK[SA[i-1]]+(rk[SA[i]]!=rk[SA[i-1]] || rk[SA[i]+k]!=rk[SA[i-1]+k]);
    }
    
    void presa()
    {
        for(int i=1;i<=n;++i) v[a[i]]++;
        for(int i=1;i<=26;++i) v[i]+=v[i-1];
        for(int i=1;i<=n;++i) sa[p][v[a[i]]--]=i;
        for(int i=1;i<=n;++i) rk[p][sa[p][i]]=rk[p][sa[p][i-1]]+(a[sa[p][i]]!=a[sa[p][i-1]]);
        for(k=1;k<n;k<<=1,swap(p,q)) mul(sa[p],rk[p],sa[q],rk[q]);
    }
    
    void get_height()
    {
        int j,k=0;
        for(int i=1;i<=n;++i)
        {
            j=sa[p][rk[p][i]-1];
            while(a[i+k]==a[j+k]) k++;
            h[rk[p][i]]=k;
            if(k) k--;
        }
    }
    
    void prehash()
    {
        Pow[0]=1;
        for(int i=1;i<=n;++i) Pow[i]=Pow[i-1]*base;
        for(int i=1;i<=n;++i) has[i]=has[i-1]*base+a[i];
    }
    
    pair<int,int>select(LL k)
    {
        int now;
        LL sum=0;
        int l,r;
        for(int i=1;i<=n;++i) 
        {
            now=interval[i].second-interval[i].first+1;
            if(sum+now>=k)
            {
                l=sa[p][i];
                r=interval[i].first+k-sum-1;
                return make_pair(l,r);
            }
            sum+=now;
        }
    }
    
    unsigned long long get_hash(int l,int r)
    {
        return has[r]-has[l-1]*Pow[r-l+1];
    }
    
    int cmp(pair<int,int>x,pair<int,int>y)
    {
        if(get_hash(x.first,x.second)==get_hash(y.first,y.second)) return 0;
        int Lx=x.second-x.first+1,Ly=y.second-y.first+1;
        int l=1,r=min(Lx,Ly),mid,tmp=0;
        while(l<=r)
        {
            mid=l+r>>1;
            if(get_hash(x.first,x.first+mid-1)==get_hash(y.first,y.first+mid-1)) tmp=mid,l=mid+1;
            else r=mid-1;
        }
        if(tmp<min(Lx,Ly)) return s[x.first+tmp]<s[y.first+tmp] ? -1 : 1;
        return Lx<Ly ? -1 : 1;
    }
    
    bool check(pair<int,int>now)
    {
        int l=n,r=n,sum=1;
        while(l>=1)
            if(cmp(make_pair(l,r),now)==1) 
            {
                if(l==r) return false;
                r=l;
                sum++;
                if(sum>m) return false;
            }
            else l--;
        return true;
    }
    
    void solve()
    {
        LL l=1,r=0;
        for(int i=1;i<=n;++i)
        {
            interval[i].first=sa[p][i]+h[i];
            interval[i].second=n;
            r+=interval[i].second-interval[i].first+1;
        }
        LL mid,tmp;
        pair<int,int>now;
        while(l<=r)
        {
            mid=l+r>>1;
            now=select(mid);
            if(check(now)) tmp=mid,r=mid-1;
            else l=mid+1;
        }
        now=select(tmp);
        l=now.first; r=now.second;
        for(int i=l;i<=r;++i) putchar(s[i]);
    }    
    
    int main()
    {
        freopen("string.in","r",stdin);
        freopen("string.out","w",stdout);
        scanf("%d",&m);
        scanf("%s",s+1);
        n=strlen(s+1);
        for(int i=1;i<=n;++i) a[i]=s[i]-'a'+1;
        presa();
        get_height();
        prehash();
        solve();
    }
  • 相关阅读:
    qt creator中输入中文中文变繁体
    Trie
    pycharm 专业版的 django功能
    fzu 1533
    django使用问题记录
    查看SQLServer最耗资源时间的SQL语句
    从mysql数据库删除重复记录只保留其中一条(保留id最小的一条)
    使用CSS3的appearance属性改变元素的外观
    mysql中将多行数据合并成一行数据
    MySQL字符串的拼接、截取、替换、查找位置
  • 原文地址:https://www.cnblogs.com/TheRoadToTheGold/p/8981700.html
Copyright © 2011-2022 走看看