zoukankan      html  css  js  c++  java
  • 后缀数组

    因为之前了解过一次后缀数组,所以这次看起来也不是特别吃力了

    主要就是利用倍增的思想,比如说,一个长度为8的字符串,我们先对长度为1的子串进行排名,然后利用这个信息,对长度为2的字符串进行排名,再排4、8……

    一个常见的应用是求height,定义height[i]为排名第i的后缀与排名第i-1的后缀的最长公共前缀,即排名相邻的两个后缀的最长公共前缀。

    我们设h[i]=height[rank[i]],不难发现h[i]>=h[i-1]-1,即height[rank[i]]>=height[rank[i-1]],那么,我们只要按照rank的顺序,利用之前的信息做一遍就行了。 

    #include<cstdio>
    #include<iostream>
    #define N 15010
    using namespace std;
    int n,m=26,s[N],sa[N],t1[N],t2[N],c[N];
    void DA(){
        //先按长度为1的子串基数排序 
        int *x=t1,*y=t2;
        for(int i=0;i<m;i++) c[i]=0;//枚举26个字母 
        for(int i=0;i<n;i++) c[x[i]=s[i]]++;//枚举字符串中的每个字符c[i]=j表示字符i出现了j次 
        for(int i=1;i<m;i++) c[i]+=c[i-1];//搞个前缀和?? 
        for(int i=n-1;~i;i--) {//相当于对单个字符排序,sa[i]=j表示排第i名的是原串第j个字符 
            sa[c[x[i]]-1]=i;
            c[x[i]]--;
        }
        for(int k=1,p=0;k<=n;k*=2,m=p,p=0){
            //排序第2位 
            for(int i=n-k;i<n;i++) y[p++]=i;//长度不足l的优先排序,因为基数排序是先按最后一个关键字入桶 
            for(int i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
            //排序第1位 
            for(int i=0;i<m;i++) c[i]=0;
            for(int i=0;i<n;i++) c[x[y[i]]]++;
            for(int i=1;i<m;i++) c[i]+=c[i-1];
            for(int i=n-1;~i;i--) sa[--c[x[y[i]]]]=y[i];
            //更新x数组 
            swap(x,y),p=1,x[sa[0]]=0;
            for(int i=1;i<n;i++)//有相同的x值也相同 
                if(y[sa[i-1]]==y[sa[i]]&&((y[sa[i-1]+k]==y[sa[i]+k]&&sa[i-1]+k<n&&sa[i]+k<n)||(sa[i-1]+k>=n&&sa[i]+k>=n))) x[sa[i]]=p-1;
                else x[sa[i]]=p++;//x[i]=j表示以第i个字符为开头的后缀排第j名 
            if(p>=n) break;//说明所有的排名都不相同 
        }
    }
    int rk[N],ht[N];
    void calheight()
    {
        for(int i=0;i<n;i++) rk[sa[i]]=i;//rk[i]=j表示以第i个字符为开头的后缀排第j名 
        for(int i=0,j,k=0;i<n;ht[rk[i++]]=k){//ht[i]排名第i的后缀与排名第i-1的后缀的最长公共前缀长度 
            if(!rk[i]) continue;
            j=sa[rk[i]-1],k=k?k-1:0;
            while(i+k<n&&j+k<n&&s[i+k]==s[j+k]) k++;
        }ht[0]=0;
    }
    int main(){
        freopen("Cola.txt","r",stdin);
        char ch[N];
        scanf("%d%s",&n,ch);
        for(int i=0;i<n;i++)
            s[i]=ch[i]-'a';
        DA();calheight();
        for(int i=0;i<n;i++)printf("%d ",sa[i]+1);printf("
    ");
        for(int i=0;i<n;i++)printf("%d ",ht[i]);
        return 0;
    }
  • 相关阅读:
    dlib库+vs2017详细配置流程
    【网易云课堂】【中科院团队】深度学习:算法到实战——神经网络基础
    【网易云课堂】【中科院团队】深度学习:算法到实战——绪论
    matlab 读取多行txt文本
    LeetCode 228. Summary Ranges【未加入列表】
    LeetCode 438. Find All Anagrams in a String
    c++冷知识
    python项目实战——西游记用字统计
    LeetCode 101. Symmetric Tree
    LeetCode 63. Unique Paths II
  • 原文地址:https://www.cnblogs.com/thmyl/p/8109223.html
Copyright © 2011-2022 走看看