zoukankan      html  css  js  c++  java
  • P3809 【模板】后缀排序

    P3809 【模板】后缀排序

    题目背景

    这是一道模板题。

    题目描述

    读入一个长度为 nn 的由大小写英文字母或数字组成的字符串,请把这个字符串的所有非空后缀按字典序从小到大排序,然后按顺序输出后缀的第一个字符在原串中的位置。位置编号为 11 到 nn。

    输入输出格式

    输入格式:

    一行一个长度为 nn 的仅包含大小写英文字母或数字的字符串。

    输出格式:

    一行,共n个整数,表示答案。

    输入输出样例

    输入样例#1:
    ababa
    输出样例#1:
    5 3 1 4 2

    说明

    n <= 10^6n<=106​​

    code

    本题代码

     1 #include<cstdio>
     2 #include<algorithm>
     3 #include<cstring>
     4 
     5 using namespace std;
     6 
     7 const int N = 1000100;
     8 
     9 char s[N];
    10 int sa[N],t1[N],t2[N],c[N];
    11 int n,m = 130;
    12 
    13 void get_sa() {
    14     int *x = t1,*y = t2;
    15     for (int i=0; i<m; ++i) c[i] = 0;
    16     for (int i=0; i<n; ++i) c[x[i] = s[i]]++;
    17     for (int i=1; i<m; ++i) c[i] += c[i-1];
    18     for (int i=n-1; i>=0; --i) sa[--c[x[i]]] = i;
    19     for (int k=1; k<=n; k<<=1) {
    20         int p = 0;
    21         for (int i=n-k; i<n; ++i) y[p++] = i;
    22         for (int i=0; i<n; ++i) if (sa[i] >= k) y[p++] = sa[i] - k;
    23         for (int i=0; i<m; ++i) c[i] = 0;
    24         for (int i=0; i<n; ++i) c[x[y[i]]]++;
    25         for (int i=1; i<m; ++i) c[i] += c[i-1];
    26         for (int i=n-1; i>=0; --i) sa[--c[x[y[i]]]] = y[i];
    27         swap(x,y);
    28         p = 1;
    29         x[sa[0]] = 0;
    30         for (int i=1; i<n; ++i)
    31             x[sa[i]] = (y[sa[i-1]]==y[sa[i]] && sa[i-1]+k<n && sa[i]+k<n &&    
    32             y[sa[i-1]+k]==y[sa[i]+k]) ? p-1 : p++;       
    33         if (p >= n) break;
    34         m = p;
    35     }
    36 }
    37 int main() {
    38     scanf("%s",s);
    39     n = strlen(s);
    40     get_sa();
    41     for (int i=0; i<n; ++i) 
    42         printf("%d ",sa[i]+1);
    43     return 0;    
    44 }
    View Code

     后缀数组注释

     1 #include<cstdio>
     2 #include<algorithm>
     3 #include<cstring>
     4 
     5 using namespace std;
     6 
     7 const int N = 1000100;
     8 
     9 char s[N];
    10 int sa[N],t1[N],t2[N],c[N],rnk[N],height[N];
    11 //sa[i]  排名为i的是谁 -下标 
    12 //rnk[i] i的排名 -名次 
    13 //height[i]  排名为i的后缀与排名为i-1的后缀的最长公共前缀长度
    14 int n,m = 130;
    15 
    16 void get_sa() {
    17     int *x = t1,*y = t2;
    18     //基数排序 
    19     for (int i=0; i<m; ++i) c[i] = 0;
    20     for (int i=0; i<n; ++i) c[x[i] = s[i]]++;
    21     for (int i=1; i<m; ++i) c[i] += c[i-1];
    22     for (int i=n-1; i>=0; --i) sa[--c[x[i]]] = i;
    23     /*
    24     每次循环
    25     都将两个长度k子串合并为一个长度为2k的串
    26     其中前k个字符构成的子串的排名为第一关键字,后k个字符为第二关键字
    27     并求出合并后的字符串的排名 
    28     */
    29     //每次排名得到一共有多少个排名p,由p优化m的值。 
    30     for (int k=1; k<=n; k<<=1) {
    31         int p = 0;
    32         /*
    33         在上一轮中,第一关键字已经排好了, 此时只需要排第二关键字即可。 
    34         y数组是第二关键字排序的结果,存储的是2k长度的字符串的第一关键字的下标 
    35         n-k到n-1中所有的元素第二关键字为0 
    36         */
    37         for (int i=n-k; i<n; ++i) y[p++] = i;
    38         for (int i=0; i<n; ++i) if (sa[i] >= k) y[p++] = sa[i] - k;
    39         for (int i=0; i<m; ++i) c[i] = 0;
    40         for (int i=0; i<n; ++i) c[x[y[i]]]++;
    41         for (int i=1; i<m; ++i) c[i] += c[i-1];
    42         for (int i=n-1; i>=0; --i) sa[--c[x[y[i]]]] = y[i];
    43         swap(x,y);
    44         p = 1;
    45         x[sa[0]] = 0;
    46         for (int i=1; i<n; ++i)
    47             x[sa[i]] = (y[sa[i-1]]==y[sa[i]] && sa[i-1]+k<n && sa[i]+k<n &&    
    48             y[sa[i-1]+k]==y[sa[i]+k]) ? p-1 : p++;
    49         if (p >= n) break;
    50         m = p;
    51     }
    52 }
    53 void get_height() {
    54     for (int i=0; i<n; ++i) rnk[sa[i]] = i; // sa排名为i的下标,rnk[i]下标为i的后缀的名次。 
    55     int k = 0; 
    56     height[0] = 0;  
    57     /*
    58     性质:height[rnk[i]] >= height[rnk[i-1]]-1
    59     理解为起始下标为i的后缀和i-1的后缀除了开头第一个字符不同,其余的相同的
    60     即suffix[i,n]与suffix[i-1,n]只有第一个字符不同。 
    61     所以suffix[i-1,n]匹配上的子串,与suffix[i,n]匹配的子串,中k-1个是相等的。
    62     */ 
    63     for (int i=0; i<n; ++i) {
    64         if (!rnk[i]) continue; 
    65         if (k) k--;
    66         int j = sa[rnk[i]-1]; // 前一个排名的后缀的开始位置 
    67         while (i+k<n && j+k<n && s[i+k]==s[j+k]) k++;
    68         height[rnk[i]] = k;
    69     }
    70 }
    71 int main() {
    72     scanf("%s",s);
    73     n = strlen(s);
    74     get_sa();
    75     for (int i=0; i<n; ++i) 
    76         printf("%d ",sa[i]+1);
    77     return 0;    
    78 }
    View Code
     1 #include<cstdio>
     2 #include<algorithm>
     3 #include<cstring>
     4 #include<iostream>
     5 #include<cmath>
     6 #include<cctype>
     7 #include<set>
     8 #include<queue>
     9 #include<vector>
    10 #include<map>
    11 using namespace std;
    12 typedef long long LL;
    13 
    14 inline int read() {
    15     int x=0,f=1;char ch=getchar();for(;!isdigit(ch);ch=getchar())if(ch=='-')f=-1;
    16     for(;isdigit(ch);ch=getchar())x=x*10+ch-'0';return x*f;
    17 }
    18 
    19 const int N = 1000005;
    20 char s[N];
    21 int t1[N], t2[N], c[N], sa[N], rnk[N], height[N], n, m = 130;
    22 
    23 void getsa() {
    24     int *x = t1, *y = t2, i, p;
    25     for (i = 1; i <= m; ++i) c[i] = 0;
    26     for (i = 1; i <= n; ++i) x[i] = s[i], c[x[i]] ++;
    27     for (i = 1; i <= m; ++i) c[i] += c[i - 1];
    28     for (i = n; i >= 1; --i) sa[c[x[i]]--] = i;
    29     for (int k = 1; k <= n; k <<= 1) {
    30         p = 0;
    31         for (i = n - k + 1; i <= n; ++i) y[++p] = i;
    32         for (i = 1; i <= n; ++i) if (sa[i] > k) y[++p] = sa[i] - k;
    33         for (i = 1; i <= m; ++i) c[i] = 0;
    34         for (i = 1; i <= n; ++i) c[ x[y[i]] ] ++;
    35         for (i = 1; i <= m; ++i) c[i] += c[i - 1];
    36         for (i = n; i >= 1; --i) sa[c[x[y[i]]]--] = y[i];
    37         swap(x, y);
    38         x[sa[1]] = 1;
    39         p = 2;
    40         for (i = 2; i <= n; ++i) 
    41             x[sa[i]] = (y[sa[i]] == y[sa[i - 1]] && y[sa[i] + k] == y[sa[i - 1] + k]) ? p - 1 : p ++;
    42         if (p > n) break;
    43         m = p;
    44     }
    45 }
    46 void getheight() {
    47     for (int i = 1; i <= n; ++i) rnk[sa[i]] = i;
    48     int k = 0;
    49     height[1] = 0;
    50     for (int i = 1; i <= n; ++i) {
    51         if (rnk[i] == 1) continue;
    52         if (k) k --;
    53         int j = sa[rnk[i] - 1];
    54         while (i + k <= n && j + k <= n && s[i + k] == s[j + k]) k ++;
    55         height[rnk[i]] = k;
    56     }
    57 }
    58 int main() {
    59     scanf("%s",s + 1);
    60     n = strlen(s + 1);
    61     getsa();
    62     getheight();
    63     for (int i = 1; i <= n; ++i) printf("%d ",sa[i]);
    64     return 0;
    65 }
    View Code
  • 相关阅读:
    ios开发 MJExtension
    ios开发 time profile用法
    ios开发 UIApplication
    ios AFNetWorking
    ios开发 为什么NSString、NSArray、NSDIctionary用copy修饰
    ios动画
    ios开发GCD
    重要链接
    记录,员工关心的内容。
    怎样用 Wise Installation System 制作汉化补丁?(转)
  • 原文地址:https://www.cnblogs.com/mjtcn/p/7264287.html
Copyright © 2011-2022 走看看