zoukankan      html  css  js  c++  java
  • luogu P3809 【模板】后缀排序

    嘟嘟嘟


    今天学了一个后缀数组,还是挺好理解的。


    因为我不会基数排序,所以只会(O(n log ^ 2 n))的sort版。
    首先,后缀数组就是把该字符串的所有后缀按字典序排序得到的一个数组。注意这个排序只有字典序一个关键字,跟长度无关。
    比如ababa的后缀数组就是:5 3 1 4 2,对应的后缀为a, aba, ababa, ba, baba。


    怎么求呢?
    特别好理解。
    就像st表一样倍增的求。
    (s[i][k])表示以(i)为起点,长度为(2 ^ k)的子串(如果(i + 2 ^ k > n),则表示从(i)开始的后缀)。(rank_k[i])表示他是第几小的。
    那么如果要比较(s[i][k + 1])(s[j][k + 1]),只需比较(s[i][k], s[i + 2 ^ k][k])(s[j][k], s[j + 2 ^ k][k])的排名。换句话说,这一次的排序。就是以(rank[s[i][k]])为第一关键字,(rank[s[i + 2 ^ k][k]])为第二关键字进行排序。
    排完序后,再(O(n))扫一遍更新(rank)数组。
    分治每一层为(O(n log n)),一共(log n)层,所以总复杂度为(O(n log ^ 2 n))

    #include<cstdio>
    #include<iostream>
    #include<cmath>
    #include<algorithm>
    #include<cstring>
    #include<cstdlib>
    #include<cctype>
    #include<vector>
    #include<stack>
    #include<queue>
    using namespace std;
    #define enter puts("") 
    #define space putchar(' ')
    #define Mem(a, x) memset(a, x, sizeof(a))
    #define In inline
    typedef long long ll;
    typedef double db;
    const int INF = 0x3f3f3f3f;
    const db eps = 1e-8;
    const int maxn = 1e6 + 5;
    inline ll read()
    {
      ll ans = 0;
      char ch = getchar(), last = ' ';
      while(!isdigit(ch)) last = ch, ch = getchar();
      while(isdigit(ch)) ans = (ans << 1) + (ans << 3) + ch - '0', ch = getchar();
      if(last == '-') ans = -ans;
      return ans;
    }
    inline void write(ll x)
    {
      if(x < 0) x = -x, putchar('-');
      if(x >= 10) write(x / 10);
      putchar(x % 10 + '0');
    }
    
    int n, k;
    char s[maxn];
    int sa[maxn], rnk[maxn], tp[maxn];
    
    In bool cmp(int i, int j)
    {
      if(rnk[i] != rnk[j]) return rnk[i] < rnk[j];
      int x = i + k <= n ? rnk[i + k] : -1;
      int y = j + k <= n ? rnk[j + k] : -1;
      return x < y;
    }
    
    int main()
    {
      scanf("%s", s + 1);
      n = strlen(s + 1);
      for(int i = 1; i <= n; ++i) sa[i] = i, rnk[i] = s[i];
      //刚开始的rank可以直接用ASCII码
      for(k = 1; k <= n; k <<= 1)
        {
          sort(sa + 1, sa + n + 1, cmp);
          for(int i = 1; i <= n; ++i)
          	tp[sa[i]] = tp[sa[i - 1]] + (cmp(sa[i - 1], sa[i]) ? 1 : 0);
          for(int i = 1; i <= n; ++i) rnk[i] = tp[i];
        }
      for(int i = 1; i <= n; ++i) write(sa[i]), space; enter;
      return 0;
    }
    
  • 相关阅读:
    linux 用tcpdump查看80端口访问有哪些IP
    yum-内网yum源服务器配置(CentOS6.5)
    linux 修改用户密码的几种方法
    ansible hosts文件编写,简单使用测试(普通用户、sudo用户、root用户登录权限测试)
    ansible 安装
    ansible教程
    iowait过高处理
    重装系统win10教程(激活系统、office下载、分区)
    Spingboot项目的创建与启动(基于IDEA)
    反射
  • 原文地址:https://www.cnblogs.com/mrclr/p/10160012.html
Copyright © 2011-2022 走看看