zoukankan      html  css  js  c++  java
  • BZOJ 1031 [JSOI2007]字符加密Cipher 后缀数组教程

    1031: [JSOI2007]字符加密Cipher

    Description

      喜欢钻研问题的JS同学,最近又迷上了对加密方法的思考。一天,他突然想出了一种他认为是终极的加密办法:把需要加密的信息排成一圈,显然,它们有很多种不同的读法。例如下图,可以读作:

     

    JSOI07 SOI07J OI07JS I07JSO 07JSOI 7JSOI0把它们按照字符串的大小排序:07JSOI 7JSOI0 I07JSO JSOI07 OI07JS SOI07J读出最后一列字符:I0O7SJ,就是加密后的字符串(其实这个加密手段实在很容易破解,鉴于这是突然想出来的,那就^^)。但是,如果想加密的字符串实在太长,你能写一个程序完成这个任务吗?

    Input

      输入文件包含一行,欲加密的字符串。注意字符串的内容不一定是字母、数字,也可以是符号等。

    Output

      输出一行,为加密后的字符串。

    Sample Input

    JSOI07

    Sample Output

    I0O7SJ

    HINT

    对于100%的数据字符串的长度不超过100000。


      感人啊。这是第一道后缀数组的题目。早在高一寒假期间,就有学长讲过后缀数组(但当时内心当然崩溃欲绝)。后来,在高一下期,我也曾致力学习后缀数组。当时是有成效的,至少当时理解了倍增法,会解height数组,还会解一些经典题目。但时过境迁,一切都不一样了。后来,在沈阳又有学长讲授,但是也没有太大的收获(准确的说,这位一本爷的后缀数组还没有我好)。

      然后,然后,我就忘了。

      看来事情就是这样了。如果不练习,那很快就会忘记。

      我们来普及一下吧。其实后缀数组,sa就是求排名第i的是谁,rank就是求i排名第几,很明显sa与rank互为反函数。也就是说,sa[rank[i]]=i,排名第rank[i](i的排名)的是i。rank[sa[i]]=i,sa[i](排名第i的是谁)排名第i。这是很有趣的。

      而sa其实对应了一种有趣的树:后缀树。什么是后缀树呢?其实就是把一个串S的所有后缀串都插入一个trie,这个trie很明显与该串所有子串插入后形成的trie等价(每一个子串都是一个后缀的前缀)。但是,这样的树有O(n^2)个节点,想要实际建出明显不可能。

      不能实际建出,于是有人就像要把这棵树压缩且不改变效果,于是有了O(n)的后缀自动机。当然,"实用"化后的后缀树也压缩过。但是,后缀树在OI中的应用并不广泛。

      但是,我们也可以观察,发现可以把后缀树的末梢对应后缀从左往右写出,形成了一个数组,学名suffix_array,简称sa。当然,完整的模拟还需要一个height数组,意为sa[i-1]与sa[i]的最长公共前缀(一个不等式就可解决:height[rank[i]]>=height[rank[i-1]]-1,画图易证)。

      如何求sa和rank呢?我们通常有2种方法,一种人称倍增O(nlog n),另一种人称DC3 O(n)。DC3常数大得起飞,通常人们都写倍增。

      倍增是什么?还是建议去看一看罗穗骞

      很有道理。1,2,4,8,16,32……最多log n次排序即可达到目标。但是一次排序怎么能是O(nlg n)的呢?于是通常会用基数排序,基数排序即是从优先级低的位到优先级高的位,对于每一位进行计数排序,中间保证是稳定的。这里排序的稳定性是指按优先级高的位排序过后,若优先级高的位相同则优先级低的位相对顺序不变。

      计数排序即是人们俗称的桶排序(但是《算导》上说这是两种算法……迷……),把值扔到桶中,统计前缀和,然后得出排名。

      假设给n个数基数排序,是BASE“进制”的,这些数值域为W,那么需要进行logBASEW次计数排序。总的时间复杂度为max(n,BASE)*logBASEW,而空间复杂度为max(n,BASE)。

      发一波代码吧:

      好的,我们已经会计数排序和基数排序了。我们发现,在每一次倍增时,第二关键字可以直接处理,而第一关键字需要在此之上进行一次计数排序。然后,把新的rank处理出来,因为对于每一次倍增,实时性的rank是排序所必须的value。

      此处有一个小优化,一旦出现了多于lens个排名,那么排序已经结束,就可以退出了。

      这是我此题的代码(也是后缀数组的模板这里小小提一下,注意一个地方的顺序,刘汝佳在此处是错的):

     1 /**************************************************************
     2     Problem: 1031
     3     User: Doggu
     4     Language: C++
     5     Result: Accepted
     6     Time:1032 ms
     7     Memory:4140 kb
     8 ****************************************************************/
     9  
    10 #include <cstdio>
    11 #include <cstring>
    12 #include <algorithm>
    13 const int S = 200010;
    14 int bucket[S], rank[S], half[S], sa[S];
    15 char ss[S];
    16 void counting_sort(int range,int lens) {//In suffix_array, rank is the value, half is the radix, counting_sort and count_sort are radix sort
    17     for( int i = 0; i < range; i++ ) bucket[i]=0;//clear
    18     for( int i = 0; i < lens; i++ ) bucket[rank[half[i]]]++;
    19     for( int i = 1; i < range; i++ ) bucket[i]+=bucket[i-1];
    20     for( int i =lens-1; i>=0; i-- ) sa[--bucket[rank[half[i]]]]=half[i];//half-->sa who to the what rank 
    21 }
    22 bool cmp(int i,int k,int lens) {return half[sa[i]]==half[sa[i-1]]&&(sa[i]+k<lens?half[sa[i]+k]:'')==(sa[i-1]+k<lens?half[sa[i-1]+k]:'');}
    23 void calculate(int range) {
    24     int lens = strlen(ss);
    25     for( int i = 0; i < lens; i++ ) rank[i]=ss[i], half[i]=i;
    26     counting_sort(range,lens); 
    27     for( int k = 1; k <= lens; k<<=1 ) {
    28         int p=0;for( int i = lens-1; i >= lens-k; i-- ) half[p++]=i;
    29         for( int i = 0; i < lens; i++ ) if(sa[i]>=k) half[p++]=sa[i]-k;
    30         counting_sort(range,lens);std::swap(rank,half);range=1;rank[sa[0]]=0;
    31         for( int i = 1; i < lens; i++ ) rank[sa[i]]=cmp(i,k,lens)?range-1:range++;
    32         if(range>=lens) break;
    33     }
    34 }
    35 int main() {
    36     scanf("%s",ss);
    37     int lens = strlen(ss);
    38     for( int i = lens; i < 2*lens; i++ ) ss[i]=ss[i-lens];ss[2*lens]='';
    39     calculate(128);
    40     for( int i = 0; i < 2*lens; i++ ) if(sa[i]<lens) printf("%c",ss[sa[i]+lens-1]);printf("
    ");
    41     return 0;
    42 }
  • 相关阅读:
    java-HTML&javaSkcript&CSS&jQuery&ajax
    HTML&javaSkcript&CSS&jQuery&ajax-XSS
    XSS-HTML&javaSkcript&CSS&jQuery&ajax-CSS
    XSS-HTML&javaSkcript&CSS&jQuery&ajax
    HTML&javaSkcript&CSS&jQuery&ajax-Css
    论坛IP地址追踪&路由器密码嗅探
    java ArrayList
    WireShark Flow capture analysis
    Software tips
    301. Remove Invalid Parentheses
  • 原文地址:https://www.cnblogs.com/Doggu/p/bzoj1031.html
Copyright © 2011-2022 走看看