持续划水中……
感觉BZOJ上AC人数多的基本都是一些模板题,也就是某些算法的裸题。这些题目mark一下到时候回来复习也是不错的选择。
Description
喜欢钻研问题的JS同学,最近又迷上了对加密方法的思考。一天,他突然想出了一种他认为是终极的加密办法:把需要加密的信息排成一圈,显然,它们有很多种不同的读法。例如下图,可以读作:
JSOI07 SOI07J OI07JS I07JSO 07JSOI 7JSOI0
把它们按照字符串的大小排序:07JSOI 7JSOI0 I07JSO JSOI07 OI07JS SOI07J
读出最后一列字符:I0O7SJ,就是加密后的字符串(其实这个加密手段实在很容易破解,鉴于这是突然想出来的,那就^^)。但是,如果想加密的字符串实在太长,你能写一个程序完成这个任务吗?
Input
输入文件包含一行,欲加密的字符串。注意字符串的内容不一定是字母、数字,也可以是符号等。
Output
输出一行,为加密后的字符串。
Sample Input
JSOI07
Sample Output
I0O7SJ
HINT
字符串的长度不超过100000。
Solution
后缀数组裸题嘛,小C觉得没什么可说的。
本质就是一个长度为2n字符串有n个长度为n的子串,将它们排序。
不过在这里小C要好好讲一讲自己对于后缀数组O(nlogn)算法的理解。
虽然一开始小C看这个算法时也是头皮发麻,但是仔细想想代码中的道理也是非常好理解的。
后缀数组核心代码只有9行,其中4行预处理,1行倍增,4行正式处理,而且预处理部分和正式处理部分本质是相同的。
具体参见小C代码后面的注释。
#include <cstdio> #include <algorithm> #include <cstring> #define MN 200005 #define MS 256 using namespace std; int mp[MN],rk[2][MN],sa[2][MN]; char c[MN]; int n,bn,K,g; inline int read() { int n=0,f=1; char c=getchar(); while (c<'0' || c>'9') {if(c=='-')f=-1; c=getchar();} while (c>='0' && c<='9') {n=n*10+c-'0'; c=getchar();} return n*f; } void work(int* SA,int* RK,int* sa,int *rk) { register int i; //正式处理部分:前3行以rk为第一关键字求出SA,后一行无脑求RK。(注意顺序) for (i=1;i<=n;++i) mp[rk[sa[i]]]=i; //不用前缀和,直接根据串x在sa中的排名得到mp[rk[x]]的前缀和。 for (i=n;i;--i) if (sa[i]>K) SA[mp[rk[sa[i]-K]]--]=sa[i]-K; //对于扩展后长度大于K的后缀x,利用后缀x+K在sa中的排名得到x在SA中的排名。 for (i=n-K+1;i<=n;++i) SA[mp[rk[i]]--]=i; //然后就只剩下扩展后长度小等于K的后缀x,排名一定比大于K的后缀小,所以后处理。 for (i=1;i<=n;++i) RK[SA[i]]=RK[SA[i-1]]+(rk[SA[i]]!=rk[SA[i-1]] || rk[SA[i]+K]!=rk[SA[i-1]+K]); //无脑求RK,注意用到sa。 //为了执行效率的提高,通常在对后缀排序时,如果发现某次扩展后,所有后缀的rk都不相同,即可停止倍增。 } void prework() { register int i; //预处理部分:前3行用基数排序求出sa[0],后1行无脑求rk[0]。 for (i=1;i<=n;++i) ++mp[c[i]]; for (i=1;i<MS;++i) mp[i]+=mp[i-1]; for (i=1;i<=n;++i) sa[0][mp[c[i]]--]=i; for (i=1;i<=n;++i) rk[0][sa[0][i]]=rk[0][sa[0][i-1]]+(c[sa[0][i]]!=c[sa[0][i-1]]); //注意求rk的时候要按照sa的顺序。 //倍增部分:g代表数组滚动,K是扩展前的大小,扩展一次后sa内的后缀长度变为K*2。 for (g=0,K=1;K<=bn;K<<=1,g^=1) work(sa[g^1],rk[g^1],sa[g],rk[g]); //至于求height数组的话,只要记住height[rk[i]]>=height[rk[i-1]]这个性质就行了。 } int main() { register int i; scanf("%s",c+1); n=strlen(c+1); for (i=1;i<=n;++i) c[n+i]=c[i]; bn=n; n<<=1; prework(); c[0]=c[n]; for (i=1;i<=n;++i) if (sa[g][i]<=bn) putchar(c[sa[g][i]-1]); }
Last Word
本来后缀数组是不亚于LCT困扰小C的存在,现在发现理解了就不需要那样死记硬背了。
最后吐槽一下BZOJ上各种病句连篇的题面,在Blog上贴这种东西尴尬癌都要犯了。