/* 罗穗骞大牛的算法,交叉信院的人当真是我们国家最顶尖的人才啊, 我辈只能膜拜,连羡慕嫉妒恨的情绪都没有,究其原因就是差距太大, 不过我辈亦有我辈的坚持,付出数十倍的时间却也能窥见天才所见的一斑, 这便足矣。 我零零碎碎的时间加起来也看了有一整天吧,终于全部弄透彻了,不过我还是没有信心能手写出来, 不过不要紧,慢慢练嘛。 */ /* 大致思路就是基数排序+倍增,以及根据Height的性质求Height数组 不过有几个小细节需要注意,就是一般在原串的下标n出放上0,然后n+1传到da函数, 然后这个sa[0]就是n了,也就是有用的从sa[1]开始,还有rank,height数组都要注意下。 sa[i]:排名第i后缀的是从原数组下标sa[i]开始的 rank[i]:从下标i开始的后缀在所有后缀中排名第几 height[i]:排名第i的后缀和排名第i-1的后缀的最长公共前缀的长度 H[i]:从下标i开始的后缀和排名为(rank[i]-1)的后缀的最长公共前缀的长度,H[i]=height[rank[i]] for(p=0,i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; 这两行代码的意思是利用前j>>1长度的子串(即第一关键字)的排序结果进行排序。实际上就是后面不足j>>1长度的补0, 所以肯定排在前面,然后i是sa[i]中的次序,所以先被扫到的肯定是排在前面的,所以减去j可以对应次序,所以y中存的是 第二关键字的次序,而不是综合第一关键字顺序的综合次序,综合次序之后会有对应操作 剩下的难点就是求height数组,总不能用n^2的复杂度来,所以就利用了height的性质,即H[i]>=H[i-1]-1 证明+脑补: 假如suffix(k+1)刚好排在suffix(i)的前一个,那么他们的最长公共前缀=1,此时h[i]=h[i-1]-1。 如果suffix(k+1)不排在suffix(i)的前一个,而是前几个,可知在suffix(k+1)和suffix(i)之间插进了一个suffix(l), 可想而知suffix(l)既要比suffix(k+1)大,又要比suffix(i)小, 不用考虑可知suffix(l)与suffix(i)的最长公共前缀>=suffix(k+1)与suffix(i)的最长公共前缀,既h[i]≥h[i-1]-1恒成立。 */ #include<cstdio> #include<cstring> using namespace std; typedef long long ll; const int inf = 0x3f3f3f3f; const int maxn = 100000+10; int wa[maxn],wb[maxn],wv[maxn],ws[maxn],sa[maxn],rank[maxn],height[maxn]; int cmp(int *r,int a,int b,int l){ return r[a]==r[b]&&r[a+l]==r[b+l]; } void da(int *r,int n,int m){ int i,j,p,*x=wa,*y=wb,*t; for(i=0;i<m;i++) ws[i]=0; for(i=0;i<n;i++) ws[x[i]=r[i]]++; for(i=1;i<m;i++) ws[i]+=ws[i-1]; for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i; for(j=1,p=1;p<n;j*=2,m=p){ for(p=0,i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; for(i=0;i<n;i++) wv[i]=x[y[i]]; for(i=0;i<m;i++) ws[i]=0; for(i=0;i<n;i++) ws[wv[i]]++; for(i=1;i<m;i++) ws[i]+=ws[i-1]; for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i]; for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } } void calHeight(int *r,int n){ int i,j,k=0; for(i=1;i<=n;i++) rank[sa[i]]=i; for(i=0;i<n;i++){ if(k) k-=1; j=sa[rank[i]-1]; while(r[i+k]==r[j+k]) k++; height[rank[i]]=k; } }