有N(1<=N<=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的子串,它需要满足如下条件:1.长度至少为5个音符。 2.在乐曲中重复出现(就是出现过至少两次)。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值) 3.重复出现的同一主题不能有公共部分。
后缀数组,求最长不重叠重复子串~
#include<cstdio> #include<algorithm> using namespace std; const int maxn=1e6+14; int t1[maxn],t2[maxn],c[maxn]; int n,s[maxn],rk[maxn],sa[maxn],height[maxn]; void build_sa(int s[],int n,int m) { int i,j,p,*x=t1,*y=t2; //第一轮基数排序,如果s的最大值很大,可改为快速排序 for (i=0;i<m;i++) c[i]=0; for (i=0;i<n;i++) c[x[i]=s[i]]++; for (i=1;i<m;i++) c[i]+=c[i-1]; for (i=n-1;i>=0;i--) sa[--c[x[i]]]=i; for (j=1;j<=n;j<<=1) { p=0; //直接利用sa数组排序第二关键字 for (i=n-j;i<n;i++)y[p++]=i;//后面的j个数第二关键字为空的最小 for (i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j; //这样数组y保存的就是按照第二关键字排序的结果 //基数排序第一关键字 for (i=0;i<m;i++) c[i]=0; for (i=0;i<n;i++) c[x[y[i]]]++; for (i=1;i<m;i++) c[i]+=c[i-1]; for (i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i]; //根据sa和x数组计算新的x数组 swap(x,y); p=1;x[sa[0]]=0; for (i=1;i<n;i++) x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++; if (p>=n) break; m=p;//下次基数排序的最大值 } } void getHeight(int s[],int n) { int i,j,k=0; for (i=0;i<=n;i++) rk[sa[i]]=i; for (i=0;i<n;i++) { if (k) k--; j=sa[rk[i]-1]; while (s[i+k]==s[j+k]) k++; height[rk[i]]=k; } } bool check(int n,int k) { int Max=sa[1],Min=sa[1]; for (int i=2;i<=n;i++) { if (height[i]<k) Max=Min=sa[i]; else { if (sa[i]<Min) Min=sa[i]; if (sa[i]>Max) Max=sa[i]; if (Max-Min>k) return true; } } return false; } int main () { while (scanf ("%d",&n),n) { for (int i=0;i<n;i++) scanf ("%d",&s[i]); for (int i=n-1;i>0;i--) s[i]=s[i]-s[i-1]+90; n--; for (int i=0;i<n;i++) s[i]=s[i+1]; s[n]=0; build_sa (s,n+1,200); getHeight (s,n); int ans=-1,l=1,r=n; while (l<=r) { int mid=(l+r)/2; if (check(n,mid)) { ans=mid;l=mid+1; } else r=mid-1; } if (ans<4) printf ("0 "); else printf ("%d ",ans+1); } return 0; }