Given a string, we need to find the total number of its distinct substrings.
Input
T- number of test cases. T<=20;
Each test case consists of one string, whose length is <= 1000
Output
For each test case output one number saying the number of distinct substrings.
Example
Sample Input:
2
CCCCC
ABABA
Sample Output:
5
9
Explanation for the testcase with string ABABA:
len=1 : A,B
len=2 : AB,BA
len=3 : ABA,BAB
len=4 : ABAB,BABA
len=5 : ABABA
Thus, total number of distinct substrings is 9.
给定一个字符串,求不相同的子串的个数.
/*
后缀数组.
给定一个字符串,求不相同的子串的个数.
题解比较机智.
对于一个串,加入它会有n-sa[i]-1个字串产生(下标从0开始)
但是有些贡献是重复算了的.
也就是ht[i],
所以ans=∑n-sa[i]-ht[i]-1.
*/
#include<iostream>
#include<cstring>
#include<cstdio>
#define MAXN 1001
using namespace std;
int n,m=130,s[MAXN],sa[MAXN],rank1[MAXN],ht[MAXN],ans,c[MAXN],t1[MAXN],t2[MAXN];
char ch[MAXN];
bool cmp(int *y,int a,int b,int k)
{
int a1=y[a],b1=y[b];
int a2=a+k>=n?-1:y[a+k];
int b2=b+k>=n?-1:y[b+k];
return a1==b1&&a2==b2;
}
void slovesa()
{
int *x=t1,*y=t2;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[i]=s[i]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for(int k=1,p=0;k<=n;k<<=1,m=p,p=0)
{
for(int i=n-k;i<n;i++) y[p++]=i;
for(int i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
for(int i=0;i<m;i++) c[i]=0;
for(int i=0;i<n;i++) c[x[y[i]]]++;
for(int i=1;i<m;i++) c[i]+=c[i-1];
for(int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y),p=1,x[sa[0]]=0;
for(int i=1;i<n;i++)
{
if(cmp(y,sa[i-1],sa[i],k)) x[sa[i]]=p-1;
else x[sa[i]]=p++;
}
if(p>=n) break;
}
}
void Clear()
{
ans=0;m=130;//1 w.
memset(sa,0,sizeof sa);
}
void sloveheight()
{
int k=0;
for(int i=0;i<n;i++) rank1[sa[i]]=i;
for(int i=0;i<n;ht[rank1[i++]]=k)
{
int j=sa[rank1[i]-1];
if(k) k--;
while(j+k<n&&i+k<n&&s[i+k]==s[j+k])
k++;
}
ht[0]=0;
for(int i=0;i<n;i++)
ans+=n-sa[i]-ht[i]-1;
}
int main()
{
int t;
scanf("%d",&t);
while(t--)
{
scanf("%s",ch);n=strlen(ch);Clear();
for(int i=0;i<n;i++) s[i]=ch[i];
s[n++]=0;
slovesa(),sloveheight();
printf("%d
",ans);
}
return 0;
}