题目描述
近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。
某天,园长给动物们讲解KMP算法。
园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”
熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”
园长:“非常好!那你能举个例子吗?”
熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。
下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”
最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出对1,000,000,007取模的结果即可。
输入
第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。
输出
包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。
样例输入
3
aaaaa
ab
abcababc
样例输出
36 //(0+1)*(1+1)*(1+1)*(2+1)*(2+1)
1 //(0+1)*(0+1)
32
本题大意:求字符串的每一位截至的前缀和后缀的长度,这里要求前缀和后缀不能重叠,并按规则计算出num[]数组值。
sol:先求next数组,对于next[i],以i结尾的子串的前缀和后缀是可以重叠的,本题求的num数组,要求前缀和后缀不能重叠,怎样做到不重叠呢,也就是前缀长度只能<=总长度的一半。求出next数组后,我们发现如果next[i]和i之间连一条边,就构成了一棵树。所求的num[i]就是这条链上0到next[i]的所有点,看哪些值是<=i/2的。由于low_bound()函数是找一个有序序列中大于等于某值的位置的,于是我们用up_bound()来找严格大于的,找到那个位置后,位置号-1,就是num[i]的值了。如S="abaabaa",构造的fail树如下:
如i=6,next[6]=3,我们从[0,1,3,6]这条链中,找0到next[6]=3中其值<=6/2的,用up_bound()找到,[0,1,3,6]的第4个位置,是严格大于6/2的,num[6]为4-1=3,及前3个数[0,1,3]满足条件。
再如i=7,next[7]=4,0到7的这条链为[0,1,4,7],找到第3个位置的4,已严格大于7/2了,num[7]为3-1=2,及前两个[0,1]满足条件。
代码如下:
1 #include <bits/stdc++.h>
2 #include <cstring>
3 #include <algorithm>
4 #define N 1000010
5 using namespace std;
6 int fail[N] , num[N] , head[N] , to[N] , next[N] , cnt , sta[N] , top;
7 char str[N];
8 void add(int x , int y)
9 {
10 to[++cnt] = y , next[cnt] = head[x] , head[x] = cnt;
11 }
12 void dfs(int x)
13 {
14 int i;
15 sta[++top] = x; //将编号为x的号进栈
16 for(i = head[x] ; i ; i = next[i])
17 {
18
19 num[to[i]] = upper_bound(sta + 1 , sta + top + 1 , to[i] >> 1) - sta - 1 ;
20 //求出to[i]这个点,所在的栈中,有多少值是小于它的一半的。
21 //upper_bound是找第一个严格大于某个元素的位置,减去1后,也就是找有多少个数是小于等于某个元素的了
22 dfs(to[i]);
23 }
24 sta[top -- ] = x;
25 }
26 int main()
27 {
28 int T;
29 scanf("%d" , &T);
30 while(T -- )
31 {
32 int n , i = 0 , j = -1;
33 long long ans = 1;
34 memset(head , 0 , sizeof(head)) , cnt = 1;
35 scanf("%s" , str) , n = strlen(str);
36 fail[0] = -1;
37 while(i < n)
38 {
39 while(~j && str[j] != str[i]) j = fail[j];
40 fail[++i] = ++j;
41 }
42 // for (int i=1;i<=n;i++)
43 // cout<<i<<" "<<fail[i]<<endl;
44 for(i = 1 ; i <= n ; i ++ ) //连一条边从fail[i]到i
45 add(fail[i] , i);
46 dfs(0);//从0号点开始,将其入栈,这样每个num[i]的值于少为1
47 for(i = 1 ; i <= n ; i ++ )
48 ans = ans * num[i] % 1000000007;
49 printf("%lld
" , ans);
50 }
51 return 0;
52 }