zoukankan      html  css  js  c++  java
  • 动物园

    题目描述

    近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。

    某天,园长给动物们讲解KMP算法。

    园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”

    熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”

    园长:“非常好!那你能举个例子吗?”

    熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”

    园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。

    下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”

    最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出1,000,000,007取模的结果即可。

    输入

    第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

    输出

    包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。

    样例输入

    3
    aaaaa
    ab
    abcababc

    样例输出

    36  //(0+1)*(1+1)*(1+1)*(2+1)*(2+1)
    1  //(0+1)*(0+1)
    32

     

    本题大意:求字符串的每一位截至的前缀和后缀的长度,这里要求前缀和后缀不能重叠,并按规则计算出num[]数组值。

    sol:先求next数组,对于next[i],以i结尾的子串的前缀和后缀是可以重叠的,本题求的num数组,要求前缀和后缀不能重叠,怎样做到不重叠呢,也就是前缀长度只能<=总长度的一半。求出next数组后,我们发现如果next[i]和i之间连一条边,就构成了一棵树。所求的num[i]就是这条链上0到next[i]的所有点,看哪些值是<=i/2的。由于low_bound()函数是找一个有序序列中大于等于某值的位置的,于是我们用up_bound()来找严格大于的,找到那个位置后,位置号-1,就是num[i]的值了。如S="abaabaa",构造的fail树如下:

      如i=6,next[6]=3,我们从[0,1,3,6]这条链中,找0到next[6]=3中其值<=6/2的,用up_bound()找到,[0,1,3,6]的第4个位置,是严格大于6/2的,num[6]为4-1=3,及前3个数[0,1,3]满足条件。

    再如i=7,next[7]=4,0到7的这条链为[0,1,4,7],找到第3个位置的4,已严格大于7/2了,num[7]为3-1=2,及前两个[0,1]满足条件。

    代码如下:

     1 #include <bits/stdc++.h>
     2 #include <cstring>
     3 #include <algorithm>
     4 #define N 1000010
     5 using namespace std;
     6 int fail[N] , num[N] , head[N] , to[N] , next[N] , cnt , sta[N] , top;
     7 char str[N];
     8 void add(int x , int y)
     9 {
    10     to[++cnt] = y , next[cnt] = head[x] , head[x] = cnt;
    11 }
    12 void dfs(int x)
    13 {
    14     int i;
    15     sta[++top] = x; //将编号为x的号进栈
    16     for(i = head[x] ; i ; i = next[i])
    17     {
    18      
    19      num[to[i]] = upper_bound(sta + 1 , sta + top + 1 , to[i] >> 1) - sta - 1 ;
    20      //求出to[i]这个点,所在的栈中,有多少值是小于它的一半的。
    21      //upper_bound是找第一个严格大于某个元素的位置,减去1后,也就是找有多少个数是小于等于某个元素的了
    22      dfs(to[i]);
    23     } 
    24     sta[top -- ] = x;
    25 }
    26 int main()
    27 {
    28     int T;
    29     scanf("%d" , &T);
    30     while(T -- )
    31     {
    32         int n , i = 0 , j = -1;
    33         long long ans = 1;
    34         memset(head , 0 , sizeof(head)) , cnt = 1;
    35         scanf("%s" , str) , n = strlen(str);
    36         fail[0] = -1;
    37         while(i < n)
    38         {
    39             while(~j && str[j] != str[i]) j = fail[j];
    40             fail[++i] = ++j;
    41         }
    42        // for (int i=1;i<=n;i++)
    43          //  cout<<i<<"    "<<fail[i]<<endl;
    44         for(i = 1 ; i <= n ; i ++ ) //连一条边从fail[i]到i
    45             add(fail[i] , i);
    46         dfs(0);//从0号点开始,将其入栈,这样每个num[i]的值于少为1
    47         for(i = 1 ; i <= n ; i ++ )
    48              ans = ans * num[i] % 1000000007;
    49         printf("%lld
    " , ans);
    50     }
    51     return 0;
    52 }
  • 相关阅读:
    Ubuntu 设置网卡固定IP
    gawk Notes(2)
    再读simpledb 之 存储的实现
    [zZ]HDFSRAID使用Erasure Code来实现HDFS的数据冗余
    初识gawk, gawk Notes(1)
    gawk notes(3)
    Shell Notes(2)
    凶残的突击面试
    Google 图片下载工具
    Shell Notes(3)
  • 原文地址:https://www.cnblogs.com/cutepota/p/12534533.html
Copyright © 2011-2022 走看看