zoukankan      html  css  js  c++  java
  • AC自动机

     

    病毒侵袭持续中 

    Problem's Link:http://acm.hdu.edu.cn/showproblem.php?pid=3065


    Mean: 

    analyse:

     AC自动机的运用.

    这一题需要将模式串都存储下来,还有就是base的取值一定要弄清楚,由于这题的模式串都是大写字母所以我们可以通过剪枝来加速。

    Time complexity:o(n)+o(ml) 

    Source code:

    // Memory   Time
    // 1347K     0MS
    // by : Snarl_jsb
    // 2014-09-30-21.00
    #include<algorithm>
    #include<cstdio>
    #include<cstring>
    #include<cstdlib>
    #include<iostream>
    #include<vector>
    #include<queue>
    #include<stack>
    #include<map>
    #include<string>
    #include<climits>
    #include<cmath>
    #define LL long long
    using namespace std;

    char backup[1002][53];
    int res[1002];
    const int N = 1010;
    char str[2000010];
    struct node
    {
       node *next[26];     //  每个结点都对应26个字母的指针
       node *fail;     //      失配指针
       int count;      //
       int num;
       node()      //  构造函数初始化
       {
           for(int i = 0; i < 26; i++)
               next[i] = NULL;
           count = 0;
           num=0;
           fail = NULL;
       }
    }*q[50*N];
    node *root;
    int head, tail;

    void Insert(char *str,int num) //   插入单词.相当于构建一个Trie树
    {
       node *p = root;
       int i = 0, index;
       while(str[i])
       {
           index = str[i] - 'A'; //  转化为相对数字来存
           if(p->next[index] == NULL) // 该字母未插入过
               p->next[index] = new node();    //  为该字母申请一个结点
           p = p->next[index];     //   移至下一个
           i++;
       }
       p->count++;     //      记录该结点的单词总共插入的次数
       p->num=num;
    }
    void build_ac_automation(node *root)        //      bfs建立fail指针
    {
       root->fail = NULL;
       q[tail++] = root;
       while(head < tail) {
           node *temp = q[head++];
           node *p = NULL;
           for(int i = 0; i < 26; i++) {
               if(temp->next[i] != NULL) {
                   if(temp == root) temp->next[i]->fail = root;
                   else {
                       p = temp->fail;
                       while(p != NULL) {
                           if(p->next[i] != NULL) {
                               temp->next[i]->fail = p->next[i];
                               break;
                           }
                           p = p->fail;
                       }
                       if(p == NULL) temp->next[i]->fail = root;
                   }
                   q[tail++] = temp->next[i];
               }
           }
       }
    }

    int Query(node *root)       //  匹配 + 统计
    {
       int i = 0, cnt = 0, index;
       node *p = root;
       while(str[i])
       {
           index = str[i] - 'A';
           if(index<0||index>25)   ///这个地方要特别注意,由于病毒只包含大写字母,所以这儿需要剪枝,不剪枝的话其他地方加判断也可以过
           {
               p=root;
               i++;
               continue;
           }
           while(p->next[index] == NULL && p != root) //前缀是相同的,所以不管哪个指针走到了count不为0的结点上,那么该结点所代表的单词就匹配成功
               p = p->fail;//失配情况下,p指针指向p->fail.(相当于KMP的next数组)
           p = p->next[index];//由于现在所在的位置是父节点,所以需要向下移动一个位置
           if(p == NULL)
               p = root; //如果匹配失败,移动到root,重新开始匹配
           node *temp = p;//
           while(temp != root && temp->count>0)  //统计--如果匹配成功,那么count>1,表示该结点代表的单词数量;否则表示该结点没有单词
           {
    //            cnt += temp->count; //统计该单词出现的次数
               res[temp->num]++;   //每次回溯都会加1
    //            temp->count = -1;   //!!!!!!!!!!!!!!!!!(如果要重复统计,请讲这句去掉)!!!!!!!!标记为-1,表示该单词已经加入了cnt中
               temp = temp->fail;//判断整条链上的匹配情况
           }
           i++;
       }
       return cnt;
    }

    int main()
    {
       int n,m;
       while(cin>>n)
       {
           head = tail = 0;    //  清零
           root = new node();      //  申请新的root结点
           memset(backup,0,sizeof(backup));
           memset(res,0,sizeof(res));
           for(int i=1;i<=n;++i)
           {
               scanf("%s",str);
               strcpy(backup[i],str);
               Insert(str,i);
           }
           build_ac_automation(root);
           scanf("%s",str);
           Query(root);
           for(int i=1;i<=n;++i)
           {
               if(res[i])
               {
                   printf("%s: %d ",backup[i],res[i]);
               }
           }
       }
       return 0;
    }
  • 相关阅读:
    博客新域名www.tecchen.tech
    [转载]Redis 持久化之RDB和AOF
    基于zookeeper集群的云平台-配置中心的功能设计
    22部漫威电影大合集和观影顺序
    类的嵌套定义、使用以及用头文件实现多个文件编程(匠心之作C++ p105 22 )
    Python的print格式
    Tensorflow2.0+Anaconda + Windows10+cuda10.0+python(转自豌豆代理)
    C语言中用scanf连续输入两个字符类型的问题(转)
    算法和流程图(及N-S流程图)
    git的安装及针对码云的操作(二)
  • 原文地址:https://www.cnblogs.com/crazyacking/p/4002724.html
Copyright © 2011-2022 走看看