zoukankan      html  css  js  c++  java
  • AC自动机

    unimportant博客背景:总结知识点的原因是,不看题解搞不出题了所以决定巩固基础图片来自

    预(xia)备(che)知识

    首先你要知道他不能帮你自动AC,还可能一直WA,AC自动机是在trie树上跑的KMP,所以预备知识就是KMP+trie树了,我觉得吧trie是载体,而KMP是思想,KMP和AC自动机的差别的话,前者是单模式串匹配,后者是多模式串匹配。举个栗子,给你一个短串和一个长串,让你查询短串是否在长串出现过,HASH,KMP随便选开心就好,但是如果让你模拟WPS中的查找操作呢?就是给你n个短串和一个较长的文本,查询每一个短串是否在文本中出现过以及出现次数,如果n很大的话KMP超时妥妥的,这时候AC自动机就出场了

    由于本人蒟蒻,指针还没学,就学的数组的,可能会比指针慢一点,Keywords Search那道题我用数组在我们的oj上跑了129ms还凑合吧

    既然AC自动机是在trie树上跑的KMP,那我们就需要先有trie树,这个就不过多赘述了,当然我在缘分的驱使下学了trie图,图和树的区别就在于图会把某一行没有的点指到它父节点的失败指针的跟他相同的儿子那里,注意是点而不是失败指针,而trie树则不管这些乱七八糟没有的点(这是我的大佬同学告诉我的,具体有关trie图的知识我觉得这篇博客还算详细,比较好懂)

    对于ash shex bcd sha四个模式串构建出来的trie如图

     

    trie树搞定之后就到了关键的fail指针的构建,这个和KMP的next数组有异曲同工之妙,所谓的fail指针就是找到失配位置可以匹配的另一个位置,比如在已经构建好的trie中,要找第二行的s的失败指针就指向第一行的s,失配指针存在的意义就是避免没有意义的不断回溯

    全部搞好之后就像这样

     

    那剩下要做的就是在搞好的trie图上跑KMP匹配了,假设给定文本串ashexbcdg问在该文本串中出现了几个模式串,ash一路匹配配到h发现是一个串的末尾,ans++,接下来h后面没有字母了,就找到h的失配,第二行的h一路匹配hex又一次++,发现x失配指向了根,就从根开始bcd匹配,ans++,d指向根,找不到可匹配的g,程序结束,输出ans==3

     1 #include<iostream>
     2 #include<string>
     3 #include<cstring>
     4 #include<cstdio>
     5 using namespace std;
     6 const int N=500005;
     7 int ans,tot,fail[N],trie[N][28],ed[N],que[N];
     8 char s[N<<1];
     9 void charu(char *s)
    10 {
    11     int u=1,len=strlen(s);
    12     for(int i=0;i<len;++i)
    13     {
    14         int c=s[i]-'a'+1;
    15         if(!trie[u][c])  {trie[u][c]=++tot;  memset(trie[tot],0,sizeof(trie[tot]));}
    16         u=trie[u][c];
    17     }
    18     ed[u]++;
    19 }
    20 void FAIL()
    21 {
    22     for(int i=1;i<=26;++i)  trie[0][i]=1;
    23     que[1]=1;  fail[1]=0;
    24     int le=1,ri=1;
    25     while(le<=ri)
    26     {
    27         int u=que[le];
    28         le++;
    29         for(int i=1;i<=26;++i)
    30         {
    31             if(!trie[u][i])  trie[u][i]=trie[fail[u]][i];
    32             else
    33             {
    34                 que[++ri]=trie[u][i];
    35                 int v=fail[u];
    36                 fail[trie[u][i]]=trie[v][i];
    37             }
    38         }
    39     }
    40 }
    41 void chaxun(char *s)
    42 {
    43     int u=1,len=strlen(s);
    44     for(int i=0;i<len;++i)
    45     {
    46         int c=s[i]-'a'+1;
    47         int k=trie[u][c];
    48         while(k>1)  {ans+=ed[k];  ed[k]=0;  k=fail[k];}
    49         u=trie[u][c];
    50     }
    51 }
    52 int main()
    53 {
    54     int t;  scanf("%d",&t);
    55     while(t--)
    56     {
    57         int n;  scanf("%d",&n);
    58         ans=0;  tot=1;
    59         memset(ed,0,sizeof(ed));
    60         for(int i=1;i<=26;i++)  {trie[0][i]=1;  trie[1][i]=0;}
    61         for(int i=1;i<=n;++i)  {scanf("%s",s);  charu(s);}
    62         FAIL();
    63         scanf("%s",s);  chaxun(s);
    64         printf("%d
    ",ans);
    65     }
    66     return 0;
    67 }
    View Code
  • 相关阅读:
    明明的随机数
    字符串大小写转换
    字符串合并处理
    【数据结构】c语言实现集合的交并差运算
    【数据结构】一元多项式
    【保存】
    {【保存】数据结构
    【java】关键字this怎么用?
    【数据结构】顺序表
    【JAVA】【作业向】第一题:本学期一班级有n名学生,m门课程。现要求对每门课程的成绩进行统计:平均成绩、最高成绩、最低成绩,并统计考试成绩的分布律。
  • 原文地址:https://www.cnblogs.com/hzjuruo/p/11295891.html
Copyright © 2011-2022 走看看