zoukankan      html  css  js  c++  java
  • HDU 2846 (AC自动机+多文本匹配)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2846

    题目大意:有多个文本,多个模式串。问每个模式串中,有多少个文本?(匹配可重复)

    解题思路

    传统AC自动机是计算单个文本中,模式串出现次数。

    这里比较特殊,每个文本需要单独计算,而且每个匹配在每个文本中只能计数1次。

    比如add,d只能计数1次,而不是;两次。

    所以循环逐个对文本Find。每个Find里,进行Hash,保证每个匹配串只计数1次。

    由于匹配串可重复,在Insert之前,也需要离散化Hash一下,把重复的下标,指向最先插入的下标。

    另外,本题会卡掉不正确AC自动机模板( Find里要写成While(last!=root)而不是While(last->cnt)  )

    代码

    #pragma comment(linker, "/STACK:1024000000,1024000000")
    #include "cstdio"
    #include "cstring"
    #include "string"
    #include "iostream"
    #include "queue"
    #include "vector"
    #include "algorithm"
    #include "map"
    using namespace std;
    #define maxn 26
    int ans[100005],mt[100005];
    string P[10005];
    struct Trie
    {
        Trie *next[maxn],*fail;
        int cnt;
    }*root;
    Trie *newnode()
    {
        Trie *ret=new Trie;
        memset(ret->next,0,sizeof(ret->next));
        ret->fail=0;
        ret->cnt=0;
        return ret;
    }
    void init() {root=newnode();}
    void Insert(string str,int index)
    {
        Trie *pos=root;
        for(int i=0;i<str.size();i++)
        {
            int c=str[i]-'a';
            if(!pos->next[c]) pos->next[c]=newnode();
            pos=pos->next[c];
        }
        pos->cnt=index;
    }
    void getfail()
    {
        queue<Trie *> Q;
        for(int c=0;c<maxn;c++)
        {
            if(root->next[c])
            {
                root->next[c]->fail=root;
                Q.push(root->next[c]);
            }
            else root->next[c]=root;
        }
        while(!Q.empty())
        {
            Trie *x=Q.front();Q.pop();
            for(int c=0;c<maxn;c++)
            {
                if(x->next[c])
                {
                    x->next[c]->fail=x->fail->next[c];
                    Q.push(x->next[c]);
                }
                else x->next[c]=x->fail->next[c];
            }
        }
    }
    void Find(string str)
    {
        map<int,int> Hash;
        Trie *pos=root,*last;
        for(int i=0;i<str.size();i++)
        {
            int c=str[i]-'a';last;
            if(c<0||c>maxn) {pos=root;continue;}
            if(pos->next[c])
            {
                pos=pos->next[c];
                last=pos;
                while(last!=root)
                {
                    if(!Hash.count(last->cnt))
                    {
                        ans[last->cnt]++;
                        Hash[last->cnt]++;
                    }
                    last=last->fail;
                }
            }
        }
    }
    int main()
    {
        //freopen("in.txt","r",stdin);
        ios::sync_with_stdio(false);
        int n,m,s;
        string tmp;
        while(cin>>n)
        {
            map<string,int> ms;
            memset(ans,0,sizeof(ans));
            memset(mt,0,sizeof(mt));
            init();
            for(int i=1;i<=n;i++) cin>>P[i];
            cin>>s;
            for(int i=1;i<=s;i++)
            {
                cin>>tmp;
                if(!ms.count(tmp))
                {
                    Insert(tmp,i);
                    ms[tmp]=i;
                    mt[i]=i;
                }
                else mt[i]=ms[tmp];
            }
            getfail();
            for(int i=1;i<=n;i++) Find(P[i]);
            for(int i=1;i<=s;i++) cout<<ans[mt[i]]<<endl;
        }
    }

     

  • 相关阅读:
    Resource Path Location Type Target runtime Apache Tomcat v6.0 is not defined已解决
    项目跳转白名单防止其他系统随意跳转到本系统过滤器实现
    页面跳转的方式Redirect跳转机制:
    总结一下在ASP.NET中开发网站的一般步骤
    总结asp控件的重要属性
    页面跳转
    ASP.NET中的Image和ImageButton控件
    页面跳转的方式
    总结基本概念
    总结asp标准控件的重要属性
  • 原文地址:https://www.cnblogs.com/neopenx/p/4533276.html
Copyright © 2011-2022 走看看