zoukankan      html  css  js  c++  java
  • zoj3228 Searching the String AC自动机查询目标串中模式串出现次数(分可覆盖,不可覆盖两种情况)

    /**
    题目:zoj3228 Searching the String
    链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=3441
    题意:给定一个长度为N(N <= 105)的目标串,然后再给定M(M <= 105)个长度不大于6的字符串,
    
    问这些字符串在目标串的出现次数(分可重叠和不可重叠两种)。
    
    题解:可以覆盖情况下,直接建立自动机求次数。注意可能出现类型相同以及字符串相同。所以用map标记;
    
    不可以覆盖情况下,直接建立自动机,查询的时候维护当前查到的字符串上一次找到的位置lastpos.
    
    如果lastpos+该子串长度<=pos那么可以ans++,以及更新lastpos=pos;
    
    find(),find2()两个函数分别处理可覆盖,不可覆盖情况。先统一处理可覆盖,然后清空自动机重新构建不可覆盖情况下的自动机。
    
    AC自动机好文章:http://www.cppblog.com/menjitianya/archive/2014/07/10/207604.html
    */
    
    
    //#include<bits/stdc++.h>
    #include<cstring>
    #include<cstdio>
    #include<iostream>
    #include<map>
    #include<algorithm>
    #include<queue>
    using namespace std;
    #define P pair<int,int>
    #define ms(x,y) memset(x,y,sizeof x)
    #define LL long long
    const int maxn = 1005;
    const int mod = 1e9+7;
    const int maxnode = 100000*6+10;
    const int sigma_size = 26;
    map<string,int> mp1, mp2;
    struct node
    {
        char s[7];
        int type;
        int len;
        int ans;
        int lastpos;
    }t[100005];
    struct AhoCorasickAutomata
    {
        int ch[maxnode][sigma_size];
        int val[maxnode];
        int sz;
        int f[maxnode];
        int last[maxnode];
        void clear(){sz = 1; memset(ch[0],0,sizeof ch[0]); }
        int idx(char c){return c-'a'; }
    
        void insert(char *s,int x)
        {
            int u = 0, n = strlen(s);
            for(int i = 0; i < n; i++){
                int c = idx(s[i]);
                if(!ch[u][c]){
                    memset(ch[sz], 0, sizeof ch[sz]);
                    val[sz] = 0;
                    ch[u][c] = sz++;
                }
                u = ch[u][c];
            }
            val[u] = x;
        }
    
        void find(char* T){
            int j = 0;
            for(int i = 0; T[i]!=''; i++){
                int c = idx(T[i]);
                j = ch[j][c];
                if(val[j]) print(j);
                else if(last[j]) print(last[j]);
            }
        }
    
        void print(int j)
        {
            if(j){
                //cnt[val[j]]++;
                t[val[j]].ans++;
                print(last[j]);
            }
        }
    
        void find2(char* T){///不可覆盖情况下;
            int j = 0;
            for(int i = 0; T[i]!=''; i++){
                int c = idx(T[i]);
                j = ch[j][c];
                if(val[j]) print2(j,i);
                else if(last[j]) print2(last[j],i);
            }
        }
    
        void print2(int j,int pos)
        {
            if(j){
                //cnt[val[j]]++;
                if(t[val[j]].lastpos+t[val[j]].len<=pos){
                    t[val[j]].ans++;
                    t[val[j]].lastpos = pos;
                }
                print2(last[j],pos);
            }
        }
    
        void getFail(){
            queue<int> q;
            f[0] = 0;
            for(int c = 0; c < sigma_size; c++){
                int u = ch[0][c];
                if(u){f[u] = 0; q.push(u); last[u] = 0;}
            }
    
            while(!q.empty()){
                int r = q.front(); q.pop();
                for(int c = 0; c < sigma_size; c++){
                    int u = ch[r][c];
                    if(!u){
                        ch[r][c] = ch[f[r]][c]; continue;
                    }//if(!u) continue;
                    q.push(u);
                    int v = f[r];
                    while(v&&!ch[v][c]) v = f[v];
                    f[u] = ch[v][c];
                    last[u] = val[f[u]] ? f[u] : last[f[u]];
                }
            }
        }
    
    } ac;
    char s[100005];
    int main()
    {
        int cas = 1;
        while(scanf("%s",s)==1)
        {
            int n;
            scanf("%d",&n);
            ac.clear();
            mp1.clear();
            mp2.clear();
            for(int i = 1; i <= n; i++){
                scanf("%d%s",&t[i].type,t[i].s);
                t[i].ans =0 ;
                if(t[i].type==0){
                    mp1[string(t[i].s)] = i;
                    ac.insert(t[i].s,i);
                }
            }
            ac.getFail();
            ac.find(s);
            ac.clear();
            mp2.clear();
            for(int i = 1; i <= n; i++){
                if(t[i].type){
                    t[i].len = strlen(t[i].s);
                    t[i].lastpos = -1;
                    mp2[string(t[i].s)] = i;
                    ac.insert(t[i].s,i);
                }
            }
            ac.getFail();
            ac.find2(s);
            printf("Case %d
    ",cas++);
            for(int i = 1; i <= n; i++){
                if(t[i].type){
                    printf("%d
    ",t[mp2[t[i].s]].ans);
                }else
                {
                    printf("%d
    ",t[mp1[t[i].s]].ans);
                }
            }
            printf("
    ");
        }
        return 0;
    }
    
    /*
    
    */
  • 相关阅读:
    xCode中怎样保存自己的代码块
    2015-03-13---抽象工厂(附代码),
    java nio 缓冲区(一)
    MFC获取各个窗体(体)之间的指针(对象)
    自己动手写神经网络,自己真的能够动手写神经网络嘛?
    Android招財进宝手势password的实现
    QQ三方登录
    UVA 10561
    Vagi单点登录1.0
    《反脆弱》:软件业现成的鲁棒性(Robust)换了个说法变成了作者的发明,按作者的理论推导出许多可笑愚蠢的原则来
  • 原文地址:https://www.cnblogs.com/xiaochaoqun/p/7510826.html
Copyright © 2011-2022 走看看