zoukankan      html  css  js  c++  java
  • BZOJ4502串——AC自动机(fail树)

    题目描述

    兔子们在玩字符串的游戏。首先,它们拿出了一个字符串集合S,然后它们定义一个字
    符串为“好”的,当且仅当它可以被分成非空的两段,其中每一段都是字符串集合S中某个字符串的前缀。
    比如对于字符串集合{"abc","bca"},字符串"abb","abab"是“好”的("abb"="ab"+"b",abab="ab"+"ab"),而字符串“bc”不是“好”的。
    兔子们想知道,一共有多少不同的“好”的字符串。

    输入

    第一行一个整数n,表示字符串集合中字符串的个数
    接下来每行一个字符串

    输出

    一个整数,表示有多少不同的“好”的字符串

    样例输入

    2
    ab
    ac

    样例输出

    9

    提示

    1<=n<=10000,每个字符串非空且长度不超过30,均为小写字母组成。

    因为trie树上每个点到根都是一个前缀,所以假设trie树上有cnt个点,最多就能有cnt^2个“好”字符串,但有些情况是重复的,比如:字符串集合里有aa和ab连个串,那么‘aa’+‘b'和‘a’+‘ab’在本质上是一个串。所以只要把重复的都去掉就是问题的答案了。如下图所示,

    绿串和短黑串与红串和长黑串就属于重复的答案,我们取红串和长黑串为记录的答案,就要把绿串的这种情况去掉。可以发现在AC自动机上,红串是绿串的后缀,蓝串是长黑串的后缀,所以对于每个红串与绿串,它们相差的部分(也就是蓝串)是几个串的后缀(就相当于有几个能和红串、绿串匹配的黑串),就要把答案相应的减去多少。在fail树上就转化成了以蓝串的末端点为根的子树中有多少个节点(不算本身,因为本身代表自己是自己的后缀,那么绿串前面的黑串就是空串)。所以对于AC自动机上每个fail指针不为根节点的节点(如果fail指针是根节点它就没有后缀),找它和它fail指针指向的串相差的部分所组成的串,用总答案减掉在fail树上子树大小就是最终结果。

    #include<cmath>
    #include<queue>
    #include<cstdio>
    #include<cstring>
    #include<iostream>
    #include<algorithm>
    using namespace std;
    int n;
    int cnt;
    int num;
    char s[40];
    long long ans;
    int f[300010];
    int fail[300010];
    int a[300010][26];
    long long sum[300010];
    void build(char *s)
    {
        int now=0;
        int len=strlen(s);
        for(int i=0;i<len;i++)
        {
            if(!a[now][s[i]-'a'])
            {
                a[now][s[i]-'a']=++cnt;
                f[cnt]=now;
            }
            now=a[now][s[i]-'a'];
        }
    }
    void getfail()
    {
        queue<int>q;
        for(int i=0;i<26;i++)
        {
            if(a[0][i])
            {
                fail[a[0][i]]=0;
                q.push(a[0][i]);
            }
        }
        while(!q.empty())
        {
            int now=q.front();
            q.pop();
            for(int i=0;i<26;i++)
            {
                if(a[now][i])
                {
                    fail[a[now][i]]=a[fail[now]][i];
                    q.push(a[now][i]);
                }
                else
                {
                    a[now][i]=a[fail[now]][i];
                }
            }
        }
        return ;
    }
    void solve()
    {
        for(int i=1;i<=cnt;i++)
        {
            for(int j=fail[i];j;j=fail[j])
            {
                sum[j]++;
            }
        }
        for(int i=1;i<=cnt;i++)
        {
            if(fail[i])
            {
                int j=i;
                int k=fail[i];
                while(k)
                {
                    j=f[j];
                    k=f[k];
                }
                ans-=sum[j];
            }
        }
    }
    int main()
    {
        scanf("%d",&n);
        for(int i=0;i<n;i++)
        {
            scanf("%s",s);
            build(s);
        }
        getfail();
        ans=1ll*cnt*cnt;
        solve();
        printf("%lld",ans);
        return 0;
    }
  • 相关阅读:
    Thrift安装编译指南
    Linux磁盘与文件系统管理
    你懂得C,所以C++也不在话下
    加速NFV(网络功能虚拟化)数据面:SR-IOV和DPDK[原文意译]
    十张图看懂SDN与NFV的区别与联系?
    Lambda表达式用法
    论文写作+gnuplot制图
    私钥、公钥、数字签名和数字证书
    synchronized和Lock的异同
    介绍HTTP协议的传输过程
  • 原文地址:https://www.cnblogs.com/Khada-Jhin/p/9169221.html
Copyright © 2011-2022 走看看