zoukankan      html  css  js  c++  java
  • HEOI 2012 旅行问题

    2746: [HEOI2012]旅行问题

    Time Limit: 30 Sec  Memory Limit: 256 MB
    Submit: 1009  Solved: 318
    [Submit][Status][Discuss]

    Description

    yz是Z国的领导人,他规定每个地区的名字只能为26个小写拉丁字母的一个。由于地 区数有可能超过26个,便产生了一个问题,如何辨别名字相同的地区?于是yz规定,一个 地区的描述必须包含它的所有上级,且上级按次序排列。于是,一个地区的描述是一个字符 串。比如说,一个地区的名字为c,它的上级为b,b的上级为a,a没有上级,那么这个地 区就描述为abc。显然,这个描述同时包含了c的上级b和b的上级a的描述,分别为ab和a。 值得注意的是,每个地区最多有一个上级,同一上级的地区之间名字不同,没有上级的 地区之间名字不同。现在,yz对外公布了n个地区的描述,这些描述中包含了Z国所有地区的描述,并让 你处理来访者的旅行问题。现有m对人访问这个国家,对于每对人,第一个人喜欢第i个描述中的第j个地区,设 这个地区描述为s1,第二个人喜欢第k个描述中的第l个地区,设这个地区描述为s2。他们为了统一行程,决定访问描述为s的地区(显然他们只关心地区的名字,并非是地区本身), 设s的长度为t,s需要满足以下条件: 
    1:t<=j, t<=l; 
    1:s[1..t] = s1[j-t+1 … j], s[1..t] = s2[l-t+1 … l];(即s为s1中1到k位 与s2中1到l位的公共后缀) 
    2:t最大化。 
    为了不使输出过大,你只需把这个字符串按照如下生成的26进制数转成10进制后mod 1000000007后输出: 
    a->0 
    b->1 



    z->25 
    比如地区cab被编码成2 *    26? + 0 * 26? + 1 * 26? = 1353。 

    Input

    第一行给定一个整数n 
    第2…n+1行:每i+1行给定一个字符串a[i],表示第i个描述。 
    接下来一行一个整数m 
    接下来m行:每行给定四个整数i,j,k,l,字母含义与题目描述一致。 

    Output


    共m行,每行一个整数,表示答案字符串的编码。 

    Sample Input

    2
    aabb babb
    2
    1 3 2 3
    1 4 2 4

    Sample Output

    1
    1
    【样例说明】
    询问1中的公共后缀有ab和b,但是没有ab这个地区,只有b地区,所以只能选择b这个 地区;
    询问2中的公共后缀有abb、bb和b,但是没有abb和bb这两个地区,只有b地区,所以 只能选择b这个地区。

    HINT

    【数据范围】


     设这个国家地区总数数为tot(注意:输入的字符串总长度可能超过tot!) 对于30%的数据,满足tot,m,n<=100; 

    对于50%的数据,满足tot,m,n<=1000; 

    对于80%的数据,满足tot,m,n<=100000; 

    对于100%的数据,满足tot,m,n<=1000000; 

    保证输入文件不超过20MB。 

    1、AC自动机构造fail树,抽离fail树构图(失配指针指向的点 向 当前点 连边)

    2、在fail树中找到 s1、s2 的结尾点,两点的lca就是答案

    正确性分析:

    fail指针定义:在其他串中找一个最长的  前缀等于这个串的后缀

    在fail树构出的图中,沿fail指针向上跳所经过的点,一定是当前串的最长后缀

    且越往上跳,后缀长度单调不上升

    题目要求:两个串的最长公共后缀,且这个后缀是某个串的前缀

    所以就是两个串的结尾点在fail树中的lca

    这题卡空间,卡空间

    数组范围抄的大佬的题解

    1、lca

    ① 抽离fail树构图求lca时,因为空间有限,所以不选树链剖分,用倍增法

    ② 因为点的父节点就是失配指针指向的点,所以可以在求fail指针时,同时算出deep,f[i][0] 

    ③ 节省一个dfs 时间,所以倍增求lca时,选用根据深度判断的方法,而不是dfs序

              节省链表重新构图空间、时间,所以不用树链剖分、dfs序倍增法

    2、锁定字符串末节点的位置

    ① 节省时间,不在AC自动机上匹配一遍,因为告诉了了第i个字符串的前j个,所以在insert字符串时,可以记录

    ② 节省空间,不用二维数组a[N][26]表示第i个字符串的第j个节点在AC自动机的什么位置

        因为是顺序插入,用一个st[i]数组,表示前i-1个字符串用了多少个节点,

        pos[i]数组,表示所有字符串的第i个字母在AC自动机的那个位置(第1个字符串的所有字母在最前面,然后是第2个字符串,第3、4……)

        这样第i个字符串的第j个字母在AC自动机中的位置就是 pos[st[i]+j]

        为什么要引入st数组?因为AC自动机相同前缀用同一个节点

    代码中倍增求lca时,循环到了20,

    我的理解:只需循环到log2(n)+1 ,因为倍增是2^i,i大了没用

    但是 引入 int p=log(n)/log(2)+1;  就错了

    (c++ 默认log函数以自然对数为底)

    call 大佬求解

    #include<cmath>
    #include<queue>
    #include<cstdio>
    #include<cstring>
    #include<algorithm>
    #define N 1000010
    #define mod 1000000007
     
    using namespace std;
     
     
    char s[N];
    int pos[N*8],st[N],cnt;  //
    int key[N];
    int n,m,iid,len,root,p;
    int tot=1,trie[N][26];
    int ancestor[N][22],deep[N];
     
    queue<int>q;
     
     
    struct TREE
    {
        void pre()
        {
            for(int i=1;i<=20;i++)
             for(int j=1;j<=tot;j++)
              ancestor[j][i]=ancestor[ancestor[j][i-1]][i-1];
        }
        int getlca(int u,int v)
        {
            if(deep[u]<deep[v]) swap(u,v);
            for(int i=0;i<=20;i++) 
             if((deep[u]-deep[v])&(1<<i)) u=ancestor[u][i];
            if(u==v) return u;
            for(int i=20;i>=0;i--)
             if(ancestor[u][i]!=ancestor[v][i]) 
             {
                u=ancestor[u][i];
                v=ancestor[v][i];
             }
            return ancestor[u][0];
        }
    };
     
    TREE tree;
     
    struct ACautomata
    {
        void insert(int k)
        {
            st[k]=cnt;
            len=strlen(s); root=1;
            for(int i=0;i<len;i++)
            {
                iid=s[i]-'a';
                if(!trie[root][iid]) 
                {
                    trie[root][iid]=++tot;
                    key[tot]=(1ll*key[root]*26+iid)%mod;
                }
                root=trie[root][iid];
                pos[++cnt]=root;
            }
        }
        void getfail()
        {
            for(int i=0;i<26;i++) trie[0][i]=1;
            q.push(1); 
            int now,j;
            while(!q.empty())
            {
                now=q.front();  q.pop();
                for(int i=0;i<26;i++)
                {
                    if(!trie[now][i]) 
                    {
                        trie[now][i]=trie[ancestor[now][0]][i];
                        continue;
                    }
                    q.push(trie[now][i]);
                    j=ancestor[now][0];
                    //while(!trie[j][i]) j=ancestor[j][0];
                    ancestor[trie[now][i]][0]=trie[j][i];
                    deep[trie[now][i]]=deep[trie[j][i]]+1;
                }
            }
        }
    };
     
    ACautomata AC;
     
    int main()
    {
        scanf("%d",&n);
    //  int p=log(n)/log(2)+1;
        for(int i=1;i<=n;i++)
        {
            scanf("%s",s);
            AC.insert(i);
        }
        AC.getfail();
        tree.pre();
        scanf("%d",&m);
        int i,j,k,l,r1,r2,lca;
        while(m--)
        {
            scanf("%d%d%d%d",&i,&j,&k,&l);
            lca=tree.getlca(pos[st[i]+j],pos[st[k]+l]);
            printf("%d
    ",key[lca]);
        }
    }
    
  • 相关阅读:
    微信推送给服务器的XML消息解析-springmvc 解析xml数据流
    request.getInputStream() 的两种解析方式
    微信的token验证
    springmvc 解析xml数据
    Spring 定时器 No qualifying bean of type [org.springframework.scheduling.TaskScheduler] is defined
    纯CSS实现图片
    Java线程池应用
    JavaScript 插件的书页翻转效果
    c语言中字符串函数的使用
    窗体显示类
  • 原文地址:https://www.cnblogs.com/TheRoadToTheGold/p/6980135.html
Copyright © 2011-2022 走看看