HEOI 2012 旅行问题

2746: [HEOI2012]旅行问题

Time Limit: 30 Sec Memory Limit: 256 MB
Submit: 1009 Solved: 318
[Submit][Status][Discuss]

Description

yz是Z国的领导人，他规定每个地区的名字只能为26个小写拉丁字母的一个。由于地区数有可能超过26个，便产生了一个问题，如何辨别名字相同的地区？于是yz规定，一个地区的描述必须包含它的所有上级，且上级按次序排列。于是，一个地区的描述是一个字符串。比如说，一个地区的名字为c，它的上级为b，b的上级为a，a没有上级，那么这个地区就描述为abc。显然，这个描述同时包含了c的上级b和b的上级a的描述，分别为ab和a。值得注意的是，每个地区最多有一个上级，同一上级的地区之间名字不同，没有上级的地区之间名字不同。现在，yz对外公布了n个地区的描述，这些描述中包含了Z国所有地区的描述，并让你处理来访者的旅行问题。现有m对人访问这个国家，对于每对人，第一个人喜欢第i个描述中的第j个地区，设这个地区描述为s1，第二个人喜欢第k个描述中的第l个地区，设这个地区描述为s2。他们为了统一行程，决定访问描述为s的地区（显然他们只关心地区的名字，并非是地区本身），设s的长度为t，s需要满足以下条件：
1：t<=j, t<=l;
1：s[1..t] = s1[j-t+1 … j], s[1..t] = s2[l-t+1 … l]；（即s为s1中1到k位与s2中1到l位的公共后缀）
2：t最大化。
为了不使输出过大，你只需把这个字符串按照如下生成的26进制数转成10进制后mod 1000000007后输出:
a->0
b->1
.
.
.
z->25
比如地区cab被编码成2 * 26? + 0 * 26? + 1 * 26? = 1353。

Input

第一行给定一个整数n
第2…n+1行:每i+1行给定一个字符串a[i],表示第i个描述。
接下来一行一个整数m
接下来m行:每行给定四个整数i,j,k,l，字母含义与题目描述一致。

Output

共m行，每行一个整数，表示答案字符串的编码。

Sample Input

2
aabb babb
2
1 3 2 3
1 4 2 4

Sample Output

1
1
【样例说明】
询问1中的公共后缀有ab和b，但是没有ab这个地区，只有b地区，所以只能选择b这个地区；
询问2中的公共后缀有abb、bb和b，但是没有abb和bb这两个地区，只有b地区，所以只能选择b这个地区。

HINT

【数据范围】

设这个国家地区总数数为tot（注意：输入的字符串总长度可能超过tot！）对于30%的数据，满足tot，m，n<=100；

对于50%的数据，满足tot，m，n<=1000；

对于80%的数据，满足tot，m，n<=100000；

对于100%的数据，满足tot，m，n<=1000000；

保证输入文件不超过20MB。

1、AC自动机构造fail树，抽离fail树构图（失配指针指向的点向当前点连边）

2、在fail树中找到 s1、s2 的结尾点，两点的lca就是答案

正确性分析：

fail指针定义：在其他串中找一个最长的前缀等于这个串的后缀

在fail树构出的图中，沿fail指针向上跳所经过的点，一定是当前串的最长后缀

且越往上跳，后缀长度单调不上升

题目要求：两个串的最长公共后缀，且这个后缀是某个串的前缀

所以就是两个串的结尾点在fail树中的lca

这题卡空间，卡空间

数组范围抄的大佬的题解

1、lca

① 抽离fail树构图求lca时，因为空间有限，所以不选树链剖分，用倍增法

② 因为点的父节点就是失配指针指向的点，所以可以在求fail指针时，同时算出deep，f[i][0]

③ 节省一个dfs 时间，所以倍增求lca时，选用根据深度判断的方法，而不是dfs序

节省链表重新构图空间、时间，所以不用树链剖分、dfs序倍增法

2、锁定字符串末节点的位置

① 节省时间，不在AC自动机上匹配一遍，因为告诉了了第i个字符串的前j个，所以在insert字符串时，可以记录

② 节省空间，不用二维数组a[N][26]表示第i个字符串的第j个节点在AC自动机的什么位置

因为是顺序插入，用一个st[i]数组，表示前i-1个字符串用了多少个节点，

pos[i]数组，表示所有字符串的第i个字母在AC自动机的那个位置（第1个字符串的所有字母在最前面，然后是第2个字符串，第3、4……）

这样第i个字符串的第j个字母在AC自动机中的位置就是 pos[st[i]+j]

为什么要引入st数组？因为AC自动机相同前缀用同一个节点

代码中倍增求lca时，循环到了20，

我的理解：只需循环到log2（n）+1 ，因为倍增是2^i，i大了没用

但是引入 int p=log(n)/log(2)+1; 就错了

（c++ 默认log函数以自然对数为底）

call 大佬求解

#include<cmath>
#include<queue>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define N 1000010
#define mod 1000000007
 
using namespace std;
 
 
char s[N];
int pos[N*8],st[N],cnt;  //
int key[N];
int n,m,iid,len,root,p;
int tot=1,trie[N][26];
int ancestor[N][22],deep[N];
 
queue<int>q;
 
 
struct TREE
{
    void pre()
    {
        for(int i=1;i<=20;i++)
         for(int j=1;j<=tot;j++)
          ancestor[j][i]=ancestor[ancestor[j][i-1]][i-1];
    }
    int getlca(int u,int v)
    {
        if(deep[u]<deep[v]) swap(u,v);
        for(int i=0;i<=20;i++) 
         if((deep[u]-deep[v])&(1<<i)) u=ancestor[u][i];
        if(u==v) return u;
        for(int i=20;i>=0;i--)
         if(ancestor[u][i]!=ancestor[v][i]) 
         {
            u=ancestor[u][i];
            v=ancestor[v][i];
         }
        return ancestor[u][0];
    }
};
 
TREE tree;
 
struct ACautomata
{
    void insert(int k)
    {
        st[k]=cnt;
        len=strlen(s); root=1;
        for(int i=0;i<len;i++)
        {
            iid=s[i]-'a';
            if(!trie[root][iid]) 
            {
                trie[root][iid]=++tot;
                key[tot]=(1ll*key[root]*26+iid)%mod;
            }
            root=trie[root][iid];
            pos[++cnt]=root;
        }
    }
    void getfail()
    {
        for(int i=0;i<26;i++) trie[0][i]=1;
        q.push(1); 
        int now,j;
        while(!q.empty())
        {
            now=q.front();  q.pop();
            for(int i=0;i<26;i++)
            {
                if(!trie[now][i]) 
                {
                    trie[now][i]=trie[ancestor[now][0]][i];
                    continue;
                }
                q.push(trie[now][i]);
                j=ancestor[now][0];
                //while(!trie[j][i]) j=ancestor[j][0];
                ancestor[trie[now][i]][0]=trie[j][i];
                deep[trie[now][i]]=deep[trie[j][i]]+1;
            }
        }
    }
};
 
ACautomata AC;
 
int main()
{
    scanf("%d",&n);
//  int p=log(n)/log(2)+1;
    for(int i=1;i<=n;i++)
    {
        scanf("%s",s);
        AC.insert(i);
    }
    AC.getfail();
    tree.pre();
    scanf("%d",&m);
    int i,j,k,l,r1,r2,lca;
    while(m--)
    {
        scanf("%d%d%d%d",&i,&j,&k,&l);
        lca=tree.getlca(pos[st[i]+j],pos[st[k]+l]);
        printf("%d
",key[lca]);
    }
}