Description
在美丽的玄武湖畔,鸡鸣寺边,鸡笼山前,有一块富饶而秀美的土地,人们唤作进香河。相传一日,一缕紫气从天而至,只一瞬间便消失在了进香河中。老人们说,这是玄武神灵将天书藏匿在此。
很多年后,人们终于在进香河地区发现了带有玄武密码的文字。更加神奇的是,这份带有玄武密码的文字,与玄武湖南岸台城的结构有微妙的关联。于是,漫长的破译工作开始了。
经过分析,我们可以用东南西北四个方向来描述台城城砖的摆放,不妨用一个长度为N的序列来描述,序列中的元素分别是‘E’,‘S’,‘W’,‘N’,代表了东南西北四向,我们称之为母串。而神秘的玄武密码是由四象的图案描述而成的M段文字。这里的四象,分别是东之青龙,西之白虎,南之朱雀,北之玄武,对东南西北四向相对应。
现在,考古工作者遇到了一个难题。对于每一段文字,其前缀在母串上的最大匹配长度是多少呢?
Input
第一行有两个整数,N和M,分别表示母串的长度和文字段的个数。
第二行是一个长度为N的字符串,所有字符都满足是E,S,W和N中的一个。
之后M行,每行有一个字符串,描述了一段带有玄武密码的文字。依然满足,所有字符都满足是E,S,W和N中的一个。
Output
输出有M行,对应M段文字。
每一行输出一个数,表示这一段文字的前缀与母串的最大匹配串长度。
Sample Input
7 3
SNNSSNS
NNSS
NNN
WSEE
Sample Output
4
2
0
HINT
对于100%的数据,N<=10^7,M<=10^5,每一段文字的长度<=100。
应上传者要求,此题不公开,如有异议,请提出.
Solution
自己想了一个做法,然后过是过了,就是跑的很慢,在BZOJ里面排到最后一页...
上网找了一下没人写的和我一样。
大概思路就是
把模式串全部插进去后AC自动机后,对每个节点都开个vector存有多少个模式串经过这里以及分别为多长的前缀,匹配的时候每次匹配完一个节点就直接把那个vector清空了就好,那这样每个节点就只会访问一次了,但是就是有点慢...
/**************************************************************
Problem: 4327
User: henryy
Language: C++
Result: Accepted
Time:7596 ms
Memory:175108 kb
****************************************************************/
#include <bits/stdc++.h>
using namespace std;
#define ll long long
#define inf 0x3f3f3f3f
#define N 100010
int fail[N*5], ch[N*5][5], last[N*5], tot;
int n, m;
char s1[(int)(1e7)+1];
vector<int>val[N*5][2];
int idx(char c) {
if(c == 'E') return 0;
if(c == 'S') return 1;
if(c == 'W') return 2;
if(c == 'N') return 3;
}
void insert(char *s, int id) {
int u = 0;
for(int i = 1; s[i]; ++i) {
int c = idx(s[i]);
if(!ch[u][c]) ch[u][c] = ++tot;
u = ch[u][c];
val[u][0].push_back(id);
val[u][1].push_back(i);
}
}
int q[N];
void get_fail() {
int l = 1, r = 1;
for(int i = 0; i < 4; ++i)
if(ch[0][i]) q[r++] = ch[0][i];
while(l != r) {
int u = q[l++];
if(l == 100000) l = 1;
for(int i = 0; i < 4; ++i) {
if(ch[u][i]) {
fail[ch[u][i]] = ch[fail[u]][i];
q[r++] = ch[u][i];
if(r == 100000) r = 1;
} else ch[u][i] = ch[fail[u]][i];
}
}
}
int ans[N];
void query(char *s) {
int u = 0;
for(int i = 1; s[i]; ++i) {
u = ch[u][idx(s[i])];
for(int j = u; j && val[j][0].size(); j = fail[j]) {
if(val[j][0].size()) {
for(int k = 0, len = val[j][0].size(); k < len; ++k) {
ans[val[j][0][k]] = max(ans[val[j][0][k]], val[j][1][k]);
}
val[j][0].clear();
val[j][1].clear();
}
}
}
}
char s[N];
int main() {
scanf("%d%d", &n, &m);
scanf("%s", s1 + 1);
for(int i = 1; i <= m; ++i) {
scanf("%s", s + 1);
insert(s, i);
}
get_fail();
query(s1);
for(int i = 1; i <= m; ++i) {
printf("%d
", ans[i]);
}
return 0;
}
并去学习了一下网上的做法:其实只要在AC自动机上面打标记就好了,然后最后遍历所有串去找最大的标记处(因为每次跑失配指针其实都是因为前缀能够匹配的上)
#include <bits/stdc++.h>
using namespace std;
#define ll long long
#define inf 0x3f3f3f3f
#define N 300010
int fail[N*5], ch[N*5][5], val[N*5], tot;
int n, m, v[N*5];
char s1[(int)(1e7)+1];
int idx(char c) {
if(c == 'E') return 0;
if(c == 'S') return 1;
if(c == 'W') return 2;
return 3;
}
void insert(char *s, int id) {
int u = 0;
for(int i = 1; s[i]; ++i) {
int c = idx(s[i]);
if(!ch[u][c]) ch[u][c] = ++tot;
u = ch[u][c];
}
val[id] = u;
}
int q[N];
void get_fail() {
int l = 1, r = 1;
for(int i = 0; i < 4; ++i)
if(ch[0][i]) q[r++] = ch[0][i];
while(l != r) {
int u = q[l++];
if(l == 100000) l = 1;
for(int i = 0; i < 4; ++i) {
if(ch[u][i]) {
fail[ch[u][i]] = ch[fail[u]][i];
q[r++] = ch[u][i];
if(r == 100000) r = 1;
} else ch[u][i] = ch[fail[u]][i];
}
}
}
void query(char *s) {
int u = 0;
for(int i = 1; s[i]; ++i) {
u = ch[u][idx(s[i])];
for(int j = u; j && !v[j]; j = fail[j]) {
v[j] = 1;
}
}
}
int ask(char *s) {
int ans = 0;
for(int u = 0, i = 1; s[i]; i++) {
u = ch[u][idx(s[i])];
if(v[u]) ans = max(ans, i);
}
return ans;
}
char s[N][120];
int main() {
scanf("%d%d", &n, &m);
scanf("%s", s1 + 1);
for(int i = 1; i <= m; ++i) {
scanf("%s", s[i] + 1);
insert(s[i], i);
}
get_fail();
query(s1);
for(int i = 1; i <= m; ++i) {
printf("%d
", ask(s[i]));
}
return 0;
}