病毒侵袭
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 23350 Accepted Submission(s): 5605
Problem Description
当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋——我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~
Input
第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。
每个病毒都有一个编号,依此为1—N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。
每个网站都有一个编号,依此为1—M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。
每个病毒都有一个编号,依此为1—N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。
每个网站都有一个编号,依此为1—M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。
Output
依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。
Sample Input
3
aaa
bbb
ccc
2
aaabbbccc
bbaacc
Sample Output
web 1: 1 2 3
total: 1
Source
Recommend
/* ┆ ┏┓ ┏┓ ┆ ┆┏┛┻━━━━━━┛┻┓ ┆ ┆┃ ┃ ┆ ┆┃ ━ ┃ ┆ ┆┃ ┳┛ ┗┳ ┃ ┆ ┆┃ ┃ ┆ ┆┃ ┻ ┃ ┆ ┆┗━┓ ┏━┛ ┆ ┆ ┃ ┃ ┆ ┆ ┃ ┗━━━┓ ┆ ┆ ┃ AC代马 ┣┓┆ ┆ ┃ ┏┛┆ ┆ ┗┓┓ ┏━┳┓ ┏┛ ┆ ┆ ┃┫┫ ┃┫┫ ┆ ┆ ┗┻┛ ┗┻┛ ┆ */ /* 用gets就超内存 */ #include<queue> #include<set> #include<cstdio> #include<algorithm> #include<cstring> #include<cmath> using namespace std; const int maxnode=100000+100; const int sigma_size=128; struct AC_Automata { int ch[maxnode][sigma_size]; int val[maxnode]; /// 每个字符串的结尾结点都有一个非0的val int f[maxnode]; /// fail函数 int last[maxnode]; /// last[i]=j表j节点表示的单词是i节点单词的后缀,且j节点是单词节点 int sz; ///初始化0号根节点的相关信息 inline void init() { sz=1; memset(ch[0],0,sizeof(ch[0])); val[0]=f[0]=last[0]=0; } ///Insert负责构造ch与val数组 ///插入字符串,v必须非0表示一个单词节点 inline void Insert(char *s,int v) { int n=strlen(s),u=0; for(int i=0; i<n; i++) { int id=s[i]; if(ch[u][id]==0) { ch[u][id]=sz; memset(ch[sz],0,sizeof(ch[sz])); val[sz++]=0; } u=ch[u][id]; } val[u]=v; } ///递归打印与结点i后缀相同的前缀节点编号 ///进入此函数前需保证val[i]>0 inline void print(int i,set<int>&st) { if(val[i]) { //printf("%d ",val[i]); if(st.find(i)==st.end())st.insert(val[i]); print(last[i],st); } } /// 在s中找出 出现了哪几个模板单词 inline void Find(char *s,set<int>&st) { int n=strlen(s),j=0; for(int i=0; i<n; i++) { int id=s[i]; while(j && ch[j][id]==0) j=f[j]; j=ch[j][id]; if(val[j]) print(j,st); else if(last[j]) print(last[j],st); } } ///getFail函数负责构造f和last数组 inline void getFail() { queue<int> q; last[0]=f[0]=0; for(int i=0; i<sigma_size; i++) { int u=ch[0][i]; if(u) { f[u]=last[u]=0; q.push(u); } } while(!q.empty())/// 按BFS顺序计算fail { int r=q.front(); q.pop(); for(int i=0; i<sigma_size; i++) { int u=ch[r][i]; if(u==0)continue; q.push(u); int v=f[r]; while(v && ch[v][i]==0) v=f[v]; f[u]= ch[v][i]; last[u] = val[f[u]]?f[u]:last[f[u]]; } } } }; AC_Automata ac; char word[200+10]; char text[10000+10]; set<int>::iterator it; int main() { //freopen("C:\Users\acer\Desktop\in.txt","r",stdin); int n,m; while(scanf("%d",&n)==1&&n) { ac.init(); getchar(); for(int i=1;i<=n;i++) { scanf("%s",word); //cout<<word[i]<<" "; ac.Insert(word,i); //cout<<word<<endl; } //cout<<endl; ac.getFail(); scanf("%d",&m); getchar(); int cur=0; for(int i=1;i<=m;i++) { scanf("%s",text); set<int>s; ac.Find(text,s); if(s.size()>0) { cur++; printf("web %d:",i); for(it=s.begin();it!=s.end();it++) printf(" %d",*it); printf(" "); } } printf("total: %d ",cur); } return 0; }