P2292 [HNOI2004]L语言
题目链接:https://www.luogu.org/problemnew/show/P2292
题目描述
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。
一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。
例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。
给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。
输入输出格式
输入格式:
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。
其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。
输出格式:
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
输入输出样例
输出样例#1:
14 (整段文章’whatisyourname’都能被理解) 6 (前缀’whatis’能够被理解) 0 (没有任何前缀能够被理解)
题解:
由于题目要求的是连续的前缀都需要在字典中得到匹配,那么可以直接联想到Trie树可以为我们节约匹配的时间。
要求长度最大的话,直接dp转移即可,取最大值就行了。
代码如下:
#include <bits/stdc++.h> using namespace std; typedef long long ll; const int N = 1000005; int n,m; char s[N]; int dp[N]; struct Aho_Corasick{ int Size; int ch[N][30]; int val[N]; int fail[N]; void init(){ Size=-1; newnode(); } int newnode(){ memset(ch[++Size],0,sizeof(ch[0])); val[Size]=fail[Size]=0; return Size; } void insert(char *s){ int l=strlen(s); int u=0; for(int i=0;i<l;i++){ int idx=s[i]-'a'; if(!ch[u][idx]) ch[u][idx]=newnode(); u=ch[u][idx]; } val[u]++; } int query(char *s,int id){ int l=strlen(s+1); dp[0]=id; int ans=0,u=0; for(int i=0;i<=l;i++){ if(dp[i]!=id&&i) continue ; u=0; for(int j=i+1;j<=l;j++){ int idx=s[j]-'a'; if(ch[u][idx]==0) break ; u=ch[u][idx]; if(val[u]) ans=max(ans,j),dp[j]=id; } } return ans ; } }ac; int main(){ cin>>n>>m; ac.init(); for(int i=1;i<=n;i++){ scanf("%s",s); ac.insert(s); } for(int i=1;i<=m;i++){ scanf("%s",s+1); printf("%d ",ac.query(s,i)); } return 0; }