zoukankan      html  css  js  c++  java
  • 洛谷:P2292 [HNOI2004]L语言(DP+Trie树)

    P2292 [HNOI2004]L语言

    题目链接:https://www.luogu.org/problemnew/show/P2292

    题目描述

    标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。

    一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。

    例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的,因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解,而且是在字典D下能够被理解的最长的前缀。

    给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。并给出其在字典D下能够被理解的最长前缀的位置。

    输入输出格式

    输入格式:

    输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。之后的n行每行描述一个单词,再之后的m行每行描述一段文章。

    其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。

    输出格式:

    对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。

    输入输出样例

    输入样例#1:
    4 3 
    is
    name
    what
    your
    whatisyourname
    whatisyouname
    whaisyourname
    
    输出样例#1:
    14  (整段文章’whatisyourname’都能被理解)
    6  (前缀’whatis’能够被理解)
    0  (没有任何前缀能够被理解)

    题解:

    由于题目要求的是连续的前缀都需要在字典中得到匹配,那么可以直接联想到Trie树可以为我们节约匹配的时间。

    要求长度最大的话,直接dp转移即可,取最大值就行了。

    代码如下:

    #include <bits/stdc++.h>
    using namespace std;
    typedef long long ll;
    const int N = 1000005;
    int n,m;
    char s[N];
    int dp[N];
    struct Aho_Corasick{
        int Size;
        int ch[N][30];
        int val[N];
        int fail[N];
        void init(){
            Size=-1;
            newnode();
        }
        int newnode(){
            memset(ch[++Size],0,sizeof(ch[0]));
            val[Size]=fail[Size]=0;
            return Size;
        }
        void insert(char *s){
            int l=strlen(s);
            int u=0;
            for(int i=0;i<l;i++){
                int idx=s[i]-'a';
                if(!ch[u][idx]) ch[u][idx]=newnode();
                u=ch[u][idx];
            }
            val[u]++;
        }
        int query(char *s,int id){
            int l=strlen(s+1);
            dp[0]=id;
            int ans=0,u=0;
            for(int i=0;i<=l;i++){
                if(dp[i]!=id&&i) continue ;
                u=0;
                for(int j=i+1;j<=l;j++){
                    int idx=s[j]-'a';
                    if(ch[u][idx]==0) break ;
                    u=ch[u][idx];
                    if(val[u]) ans=max(ans,j),dp[j]=id;
                }
            }
            return ans ;
        }
    }ac;
    int main(){
        cin>>n>>m;
        ac.init();
        for(int i=1;i<=n;i++){
            scanf("%s",s);
            ac.insert(s);
        }
        for(int i=1;i<=m;i++){
            scanf("%s",s+1);
            printf("%d
    ",ac.query(s,i));
        }
    
        return 0;
    }
  • 相关阅读:
    STM32F746G-DISCO官方例程烧写
    zedboard学习第一篇
    itop4412开发板添加开机启动程序
    dsp6657的串口学习
    开源SLAM
    非线性滤波(信号处理)
    图形学领域的关键算法及源码链接
    基于倾斜影像的城市三维场景重建
    基于RFID恢复信号场
    对“自然语言处理”的理解
  • 原文地址:https://www.cnblogs.com/heyuhhh/p/10468731.html
Copyright © 2011-2022 走看看