zoukankan      html  css  js  c++  java
  • KMP板子+Trie板子

    KMP算法是一个字符串匹配算法,最直白的用法就是在一个长度为n的字符串T中查找另一个长度为m字符串P的匹配(总之就是用于文本中进行单个字符串的匹配)。

    对于这个问题,暴力算法是很好做的,直接对于T的每个位置判断一下当前位置作为P的结尾是否可以匹配成功,算法复杂度是O(nm)。

    KMP算法的主要思想是:假设现在正在用P的第j个字符和T的第i个字符进行匹配,如果成功就匹配下一个字符;如果失败的话就跳到 以j-1个字符为结尾的后缀的 最长相同前缀的结尾 后一个位置进行匹配。为此要把P做成一个状态机(也就是失配函数),在上面根据情况进行转移。

    复杂分析:每一次i增加的时候伴随着j的增加,i增加的时候为j提供了减少的空间,因此j最多会减少n次。加上预处理的时间,总时间复杂度O(n+m)。(这次一定要好好记住,之前看一次忘一次。。。)

    下面给出上面问题的代码(n<=1000000,m<=10000)。

     1 #include<iostream>
     2 #include<cstdio>
     3 #include<cstring>
     4 #include<cstdlib>
     5 #include<algorithm>
     6 #include<cmath>
     7 #include<queue>
     8 #include<set>
     9 #include<map>
    10 #include<vector>
    11 #include<cctype>
    12 using namespace std;
    13 const int maxn=1000005;
    14 const int maxm=10005;
    15 
    16 int N,f[maxn];
    17 char P[maxm],T[maxn];
    18 
    19 void getfail(char *p)
    20 {
    21     f[0]=f[1]=0;
    22     int m=strlen(p);
    23     for(int i=1;i<m;i++){
    24         int j=f[i];
    25         while(j&&p[i]!=p[j]) j=f[j];
    26         f[i+1]=p[i]==p[j]?j+1:0;
    27     }
    28 }
    29 int find(char *t,char *p)
    30 {
    31     getfail(p);
    32     int j=0,re=0,m=strlen(p),n=strlen(t);
    33     for(int i=0;i<n;i++){
    34         while(j&&t[i]!=p[j]) j=f[j];
    35         if(t[i]==p[j]) j++;
    36         if(j==m) re++,j=f[j];
    37     }
    38     return re;
    39 }
    40 int main()
    41 {
    42     scanf("%d
    ",&N);
    43     for(int i=1;i<=N;i++){
    44         gets(P);gets(T);
    45         printf("%d
    ",find(T,P));
    46     }
    47     return 0;
    48 }

    Trie是一种可以让你欢快的在字典中查找单词的数据结构,所以单次查询时间复杂度为什么是O(1)。。。。。。

    下面的代码是这样一个问题:给出一个长字符串和一些字典中的单词,问用这些单词拼接出长字符串的方案数mod20071027答案是多少,单词可以重复使用。倒着插入所有字典之后dp就可以了。

     1 #include<iostream>
     2 #include<cstdio>
     3 #include<cstring>
     4 #include<cstdlib>
     5 #include<algorithm>
     6 #include<cmath>
     7 #include<queue>
     8 #include<set>
     9 #include<map>
    10 #include<vector>
    11 #include<cctype>
    12 using namespace std;
    13 const int maxn=1000005;
    14 const int maxm=105;
    15 const int mo=20071027;
    16 
    17 int N,f[maxn];
    18 char T[maxn],S[maxm];
    19 struct Trie{
    20     static const int maxnd=4000005;
    21     static const int sigma_size=26;
    22     int np,ch[maxnd][sigma_size],val[maxnd];
    23     Trie(){ np=0,val[0]=0; memset(ch[0],0,sizeof(ch[0])); }
    24     void insert(char *s)
    25     {
    26         int now=0,i=strlen(s)-1;
    27         while(i>=0){
    28             if(!ch[now][s[i]-'a']){
    29                 ch[now][s[i]-'a']=++np;
    30                 memset(ch[np],0,sizeof(ch[np]));
    31                 val[np]=0;
    32             }
    33             now=ch[now][s[i--]-'a'];
    34         }
    35         val[now]++;
    36     }
    37     int find(int i)
    38     {
    39         int now=0,re=0;
    40         while(i>0){
    41             if(!ch[now][T[i]-'a']) break;
    42             now=ch[now][T[i--]-'a'];
    43             if(val[now]) re=(re+f[i])%mo;
    44         }
    45         if(!i&&val[ch[now][T[i]-'a']]) re=(re+1)%mo;
    46         return re;
    47     }
    48 }trie;
    49 
    50 void data_in()
    51 {
    52     gets(T); scanf("%d
    ",&N);
    53     for(int i=1;i<=N;i++){
    54         gets(S);
    55         trie.insert(S);
    56     }
    57 }
    58 void work()
    59 {
    60     int n=strlen(T);
    61     for(int i=0;i<n;i++) f[i]=trie.find(i);
    62     printf("%d
    ",f[n-1]);
    63 }
    64 int main()
    65 {
    66     data_in();
    67     work();
    68     return 0;
    69 }
  • 相关阅读:
    dracut-initqueue timeout
    Request.Url
    ipv4 ipv6数据库存储
    DataRow To DataTable
    AS ShortCut
    linq on 多链接条件
    SQL逻辑查询语句执行顺序
    ckeditor 使用几点
    SqlDataAdapter 更新插入 与 InsertBulkCopy
    HTTP协议改HTTPS
  • 原文地址:https://www.cnblogs.com/KKKorange/p/8503167.html
Copyright © 2011-2022 走看看