zoukankan      html  css  js  c++  java
  • Knuth-Morris-Pratt 算法

    KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为克努特——莫里斯——普拉特操作(简称KMP算法)。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。时间复杂度O(m+n)。

    个人心得:比较好理解,只要了解前缀和后缀就好了,就是代码实现得太巧妙太抽象,难以体会和想到,不得不佩服!

    KMP算法的关键在于next数组的创建和子字符串的匹配;

    next数组里面存放的是要查找的字符串前i个字符串的所有前缀、后缀相等的公共串中,最大的长度值。比如需要查找的一个子串ababcd,next[0]表示子串中前1个字符串即a的前缀和后缀中相等字符串的最大长度,因为a的前缀和后缀没有,故next[0] = 0;对于next[2],即先求出子串aba的前缀和后缀出来,前缀为a,ab,后缀有ba,a,相等的公共串为a,长度为1,因此next[2] = 1;依次可以求出。

     1 void getnext(int x[],int next[])
     2 {
     3     int i=0;
     4     int j=-1;
     5     next[i]=-1;
     6     while(i<m)
     7     {
     8         if(j==-1||x[i]==x[j])
     9         {
    10             i++;
    11             j++;
    12             next[i]=j;
    13         }
    14         else
    15             j=next[j];
    16     }
    17 }

    然后就是字符串的对比了,注意j=-1只会出现一次,以后就是每次的跳转了,根据对应的next实现代码优化

     1 int i=1,j=0;
     2           while(i<=n&&j<m)
     3           {
     4               if(j==-1||a[i]==b[j])
     5               {
     6                   i++;
     7                   j++;
     8               }
     9               else
    10                 j=next[j];
    11           }
    12 if(j==m)  flag=1;
    13 else flag=-1;
  • 相关阅读:
    WebStorm使用Vue
    hive的简单操作
    hbase的简单操作
    CentOS 7 配置hadoop(五) 配置sqoop(伪分布)
    CentOS7配置hadoop集群
    CentOS 7 配置hadoop(四) 配置hive(伪分布)
    CentOS 7 配置hadoop(三) 配置hbase(伪分布)
    五种变量创建的方法
    GO练习题
    第一次作业总结
  • 原文地址:https://www.cnblogs.com/blvt/p/7270536.html
Copyright © 2011-2022 走看看