zoukankan      html  css  js  c++  java
  • Knuth-Morris-Pratt Algorithm

      Today , 第一次学习KMP Algorithm,其中好多地方还是不能理解的透彻,本文将进一步对 KMP Algorithm 进行学习,搞清楚其中的思想……

      First , KMP Algorithm is best known for liner time for exact matching ,  (Runing time is O(Length(S)+Lendth(P)))  Because Preprocessing is O(P) , Matching is O(Length(S)) , 效率很 high , 成功的避免了Recomputing Matches ;

        若想 Avoid Recomputing Matches , 就需要 Preprocessing ,对于 Preprocessing ,就是找出字符串P中的 Repeat char can backtrack position by prefix-function;

    字符串P为:

    a b a b a c a

    字符串S为:

    b a c b a b a b a b a c a a b

      定义两个指针 i 和 j ,i  是指向 字符串 S 中的第 i 个数据元素 , j 是指向字符串 P 中的第 j 个数据元素 ,用指针 i 和  j 分别表示 S[ i - j + 1 , …… i ] 和 P[ 1 , …… j ] 中的数据元素完全相等, 随着 i 的值不断增加 , j 的值也在不断变化 ,通过对字符串 P 进行 Preprocessing 得到 fail数组 ,j 的值变化有两种可能:1、如果 P[ j + 1 ] 与 S[ i + 1]相等,j 应该加 1 ; 2 、如果 P[ j + 1 ] 与 S[ i + 1 ] 不相等 ,则 j 应该等于 fail数组中第 j 个数据元素的值 ;fail数组就是用来记录 当P[i + 1] 与 S[ j + 1 ] 不相等时 , j 的变化 ;

    下面介绍一下,Prefix - function ,即如何确定fail 数组 ;

    m ← Length[ P ] ;

    k = 0 ;

    fail[0] ← 0 ;

    for q ← 1 to m  do

      while k > 0 and p[k] ≠ p[q]  do

        k = next[k-1] ;

      end while 

      if(p[k] = p[q] )

        k ← k + 1 ;

      end if

      next[q] = k ;

    end for

    这样即可得到 fail数组 ;   

    得到 fail 数组之后,就可进行字符串P 与 字符串S 进行匹配了 ,具体匹配过程,下面给出相应的伪代码:

    n ← Length[ S ] 

    m ← Length[ P ]

    k = 0 ;

    for i ← 0 to n  do 

      while k > 0 and p[ k ] ≠  S[ i ]  do

        k = fail[ k -1] ;

      end while

      if p[k] = S[i]  then

        k ← k + 1

      end if

      if k == m then  

        return i - m + 1

      end if

    end for 

    return  -1 

     下面给出KMP算法的详细代码过程:

    #include<iostream>
    #include<string.h>
    using namespace std ;
    
    int fail[1000] ;
    
    void prefix( char *p )	{
    	int len = strlen(p) ;
    	int k = 0 ; 
    	fail[0] = 0 ;
    	for( int q = 1 ; q < len ; q++)	{
    		while( k > 0 && p[k] != p[q] )   // K > 0 的原因是为了让后面的 s[q] 先和 s[0] 比较保证找到后面的能够出现和第一个相等 ; 
    			k = fail[k-1] ;
    		if(p[k] == p[q])
    			k++ ;
    		fail[q] = k ;
    	}
    }
    
    int kmp( char *s , char *p )	{
    	int len1 = strlen(s) , len2 = strlen(p) ;
    	int k = 0 ;
    	for(int q = 0 ; q < len1 ; q++ )	{
    		while( k > 0 && s[q] != p[k] )  // K > 0 为了保证后面的和第一个比较出现相等的 ;
    			k = fail[k-1] ;
    		if(s[q] == p[k])
    			k++ ;
    		if(k == len2)
    			return q - len2 + 1 ;
    	}
    	return -1 ;
    }
    
    int main()	{
    	char s[1000] , p[1000] ;
    	cin >> s >> p ;
    	prefix(p) ;
    	if(kmp(s,p) != -1)
    		cout << kmp(s,p) << endl ;
    	else
    		cout << "NO" << endl ;
    	return 0 ;
    }
    

      

          

  • 相关阅读:
    魔镜完全是被王后问烦了才给她找点事做不再来烦它吧(豆瓣的经典评论)
    调色板QPalette类用法详解(附实例、源码)
    当程序调用dll时获取dll路径,DLL中获取自身的句柄
    把硬盘格式化成ext格式的cpu占用率就下来了
    Delphi XE6 如何设计并使用FireMonkeyStyle
    系统重构
    阅读Google的C++代码规范有感
    VS2010生成安装包制作步骤
    MVC视图中的@Html.xxx(...)
    高性能的JavaScript--加载和执行
  • 原文地址:https://www.cnblogs.com/NYNU-ACM/p/4237470.html
Copyright © 2011-2022 走看看