zoukankan      html  css  js  c++  java
  • KMP子串查找算法

    问题:如何在目标字符串S中,查找是否存在子串P?

    朴素解法:
    int sub_str_index(const char* s, const char* p)
    {
        int ret = -1;
        int sl = strlen(s);
        int pl = strlen(p);
        int len = sl - pl;
        
        for(int i=0; (ret<0)&&(i<=len); i++)
        {
            bool equal = true;
            
            for(int j=0; equal && (j<Pl); j++)
                equal = equal && (s[i + j] == p[j]);
        
            ret = (equal ? i : -1);
        }
        
        return ret;
    }
    朴素的解法是有问题的,
    假设目标字符串是a b c d e
    子串是          a b c z
    p字符串中前三个字符比对都成功了,但是到了第4个字符,比对失败了。这个时候如果以朴素的解法应该如何做呢?
    p字符串右移1个字符,继续比对。这样做虽然可以但是效率太低了,也没有意义,分析如下:
    因为pa != pb 且pb == sb;
    所以pa != sb,
    因此,子串p右移1位比较,没有意义

    部分匹配表是如何得到的?

     

     将中间的前缀、后缀、交集这几列去掉,得到的就是部分匹配表了

    怎么编程产生部分匹配表?

     部分匹配表的递推与实现

    朴素的解法是有问题的,假设目标字符串是a b c d e子串是          a b c zp字符串中前三个字符比对都成功了,但是到了第4个字符,比对失败了。这个时候如果以朴素的解法应该如何做呢?p字符串右移1个字符,继续比对。这样做虽然可以但是效率太低了,也没有意义,分析如下:因为pa != pb 且pb == sb;所以pa != sb,因此,子串p右移1位比较,没有意义

  • 相关阅读:
    Solr 删除数据的几种方式
    velocity 随笔
    LOG4J.PROPERTIES配置详解(转载)
    转 如何使用velocity模板引擎开发网站
    通过pinyin4j将汉字转换为全拼 和 拼音首字母
    去除数组中的重复数据
    java 转义字符
    多重背包(学习笔记)
    Team Queue
    [HAOI2008]糖果传递
  • 原文地址:https://www.cnblogs.com/-glb/p/13308643.html
Copyright © 2011-2022 走看看