zoukankan      html  css  js  c++  java
  • [经典算法] 字符串搜索Boyer-Moore

    题目说明:

    今日的一些高阶程式语言对于字串的处理支援越来越强大(例如Java、C#、Perl等),不过字串搜寻本身仍是个值得探讨的课题,在这边以Boyer- Moore法来说明如何进行字串说明,这个方法快且原理简洁易懂。

    题目解析:

    串搜寻本身不难,使用暴力法也可以求解,但如何快速搜寻字串就不简单了,传统的字串搜寻是从关键字与字串的开头开始比对,例如 Knuth-Morris-Pratt 演算法 字串搜寻,这个方法也不错,不过要花时间在公式计算上;Boyer-Moore字串核对改由关键字的后面开始核对字串,并制作前进表,如果比对不符合则依前进表中的值前进至下一个核对处,假设是p好了,然后比对字串中p-n+1至p的值是否与关键字相同。

    如果关键字中有重复出现的字元,则前进值就会有两个以上的值,此时则取前进值较小的值,如此就不会跳过可能的位置,例如texture这个关键字,t的前 进值应该取后面的3而不是取前面的7。

    程序代码:

    #include<iostream>
    #include<string.h>
    
    using namespace std;
    
    int SkipTbl[256];
    
    void BuildSkipTable(char* input)
    {
        int length = strlen(input);
        for (int i=0; i < 256; ++i)
        {
            SkipTbl[i] = length;
        }
    
        for (int i=0; i < length - 1; ++i)
        {
            SkipTbl[input[i]] = length - i - 1;
        }
    }
    
    int Search(int pos, char* input, char* key)
    {
        int n = strlen(input);
        int m = strlen(key);
    
        while (pos < n)
        {
            if (memcmp(input+pos-m+1, key, m)==0)
            {
                return pos - m + 1;
            }
    
            pos += SkipTbl[input[pos]];
        }
    
        return -1;
    }
    
    int main()
    {
        char input[100] = {0};
        char key[10] = {0};
        cin.getline(input, 100);
        cin.getline(key, 10);
    
        int m = strlen(key);
        BuildSkipTable(key);
    
        int pos = Search(m-1, input, key);
        while (-1 != pos)
        {
            cout << "Search, index=" << pos <<endl;
            pos = Search(pos+m+1, input, key);
        }
    
        return 0;
    }
  • 相关阅读:
    Java第9次作业--接口及接口回调
    Java第8次作业--继承
    软件工程第三次作业——关于软件质量保障初探
    Java第7次作业--访问权限、对象使用
    Java第6次作业--static关键字、对象
    Java第5次作业--对象的创建与使用
    20194629 自动生成四则运算题第一版报告
    软件工程第一次作业
    今天开通博客啦!
    1170. Compare Strings by Frequency of the Smallest Character
  • 原文地址:https://www.cnblogs.com/Quincy/p/4718090.html
Copyright © 2011-2022 走看看