zoukankan      html  css  js  c++  java
  • 【字符串】【扩展kmp算法总结~~】

    这两天呢,一直在被小伙伴们快ak的恐惧支配,G题杭电的数据很水,但是自己还是选择不水过,用扩展kmp去写,网上的资料很多,自己选了一个最简洁的模板,不用再写一个求next数组的函数,直接调用前特殊处理下exkmp函数就既可以求next数组,又可以求ex数组啦,hh谁说鱼与熊掌不可兼得,这不就是吗~但是呢,一开始一点也不好理解哎,自己选的模板,跪着也得理解完~~~(泪目~~

    ————言归正传,总结——————

    1.扩展kmp算法呢是对kmp算法的扩展,扩展kmp算法也有一个和kmp函数名字一样的next数组,还有一个ex数组。

    2.扩展kmp算法的可以用o(m+n)的复杂度求出字符串s1任意后缀和字符串s2的最长公共前缀。

    3:扩展kmp算法里ex数组:ex[i] == j表示s1以i为起始的后缀与s2的最长公共前缀。

    扩展kmp算法里next数组:next[i] == j表示s2以i为起始的后缀与s2的最长公共前缀

    两者作用都一样当然可以调用同一个函数咯~

       kmp算法里next数组:next[i] == j表示s2在0~i之前已匹配的前缀后缀长度为j+1(前提是next[0]初始化为-1,如果初始化为0,已匹配的长度就为j)

    ————加深理解,模拟算法实现过程————

    用样例s1=aaaabaa,s2=aaaaa直接进行模拟算法实现过程,前提是要结合模板

     

    第一步:由于exkmp函数的作用是在已知s2的next数组的情况下,求出字符串s1的任意后缀与字符串s2的最长公共前缀,存入ex,所以我们需要先调用函数求出next数组

    主函数里调用过程如下,预先初始化next[0]=0;

    void exkmp(char s1[],char s2[],int ex[],int next[])

     

    这样调用的原因参见总结3,生成next数组的过程相当于将s2与s2自身进行匹配,s2+1     == 形参s1

    s2        == 形参s2

     

    next+1 == 形参ex

     

    next     == 形参next.

    接收过程如下:

    void exkmp(char s1[],char s2[],int ex[],int next[]);

     

     

    a.在此函数中我们传递给形参s1的是s2+1,结合下图所示样例s1=aaaa,s2=aaaaa来看,即s1[0..] == (s2+1)[1..]

     

    b.传递给形参ex的是next+1,也就是next数组后移一位,即ex[i] == next[i+1](有点难懂,解释下,

    我们将形参s1和形参s2进行匹配时,实际就是实参数组s2[1...]的后缀与实参数组本身s2[0..]的前缀进行匹配,所以我们匹配出的最大公共长度min(next[j],p)赋值给形参数组ex[i]时,实际就是赋值给next[i+1],(这里不知道为什么取最小值不要紧,稍后进行解释),结合下图两张图片来看,明显e数组的值存入next数组的后一位。

     

     

    e[1]      = 3     e[2]      = 2   e[3]      = 1

     

     

    next[2] = 3     next[3] = 2   next[4] = 1

     

    第二步:在已知s2的next数组的情况下,再次调用函数,求出s1的任意后缀和s2的最长公共前缀,存入ex。
    在函数调用过程中,我们比较s1[i..]与s2的最长公共前缀部分时,只取较小的值,原因是,只有s2的自身前缀长度与p(s2和s1的公共前缀长度)都是公共长度的时候,这个值才能保证就是s1[i..]与s2的最长公共前缀部分。
    当它们相等时,无法直接比较判断出最长公共前缀部分,因为p之后也有可能有公共长度,所以我们只需要继续从p开始逐一比较。

    /*主函数里初始化和调用*/
    /*next[0] = 0;
    exkmp(s2+1,s2,next+1,next);
    exkmp(s1,s2,ex,next);*/
    
    void exkmp(char s1[],char s2[],int ex[],int next[])
    {
        int i,j,p;
        i = j = 0;
        p = -1;
        while(s1[i]!='')
        {
            if( p == -1)
            {
                j = 0;
                do
                    p++;
                while(s1[i+p] != ''&&s1[i+p] == s2[j+p]);
                ex[i] = p;
            }
            else if(next[j] < p)
                ex[i] = next[j];
            else if(next[j] > p)
                ex[i] = p;
            else
            {
                j = 0;
                while(s1[i+p] != ''&&s1[i+p] == s2[j+p])
                    p++;
                ex[i] = p;
            }    
            
            i++;
            j++;
            p--;
        }
        ex[i] = 0;
        return;
    }
  • 相关阅读:
    计算机中如何表示数字-01机器数与真值
    计算机中如何表示数字-06浮点数
    Java基础类型与其二进制表示
    char类型与Unicode的编码
    数组的详细总结
    Java中的instanceof关键字
    java 启动多线程
    elasticsearch7.2 集群搭建 插件安装 和kibana安装
    java读取 properties配置文件的两种方式
    查询mysql 库和表占的大小
  • 原文地址:https://www.cnblogs.com/hellocheng/p/7350058.html
Copyright © 2011-2022 走看看