zoukankan      html  css  js  c++  java
  • 扩展KMP模板

    扩展KMP指的是

    对于给出的串S和T,以O(n)的时间求出。

    对于所有0<=i<len(S),S(i,i+1,...,len(s)-1)与T的最长前缀长度。

    next[i]为满足B[i..i+z-1]==B[0..z-1]的最大的z值。

    以下是模板:

    #include <iostream>
    #include <string>
    #include <stdio.h>
    #include <string.h>
    using namespace std;
    
    const int MM=100005;
    int mynext[MM],extand[MM];
    char S[MM],T[MM];
    void Getmynext(const char *T){
        int len=strlen(T),a=0;
        mynext[0]=len;
        while(a<len-1 && T[a]==T[a+1]) a++;
        mynext[1]=a;
        a=1;
        for(int k=2;k<len;k++){
            int p=a+mynext[a]-1,L=mynext[k-a];
            if( (k-1)+L >= p){
                int j = (p-k+1)>0 ? (p-k+1) : 0;
                while(k+j<len && T[k+j]==T[j]) j++;
                mynext[k]=j;
                a=k;
            }
            else
                mynext[k]=L;
        }
    }
    void GetExtand(const char *S,const char *T){
        Getmynext(T);
        int slen=strlen(S),tlen=strlen(T),a=0;
        int MinLen = slen < tlen ? slen : tlen;
        while(a<MinLen && S[a]==T[a]) a++;
        extand[0]=a;
        a=0;
        for(int k=1;k<slen;k++){
            int p=a+extand[a]-1, L=mynext[k-a];
            if( (k-1)+L >= p){
                int j= (p-k+1) > 0 ? (p-k+1) : 0;
                while(k+j<slen && j<tlen && S[k+j]==T[j]) j++;
                extand[k]=j;
                a=k;
            }
            else
                extand[k]=L;
        }
    }
    int main(){
        int tt;
        cin>>tt;
        while(tt--)
        {
            scanf("%s%s",S,T);
            GetExtand(S,T);
            //接下来用mynext 和 extand 即可.
        }
        return 0;
    }

    下面举一个例子,S=”aaaabaa”,T=”aaaaa”,首先,计算extend[0]时,需要进行5次匹配,直到发生失配。

    从而得知extend[0]=4,下面计算extend[1],在计算extend[1]时,是否还需要像计算extend[0]时从头开始匹配呢?答案是否定的,因为通过计算extend[0]=4,从而可以得出S[0,3]=T[0,3],进一步可以得到 S[1,3]=T[1,3],计算extend[1]时,事实上是从S[1]开始匹配,设辅助数组next[i]表示T[i,m-1]和T的最长公共前缀长度。在这个例子中,next[1]=4,即T[0,3]=T[1,4],进一步得到T[1,3]=T[0,2],所以S[1,3]=T[0,2],所以在计算extend[1]时,通过extend[0]的计算,已经知道S[1,3]=T[0,2],所以前面3个字符已经不需要匹配,直接匹配S[4]和T[3]即可,这时一次就发生失配,所以extend[1]=3。

    另带一张自己理解的图:

  • 相关阅读:
    ERP类系统设计学习
    人工智能关键词
    系统性能
    连接不同服务器不同数据库
    socket一个例子
    SQLite
    asp.net 页面缓存、数据缓存
    原生js
    Android 网络调试 adb tcpip 开启方法
    C语言中string char int类型转换
  • 原文地址:https://www.cnblogs.com/chenhuan001/p/5240667.html
Copyright © 2011-2022 走看看