zoukankan      html  css  js  c++  java
  • kmp&扩展kmp

    kmp:

    KMP的主要目的是求B是不是A的子串,以及若是,B在A中所有出现的位置

    写的很详细的大佬的博客:http://www.matrix67.com/blog/archives/115

     模板:

    /*
    pku3461(Oulipo), hdu1711(Number Sequence)
    这个模板 字符串是从0开始的
    Next数组是从1开始的
    
    
    */
    #include <iostream>
    #include <cstring>
    using namespace std;
    
    const int N = 1000002;
    int next[N];
    char S[N], T[N];
    int slen, tlen;
    
    void getNext()
    {
        int j, k;
        j = 0; k = -1; next[0] = -1;
        while(j < tlen)
            if(k == -1 || T[j] == T[k])
                next[++j] = ++k;
            else
                k = next[k];
    
    }
    /*
    返回模式串T在主串S中首次出现的位置
    返回的位置是从0开始的。
    */
    int KMP_Index()
    {
        int i = 0, j = 0;
        getNext();
    
        while(i < slen && j < tlen)
        {
            if(j == -1 || S[i] == T[j])
            {
                i++; j++;
            }
            else
                j = next[j];
        }
        if(j == tlen)
            return i - tlen;
        else
            return -1;
    }
    /*
    返回模式串在主串S中出现的次数
    */
    int KMP_Count()
    {
        int ans = 0;
        int i, j = 0;
    
        if(slen == 1 && tlen == 1)
        {
            if(S[0] == T[0])
                return 1;
            else
                return 0;
        }
        getNext();
        for(i = 0; i < slen; i++)
        {
            while(j > 0 && S[i] != T[j])
                j = next[j];
            if(S[i] == T[j])
                j++;
            if(j == tlen)
            {
                ans++;
                j = next[j];
            }
        }
        return ans;
    }
    int main()
    {
        
        int TT;
        int i, cc;
        cin>>TT;
        while(TT--)
        {
            cin>>S>>T;
            slen = strlen(S);
            tlen = strlen(T);
            cout<<"模式串T在主串S中首次出现的位置是: "<<KMP_Index()<<endl;
            cout<<"模式串T在主串S中出现的次数为: "<<KMP_Count()<<endl;
        }
        return 0;
    }
    /*
    test case
    aaaaaa a
    abcd d
    aabaa b
    */

    扩展kmp:

    给出模板串S和串T,长度分别为Slen和Tlen,要求在线性时间内,对于每个S[i](0<=i<Slen),求出S[i..Slen-1]与T的

    最长公共前缀长度,记为extend[i](或者说,extend[i]为满足S[i..i+z-1]==T[0..z-1]的最大的z值)。

    扩展KMP可以用来解决很多字符串问题,如求一个字符串的最长回文子串和最长重复子串。

    #include<iostream>
    #include<cstdio>
    #include<string>
    #include<cstring>
    #include<algorithm>
    using namespace std;
    typedef long long ll;
    int cnt[1000005];
    char t[1000005],p[1000005];
    int Next[1000005],ex[1000005];
    void pre(char p[])   // next[i]: 以第i位置开始的子串 与 T的公共前缀
    {
        int m=strlen(p);
        Next[0]=m;
        int j=0,k=1;
        while(j+1<m&&p[j]==p[j+1]) j++;
        Next[1]=j;
        for(int i=2; i<m; i++)
        {
            int P=Next[k]+k-1;
            int L=Next[i-k];
            if(i+L<P+1) Next[i]=L;
            else
            {
                j=max(0,P-i+1);
                while(i+j<m&&p[i+j]==p[j]) j++;// 枚举(p+1,length) 与(p-k+1,length) 区间比较
                Next[i]=j;
                k=i;
            }
        }
    }
    void exkmp(char p[],char t[])
    {
        int m=strlen(p),n=strlen(t);
        pre(p);  //next[]数组初始化
        int j=0,k=0;
        while(j<n&&j<m&&p[j]==t[j]) j++;
        ex[0]=j;
        for(int i=1;i<n;i++)
        {
            int P=ex[k]+k-1;
            int L=Next[i-k];
            if(i+L<P+1) ex[i]=L;
            else
            {
                j=max(0,P-i+1);
                while(i+j<n&&j<m&&t[i+j]==p[j]) j++;
                ex[i]=j;
                k=i;
            }
        }
    }
    int main()
    {
        int ss;
        scanf("%d",&ss);
        while(ss--)
        {
            scanf("%s %s",&t,&p);
            pre(p);  //处理next数组
            exkmp(p,t); //处理extand数组
           //接下来看自己要怎么处理
        }
        return 0;
    }
  • 相关阅读:
    in_array函数的第三个参数 strict
    主动创建缓存与被动创建缓存
    INSERT IGNORE 与INSERT INTO的区别
    说说php取余运算(%)的那点事
    继承中的类常量的使用
    Scribe 分布式日志收集系统
    PHP命令行模式基本介绍
    【C/C++】学生排队吃饭问题
    【C/C++】链表
    【C/C++】01背包问题/动态规划
  • 原文地址:https://www.cnblogs.com/stepping/p/7403101.html
Copyright © 2011-2022 走看看