zoukankan      html  css  js  c++  java
  • POJ 3415 Common Substrings (后缀数组,长度不小于k的公共子串的个数)

    Common Substrings
    Time Limit: 5000MS   Memory Limit: 65536K
    Total Submissions: 5495   Accepted: 1822

    Description

    A substring of a string T is defined as:

    T(ik)=TiTi+1...Ti+k-1, 1≤ii+k-1≤|T|.

    Given two strings AB and one integer K, we define S, a set of triples (ijk):

    S = {(ijk) | kKA(ik)=B(jk)}.

    You are to give the value of |S| for specific AB and K.

    Input

    The input file contains several blocks of data. For each block, the first line contains one integer K, followed by two lines containing strings A and B, respectively. The input file is ended by K=0.

    1 ≤ |A|, |B| ≤ 105
    1 ≤ K ≤ min{|A|, |B|}
    Characters of A and B are all Latin letters.

    Output

    For each case, output an integer |S|.

    Sample Input

    2
    aababaa
    abaabaa
    1
    xx
    xx
    0
    

    Sample Output

    22
    5



    先是把两个字符串连接起来,中间加一个没有出现过的字符。然后用后缀数组求得height数组。

    之后的过程麻烦,我是看别人代码看了好久才看懂的。

    大致意思是维护一个单调栈。

    每遇到一个B的后缀就统计与前面的A的后缀
     能产生多少个长度不小于k的公共子串。最A也一样做一边

    /*
     * POJ 3415 Common Substrings
     * 给定两个字符串A和B,求长度不小于k的公共子串的个数
     * 基本思路是计算A的所有后缀和B的所有后缀之间的最长公共前缀的长度,
     * 把最长公共前缀长度不小于k的部分全部加起来。
     * 先把两个字符串连起来,中间用一个没有用过的字符隔开。
     * 按height分组后,接下来便是快速的统计每组中后缀之间的最长公共前缀之和
     * 用一个单调的栈来维护,每遇到一个B的后缀就统计与前面的A的后缀
     * 能产生多少个长度不小于k的公共子串。最A也一样做一边
     */
    #include <iostream>
    #include <string.h>
    #include <stdio.h>
    #include <algorithm>
    using namespace std;
    const int MAXN=200010;
    
    int sa[MAXN];
    int t1[MAXN],t2[MAXN],c[MAXN];
    int rank[MAXN],height[MAXN];
    
    void build_sa(int s[],int n,int m)
    {
        int i,j,p,*x=t1,*y=t2;
        for(i=0;i<m;i++)c[i]=0;
        for(i=0;i<n;i++)c[x[i]=s[i]]++;
        for(i=1;i<m;i++)c[i]+=c[i-1];
        for(i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
        for(j=1;j<=n;j<<=1)
        {
            p=0;
            for(i=n-j;i<n;i++)y[p++]=i;
            for(i=0;i<n;i++)if(sa[i]>=j)y[p++]=sa[i]-j;
            for(i=0;i<m;i++)c[i]=0;
            for(i=0;i<n;i++)c[x[y[i]]]++;
            for(i=1;i<m;i++)c[i]+=c[i-1];
            for(i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];
            swap(x,y);
            p=1;x[sa[0]]=0;
            for(i=1;i<n;i++)
                x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
            if(p>=n)break;
            m=p;
        }
    }
    
    void getHeight(int s[],int n)
    {
        int i,j,k=0;
        for(i=0;i<=n;i++)rank[sa[i]]=i;
        for(i=0;i<n;i++)
        {
            if(k)k--;
            j=sa[rank[i]-1];
            while(s[i+k]==s[j+k])k++;
            height[rank[i]]=k;
        }
    }
    char str1[MAXN],str2[MAXN];
    int r[MAXN];
    int sta[MAXN],stb[MAXN];
    int main()
    {
        freopen("in.txt","r",stdin);
        freopen("out.txt","w",stdout);
        int k;
        int n;
        int len1,len2;
        while(scanf("%d",&k)==1 && k)
        {
            scanf("%s%s",&str1,&str2);
            len1=strlen(str1);
            len2=strlen(str2);
            n=len1+len2+1;
            for(int i=0;i<len1;i++)r[i]=str1[i];
            r[len1]=1;
            for(int i=0;i<len2;i++)r[i+len1+1]=str2[i];
            r[len1+len2+1]=0;
            build_sa(r,n+1,128);
            getHeight(r,n);
            long long ans=0;
            long long ss=0;
            int top=0;
            for(int i=2;i<=n;i++)
            {
                if(height[i]<k)
                {
                    ss=0;
                    top=0;
                    continue;
                }
                int cnt=0;
                if(sa[i-1]<len1)
                {
                    cnt++;
                    ss+=height[i]-k+1;
                }
                while(top>0 && height[i]<=sta[top-1])
                {
                    top--;
                    ss-=stb[top]*(sta[top]-height[i]);
                    cnt+=stb[top];
                }
                sta[top]=height[i];stb[top++]=cnt;
                if(sa[i]>len1)ans+=ss;
            }
            ss=0;top=0;
            for(int i=2;i<=n;i++)
            {
                if(height[i]<k)
                {
                    ss=0;
                    top=0;
                    continue;
                }
                int cnt=0;
                if(sa[i-1]>len1)
                {
                    cnt++;
                    ss+=height[i]-k+1;
                }
                while(top>0 && height[i]<=sta[top-1])
                {
                    top--;
                    ss-=stb[top]*(sta[top]-height[i]);
                    cnt+=stb[top];
                }
                sta[top]=height[i];stb[top++]=cnt;
                if(sa[i]<len1)ans+=ss;
            }
            printf("%I64d\n",ans);
        }
        return 0;
    }





    人一我百!人十我万!永不放弃~~~怀着自信的心,去追逐梦想
  • 相关阅读:
    redolog switch会发生完全检查点还是增量检查点?
    4G牌照发放生变 专家谏言电信联通如何选择
    [财富]iPhone如何征服日本?
    审计中移动现多处问题或致地方高层落马
    诺基亚CEO:Lumia不会像安卓推廉价版机型
    菜鸟学JDBC(二)
    简易网页采集器的实现
    手Q与微信:最终结局将会是手足相残!
    做网站Http状态码详解
    PHP $_SERVER['HTTP_REFERER'] 获取前一页面的 URL 地址
  • 原文地址:https://www.cnblogs.com/kuangbin/p/3042566.html
Copyright © 2011-2022 走看看