zoukankan      html  css  js  c++  java
  • 【poj3415】 Common Substrings

    http://poj.org/problem?id=3415 (题目链接)

    题意

      给定两个字符串 A 和 B,求长度不小于 k 的公共子串的个数(可以相同)。

    Solution

      后缀数组论文题。。。

      基本思路是计算 A 的所有后缀和 B 的所有后缀之间的最长公共前缀的长度,把最长公共前缀长度不小于 k 的部分全部加起来。先将两个字符串连起来,中间用一个没有出现过的字符隔开。按 height 值分组后,接下来的工作便是快速的统计每组中后缀之间的最长公共前缀之和。扫描一遍,每遇到一个 B 的后缀就统计与前面的 A 的后缀能产生多少个长度不小于 k 的公共子串,这里 A 的后缀需要用一个单调的栈来高效的维护。然后对 A 也这样做一次。

      如何用单调栈来维护呢?这真的是一个问题。这里我运用的单调栈与一般的单调栈不一样。单调栈里面记录一个结构体,结构体记录每个串对答案的贡献w以及这种串的个数c,自栈底向栈顶w递增。每次扫描到一个height[i]当它小于栈顶时,将栈顶的元素与栈顶第二个元素合并,并且更新栈中元素的总贡献。

    细节

      数组开两倍。

    代码

    // poj3693
    #include<algorithm>
    #include<iostream>
    #include<cstdlib>
    #include<cstring>
    #include<cstdio>
    #include<cmath>
    #include<queue>
    #define LL long long
    #define inf 1<<30
    #define Pi acos(-1.0)
    #define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout);
    using namespace std;
    
    const int maxn=500010;
    int sa[maxn],rank[maxn],height[maxn];
    int n,K;
    char s[maxn];
    
    struct data {int w,c;}st[maxn];
    namespace Suffix {
    	int wa[maxn],wb[maxn],ww[maxn];
    	bool cmp(int *r,int a,int b,int l) {
    		return r[a]==r[b] && r[a+l]==r[b+l];
    	}
    	void da(char *r,int *sa,int n,int m) {
    		int i,j,p,*x=wa,*y=wb;
    		for (i=0;i<=m;i++) ww[i]=0;
    		for (i=1;i<=n;i++) ww[x[i]=r[i]]++;
    		for (i=1;i<=m;i++) ww[i]+=ww[i-1];
    		for (i=n;i>=1;i--) sa[ww[x[i]]--]=i;
    		for (p=0,j=1;p<n;j*=2,m=p) {
    			for (p=0,i=n-j+1;i<=n;i++) y[++p]=i;
    			for (i=1;i<=n;i++) if (sa[i]>j) y[++p]=sa[i]-j;
    			for (i=0;i<=m;i++) ww[i]=0;
    			for (i=1;i<=n;i++) ww[x[y[i]]]++;
    			for (i=1;i<=m;i++) ww[i]+=ww[i-1];
    			for (i=n;i>=1;i--) sa[ww[x[y[i]]]--]=y[i];
    			for (swap(x,y),p=x[sa[1]]=1,i=2;i<=n;i++)
    				x[sa[i]]=cmp(y,sa[i-1],sa[i],j) ? p : ++p;
    		}
    	}
    	void calheight(char *r,int *sa,int n) {
    		for (int i=1;i<=n;i++) rank[sa[i]]=i;
    		for (int k=0,i=1;i<=n;i++) {
    			if (k) k--;
    			int j=sa[rank[i]-1];
    			while (r[i+k]==r[j+k]) k++;
    			height[rank[i]]=k;
    		}
    	}
    }
    
    int main() {
    	while (scanf("%d",&K)!=EOF && K) {
    		scanf("%s",s+1);
    		int n=strlen(s+1);
    		s[++n]='#';
    		int l=n;
    		scanf("%s",s+n+1);
    		n=strlen(s+1);
    		Suffix::da(s,sa,n,300);
    		Suffix::calheight(s,sa,n);
    		int top=0;LL ans=0,S=0;
    		height[n+1]=inf;
    		for (int i=1;i<=n+1;i++) {
    			if (sa[i]>l && i!=n+1) ans+=S;
    			if (height[i+1]>=K) {
    				while (top>1 && st[top-1].w>height[i+1]-K+1) {
    					st[top-1].c+=st[top].c;
    					S-=(st[top].w-st[top-1].w)*st[top].c;
    					st[top--]=(data){0,0};
    				}
    				if (st[top].w>height[i+1]-K+1) {
    					if (st[top-1].w==height[i+1]-K+1) {
    						st[top-1].c+=st[top].c;
    						S-=(st[top].w-st[top-1].w)*st[top].c;
    						st[top--]=(data){0,0};
    					}
    					else {S-=(st[top].w-(height[i+1]-K+1))*st[top].c;st[top].w=height[i+1]-K+1;}
    				}
    				if (sa[i]<l) {
    					if (st[top].w==height[i+1]-K+1) st[top].c++;
    					else st[++top]=(data){height[i+1]-K+1,1};
    					S+=height[i+1]-K+1;
    				}
    			}
    			else {while (top) st[top--]=(data){0,0};S=0;}
    		}
    		for (int i=1;i<=n+1;i++) {
    			if (sa[i]<l && i!=n+1) ans+=S;
    			if (height[i+1]>=K) {
    				while (top>1 && st[top-1].w>height[i+1]-K+1) {
    					st[top-1].c+=st[top].c;
    					S-=(st[top].w-st[top-1].w)*st[top].c;
    					st[top--]=(data){0,0};
    				}
    				if (st[top].w>height[i+1]-K+1) {
    					if (st[top-1].w==height[i+1]-K+1) {
    						st[top-1].c+=st[top].c;
    						S-=(st[top].w-st[top-1].w)*st[top].c;
    						st[top--]=(data){0,0};
    					}
    					else {S-=(st[top].w-(height[i+1]-K+1))*st[top].c;st[top].w=height[i+1]-K+1;}
    				}
    				if (sa[i]>l) {
    					if (st[top].w==height[i+1]-K+1) st[top].c++;
    					else st[++top]=(data){height[i+1]-K+1,1};
    					S+=height[i+1]-K+1;
    				}
    			}
    			else {while (top) st[top--]=(data){0,0};S=0;}
    		}
    		printf("%lld
    ",ans);
    	}
        return 0;
    }
    
  • 相关阅读:
    多线程创建方式及线程安全问题
    JDBC连接池&DBUtils
    mySQL 多表查询语句
    git 本机链接多库配置
    mysql类似递归的一种操作进行层级查询
    js 自定义事件观察者模式(发布/订阅)
    CSS样式遇见的问题总结记录
    maven打包pom.xml备忘
    JasperReports实现报表调出excel
    ActiveMQ 集群配置 高可用
  • 原文地址:https://www.cnblogs.com/MashiroSky/p/6281546.html
Copyright © 2011-2022 走看看