zoukankan      html  css  js  c++  java
  • 最长公共子串

    题目链接:https://cn.vjudge.net/contest/318888#problem/H

    题意:

    求两个子串的字符串的最长公共子串

    思路:

    "最长公共子串"解法(摘自罗穗骞的国家集训队论文):

    字符串的任何一个子串都是这个字符串的某个后缀的前缀。 求A和B的最长公共子串等价于求A的后缀和B的后缀的最长公共前缀的最大值。如果枚举A
    和B的所有的后缀, 那么这样做显然效率低下。 由于要计算A的后缀和B的后缀的最长公共前缀, 所以先将第二个字符串写在第一个字符串后面, 中间用一个没有出现过的字符隔开,再求这个新的字符串的后缀数组。观察一下,看看能不能从这个新的字符串的后缀数组中找到一些规律。以A=“ aaaba”, B=“ abaa” 为例,如图所示。

     

    那么是不是所有的height值中的最大值就是答案呢?不一定!有可能这两个后缀是在同一个字符串中的,所以实际上只有当 suffix(sa[i-1])和suffix(sa[i])不是同一个字符串中的两个后缀时, height[i]才是满足条件的。而这其中的最大值就是答案。 记字符串A和字符串B的长度分别为|A|和|B|。 求新的字符串的后缀数组和height数组的时间是O(|A|+|B|),然后求排名相邻但原来不在同一个字符串中的两个后缀的 height 值的最大值,时间也是O(|A|+|B|),所以整个做法的时间复杂度为O(|A|+|B|)。时间复杂度已经取到下限,由此看出,这是一个非常优秀的算法。

    ps:因为两个字符合成一个字符时,中间(位置k)会用一个没有出现过的字符隔开,所以判断两个后缀是不是同一个字符串可以借助这个位置k

    即当(sa[i]-k)*(sa[i-1]-k)<0时,两个后缀属于不同的字符串,此题求乘积时可能会爆int,注意一下即可



     1 #include <stdio.h>
     2 #include <iostream>
     3 #include <algorithm>
     4 #include <string.h>
     5 #include <stdlib.h>
     6 #include <math.h>
     7 #include <queue>
     8 #include <set>
     9 
    10 #define INF 0x3f3f3f3f
    11 #define pii pair<int,int>
    12 #define LL long long
    13 using namespace std;
    14 typedef unsigned long long ull;
    15 const int MAXN = 200005;
    16 
    17 int wa[MAXN], wb[MAXN], wv[MAXN], ws_[MAXN];
    18 void Suffix(int *r, int *sa, int n, int m)
    19 {
    20     int i, j, k, *x = wa, *y = wb, *t;
    21     for(i = 0; i < m; ++i) ws_[i] = 0;
    22     for(i = 0; i < n; ++i) ws_[x[i] = r[i]]++;
    23     for(i = 1; i < m; ++i) ws_[i] += ws_[i - 1];
    24     for(i = n - 1; i >= 0; --i) sa[--ws_[x[i]]] = i;
    25     for(j = 1, k = 1; k < n; j *= 2, m = k)
    26     {
    27         for(k = 0, i = n - j; i < n; ++i) y[k++] = i;
    28         for(i = 0; i < n; ++i) if(sa[i] >= j) y[k++] = sa[i] - j;
    29         for(i = 0; i < n; ++i) wv[i] = x[y[i]];
    30         for(i = 0; i < m; ++i) ws_[i] = 0;
    31         for(i = 0; i < n; ++i) ws_[wv[i]]++;
    32         for(i = 1; i < m; ++i) ws_[i] += ws_[i - 1];
    33         for(i = n - 1; i >= 0; --i) sa[--ws_[wv[i]]] = y[i];
    34         t = x;
    35         x = y;
    36         y = t;
    37         for(x[sa[0]] = 0, i = k = 1; i < n; ++i)
    38             x[sa[i]] = (y[sa[i - 1]] == y[sa[i]] && y[sa[i - 1] + j] == y[sa[i] + j]) ? k - 1 : k++;
    39     }
    40 }
    41 int Rank[MAXN], height[MAXN], sa[MAXN], r[MAXN];
    42 void calheight(int *r,int *sa,int n)
    43 {
    44     int i,j,k=0;
    45     for(i=1; i<=n; i++)Rank[sa[i]]=i;
    46     for(i=0; i<n; height[Rank[i++]]=k)
    47         for(k?k--:0,j=sa[Rank[i]-1]; r[i+k]==r[j+k]; k++);
    48 }
    49 int n,minnum[MAXN][17];
    50 void RMQ()
    51 {
    52     int i,j;
    53     int m=(int)(log(n*1.0)/log(2.0));
    54     for(i=1;i<=n;i++)
    55         minnum[i][0]=height[i];
    56     for(j=1;j<=m;j++)
    57         for(i=1;i+(1<<j)-1<=n;i++)
    58             minnum[i][j]=min(minnum[i][j-1],minnum[i+(1<<(j-1))][j-1]);
    59 }
    60 int Ask_MIN(int a,int b)
    61 {
    62     int k=int(log(b-a+1.0)/log(2.0));
    63     return min(minnum[a][k],minnum[b-(1<<k)+1][k]);
    64 }
    65 int calprefix(int a,int b)
    66 {
    67     a=Rank[a],b=Rank[b];
    68     if(a>b)
    69         swap(a,b);
    70     return Ask_MIN(a+1,b);
    71 }
    72 char s[MAXN];
    73 int q[MAXN];
    74 int main()
    75 {
    76     while (~scanf("%s",s)){
    77         int k = strlen(s);
    78         s[k] = 'z'+1;
    79         scanf("%s",s+k+1);
    80         int n = strlen(s);
    81         for (int i=0;i<n;i++){
    82             r[i] = s[i]-'a'+1;
    83         }
    84         int maxx = 0;
    85         Suffix(r,sa,n+1,28);
    86         calheight(r,sa,n);
    87         for (int i=1;i<=n;i++){
    88             if (height[i]>maxx && 1ll*(sa[i]-k)*(sa[i-1]-k)<0)
    89                 maxx = height[i];
    90         }
    91         printf("%d
    ",maxx);
    92     }
    93     return 0;
    94 }
  • 相关阅读:
    LeetCode 224. 基本计算器 栈 双指针
    LeetCode 150. 逆波兰表达式求值 栈
    LeetCode 387. 字符串中的第一个唯一字符 哈希
    LeetCode 316. 去除重复字母 栈 哈希
    LeetCode 44. 通配符匹配 dp
    禁止屏幕旋转并同时解决以至于导致Activity重启的方法
    让振动器振动起来——Vibrator的使用
    简单的JDBC封装
    js jquery ajax 清除ie下的缓存问题
    angular.js 下拉框选中 根据后台返回值
  • 原文地址:https://www.cnblogs.com/-Ackerman/p/11337532.html
Copyright © 2011-2022 走看看