zoukankan      html  css  js  c++  java
  • POJ 1743 Musical Theme ( 后缀数组 && 最长不重叠相似子串 )

    题意 : 给 n 个数组成的串,求是否有多个“相似”且不重叠的子串的长度大于等于5,两个子串相似当且仅当长度相等且每一位的数字差都相等。

    分析 :  根据题目对于 “ 相似 ” 串的定义,我们可以将原串变成由原串元素两两做差得到的一个“差值串”,例如 1 2 3 5 就会变成 1 1 2 这个串,显然若原串长为 len 则 “差值串” 的长度就为 len - 1。转化为 “差值串” 之后原问题就变成了是否存在两个及两个以上的不重叠子串元素相同且长度大于或等于 4 ,但是呢这样的转化有个小问题,还需要加上一个附加条件,即在 “差值串” 找到的不重叠子串不应该连在一起,即两串至少相隔一个元素,为什么呢?举个例子就明白了,例如 1 1 1 1 1 1 1 1 1 这 9 个 1 得到的 “差值串” 为 0 0 0 0 0 0 0 0 ,那么你在这里能够找到两个相同的串且长度大于或者等于4,不过这并不合法对么?所以在这种差值转化或者和转化的转化后的序列要多考虑这些情况。好了,现在将问题进行了转化,那么如何快速解决这个问题呢?

    后缀数组论文里面提到了一个根据 Height 分组的办法,大致步骤如下

    1、二分枚举子串长度,判断解是否成立

    2、判断长度是否成立:把互相之间LCP大于等于长度的分为一组,这通过个扫一遍 Height 即可,因为后缀是有序的,相邻的后缀间的LCP必定的极大的(注意这个事实!)接下来就找到每个组里后缀 sa 值最大和最小的,如果差值大于 k 就成立(而不是大于等于,因为等于就不能满足上面说的附加条件了),因为这样小下标的后缀沿着LCP下去走k步才不会盖到大下标的后缀。

    #include<stdio.h>
    #include<string.h>
    #include<algorithm>
    using namespace std;
    const int maxn = 20005;
    const int INF = 0x3f3f3f3f;
    
    int sa[maxn],s[maxn],wa[maxn], wb[maxn], Ws[maxn], wv[maxn];
    int Rank[maxn], height[maxn];
    
    bool cmp(int r[], int a, int b, int l){ return r[a] == r[b] && r[a+l] == r[b+l]; }
    void da(int r[], int sa[], int n, int m)
    {
        int i, j, p, *x = wa, *y = wb;
        for (i = 0; i < m; ++i) Ws[i] = 0;
        for (i = 0; i < n; ++i) Ws[x[i]=r[i]]++;
        for (i = 1; i < m; ++i) Ws[i] += Ws[i-1];
        for (i = n-1; i >= 0; --i) sa[--Ws[x[i]]] = i;
        for (j = 1, p = 1; p < n; j *= 2, m = p)
        {
            for (p = 0, i = n - j; i < n; ++i) y[p++] = i;
            for (i = 0; i < n; ++i) if (sa[i] >= j) y[p++] = sa[i] - j;
            for (i = 0; i < n; ++i) wv[i] = x[y[i]];
            for (i = 0; i < m; ++i) Ws[i] = 0;
            for (i = 0; i < n; ++i) Ws[wv[i]]++;
            for (i = 1; i < m; ++i) Ws[i] += Ws[i-1];
            for (i = n-1; i >= 0; --i) sa[--Ws[wv[i]]] = y[i];
            for (std::swap(x, y), p = 1, x[sa[0]] = 0, i = 1; i < n; ++i)
                x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p-1 : p++;
        }
    }
    
    void calheight(int r[], int sa[], int n)
    {
        int i, j, k = 0;
        for (i = 1; i <= n; ++i) Rank[sa[i]] = i;
        for (i = 0; i < n; height[Rank[i++]] = k)
            for (k?k--:0, j = sa[Rank[i]-1]; r[i+k] == r[j+k]; k++);
    }
    
    int N;
    int arr[maxn];
    int r[maxn];
    
    bool isOk(int len, int n)
    {
        int mm, mx;
        mm =  INF;
        mx = -INF;
        for(int i=2; i<=n; i++){
            if(height[i] >= len){
                mm = min(mm, min(sa[i], sa[i-1]));
                mx = max(mx, max(sa[i], sa[i-1]));
                if(mx - mm > len) return true;
            }else mm = INF, mx = -INF;
        }return false;
    }
    
    int main(void)
    {
        while(~scanf("%d", &N) && N){
            for(int i=0; i<N; i++)
                scanf("%d", &arr[i]);
    
            N -= 1;
    
            for(int i=0; i<N; i++)
                r[i] = arr[i+1] - arr[i] + 88;
            r[N] = 0;
    
            da(r, sa, N+1, 176);
            calheight(r, sa, N);
    
            int ans = -1, L = 0, R = N>>1;
            while(L <= R){
                int mid = L + ((R-L)>>1);
                if(isOk(mid, N)) ans = mid, L = mid + 1;
                else R = mid - 1;
            }
    
            if(ans == -1 || ans < 4) puts("0");
            else printf("%d
    ", ans+1);
        }
        return 0;
    }
    View Code
  • 相关阅读:
    (一)Python入门-6面向对象编程:01面向对象和面向过程区别-对象的进化
    (一)Python入门-5函数:10nonlocal-global-LEGB规则
    (一)Python入门-5函数:09嵌套函数(内部函数)-数据隐藏
    (一)Python入门-5函数:08递归函数
    (一)Python入门-5函数:07lambda表达式和匿名函数-eval()函数
    (一)Python入门-5函数:06参数类型-位置参数-默认值参数-命名参数-可变参数-强制命名参数
    (一)Python入门-5函数:05参数的传递-可变对象-不可变对象-浅拷贝和深拷贝-不可变对象含可变子对象
    (一)Python入门-5函数:04变量的作用域-全局变量-局部变量-栈帧内存分析-效率测试
    Java学习第十二章 之 自定义数据类型的使用
    Java学习第十一章 之 final、static、内部类
  • 原文地址:https://www.cnblogs.com/qwertiLH/p/7853151.html
Copyright © 2011-2022 走看看