zoukankan      html  css  js  c++  java
  • POJ 1743 Musical Theme(不可重叠最长重复子串)

    题目链接:http://poj.org/problem?id=1743

    题意:有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:

    1、长度至少为5个音符。

    2、在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)

    3、重复出现的同一主题不能有公共部分。

    思路:后缀数组。求出任意相邻音符的差值,然后把问题转化为不可重叠最长重复子串,用后缀数组来做。先二分答案,把题目变成判定性问题:判断是否存在两个长度为k的子串是相同的,且不重叠。

    先不考虑重叠,重复子串的长度要大于等于k,也就是一个区间内的height值都大于等于k,当出现height小于k则重新定位。

    再来考虑重叠,我们知道了一个区间的height都大于等于k,如果存在两个后缀距离大于k,那么可以肯定存在两个长度为k的子串是相同的,且不重叠。

      1 #include <cstdio>
      2 const int MAXN = 20005;
      3 int wa[MAXN], wb[MAXN], wv[MAXN], ws[MAXN];
      4 
      5 int cmp(int* r, int a, int b, int l)
      6 {
      7     return r[a] == r[b] && r[a + l] == r[b + l];
      8 }
      9 
     10 /*
     11 * r: 原字符串 放在0 - (n-1)位在最后补一个最小字符(ASCLL最小)
     12 * sa: 后缀数组 sa[1...n]有效 sa[0]无效
     13 * n: 原字符串长度 + 1(后面补了一个字符)
     14 * m: 字符大小(ASCLL)的上界
     15 */
     16 void Da(int* r, int* sa, int n, int m)
     17 {
     18     int i, j, p, *x = wa, *y = wb, *t;
     19 
     20     for (i = 0; i < m; ++i) ws[i] = 0;
     21     for (i = 0; i < n; ++i) ++ws[x[i] = r[i]];
     22     for (i = 1; i < m; ++i) ws[i] += ws[i - 1];
     23     for (i = n - 1; i >= 0; --i) sa[--ws[x[i]]] = i;
     24 
     25     for (j = 1, p = 1; p < n; j *= 2, m = p)
     26     {
     27         for (p = 0, i = n - j; i < n; ++i) y[p++] = i;
     28         for (i = 0; i < n; ++i)
     29         {
     30             if (sa[i] >= j)
     31                 y[p++] = sa[i] - j;
     32         }
     33 
     34         for (i = 0; i < n; ++i) wv[i] = x[y[i]];
     35         for (i = 0; i < m; ++i) ws[i] = 0;
     36         for (i = 0; i < n; ++i) ++ws[wv[i]];
     37         for (i = 1; i < m; ++i) ws[i] += ws[i - 1];
     38         for (i = n - 1; i >= 0; --i) sa[--ws[wv[i]]] = y[i];
     39 
     40         t = x;
     41         x = y;
     42         y = t;
     43         x[sa[0]] = 0;
     44 
     45         for (p = 1, i = 1; i < n; ++i)
     46         {
     47             x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
     48         }
     49     }
     50     return;
     51 }
     52 
     53 int rank[MAXN];
     54 int height[MAXN];
     55 /*
     56 * rank: 名次数组(后缀i在所有后缀中从小到大排列的名次),(以第k个字符开始的后缀称为后缀k)rank[0...n-1]有效
     57 * height: height[i] = suffix(sa[i - 1])和suffix(sa[i])的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀。height[2...n]有效
     58 */
     59 void CalHeight(int* r, int* sa, int n)
     60 {
     61     int i, j, k = 0;
     62     for (i = 1; i <= n; ++i) rank[sa[i]] = i;
     63     for (i = 0; i < n; height[rank[i++]] = k)
     64         for (k ? k-- : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; ++k);
     65     return;
     66 }
     67 
     68 bool IsExist(int sa[], int n, int key)
     69 {
     70     int tMax = sa[1];
     71     int tMin = sa[1];
     72     for (int i = 2; i <= n; ++i)
     73     {
     74         if (height[i] < key) tMax = tMin = sa[i];
     75         else
     76         {
     77             if (sa[i] < tMin) tMin = sa[i];
     78             if (sa[i] > tMax) tMax = sa[i];
     79             if (tMax - tMin > key) return true;
     80         }
     81     }
     82     return false;
     83 }
     84 
     85 int r[MAXN], sa[MAXN];
     86 
     87 int main()
     88 {
     89     int n;
     90     while (scanf("%d", &n), n)
     91     {
     92         --n;
     93         int k, t;
     94         scanf("%d", &t);
     95         for (int i = 0; i < n; ++i)
     96         {
     97             scanf("%d", &k);
     98             r[i] = k - t + 100;
     99             t = k;
    100         }
    101         r[n] = 0;
    102         Da(r, sa, n + 1, 200);
    103         CalHeight(r, sa, n);
    104         int tMin = 4;        // 子串最小的长度为4
    105         int tMax = n / 2;    // 要满足不重叠重复,那么该子串的长度最长为一半
    106         int tMid;
    107         while (tMin <= tMax)
    108         {
    109             tMid = (tMin + tMax) / 2;
    110             if (IsExist(sa, n, tMid)) tMin = tMid + 1;
    111             else tMax = tMid - 1;
    112         }
    113         if (tMax >= 4) printf("%d
    ", tMax + 1);
    114         else printf("0
    ");
    115     }
    116     return 0;
    117 }
  • 相关阅读:
    我来了
    学习笔记-数据仓库和数据挖掘
    React及JSX常见问题
    JavaScript笔记,不定期更新
    比strlen执行速度更快的处理字符串长度的函数
    LESS笔记/注意手册(更新中)
    鼠标移到图片变化的三种写法(可移植性强、代码少)
    信息安全技术作业5--散列函数的应用及其安全性
    结对作业(web)
    读《构建之法》第4、17章
  • 原文地址:https://www.cnblogs.com/ykzou/p/4488131.html
Copyright © 2011-2022 走看看