zoukankan      html  css  js  c++  java
  • 2019CCPC网络预选赛 1003 K-th occurrence 后缀自动机 + 二分 + 主席树

    题意:给你一个长度为n的字符串,有m次询问,每次询问l到r的子串在原串中第k次出现的位置,如果没有输出-1。n, m均为1e5级别。

    思路:后悔没学后缀数组QAQ,其实只要学过后缀数组这个题还是比较好想的。这个问题可以转化为有多少个后缀和后缀l的lcp长度大于等于r - l + 1。我们知道,在后缀数组中,两个后缀i, j的lcp是min(height[rank[j] + 1], height[rank[j] + 2], ....height[rank[i]])。那么,我们可以二分出一个最靠左的位置(假设这个位置是p),这个位置到rank[l]的height都是 >= r - l + 1的,即从p到rank[l]这些位置的后缀与l的lcp长度都是大于等于r - l + 1的。rank[l]的右边同理可得。那么,我们就可以知道有哪些后缀可能是答案了。那么还有一个问题,怎么知道它们中第k个位置呢?这个就是一个静态区间第k大问题,我们把sa[i]按顺序插入到主席树中,然后再二分出的两个端点之间询问第k大的位置即可。

    代码(后缀数组板子copy网上的QAQ):

    #include <bits/stdc++.h>
    using namespace std;
    const int maxn = 100010;
    char s[maxn];
    int n, tot;
    int root[maxn];
    struct node {
        int sum;
        int lc, rc;
    };
    node tr[maxn * 50];
    struct SA {
        int sa[maxn], x[maxn], y[maxn], c[maxn];
        int rank[maxn], height[maxn], h[maxn];
        int f[maxn][18];
        
        void build_sa(int m) {
            for (int i = 0; i <= m; i++) c[i] = 0;
            for (int i=1; i<=n; ++i) ++c[x[i]=s[i]];
        //c数组是桶
        //x[i]是第i个元素的第一关键字
            for (int i=2; i<=m; ++i) c[i]+=c[i-1];
        //做c的前缀和,我们就可以得出每个关键字最多是在第几名
            for (int i=n; i>=1; --i) sa[c[x[i]]--]=i;
            for (int k=1; k<=n; k<<=1) {
                int num=0;
                for (int i=n-k+1; i<=n; ++i) y[++num]=i;
        //y[i]表示第二关键字排名为i的数,第一关键字的位置
        //第n-k+1到第n位是没有第二关键字的 所以排名在最前面
                for (int i=1; i<=n; ++i) if (sa[i]>k) y[++num]=sa[i]-k;
        //排名为i的数 在数组中是否在第k位以后
        //如果满足(sa[i]>k) 那么它可以作为别人的第二关键字,就把它的第一关键字的位置添加进y就行了
        //所以i枚举的是第二关键字的排名,第二关键字靠前的先入队
                for (int i=1; i<=m; ++i) c[i]=0;
        //初始化c桶
                for (int i=1; i<=n; ++i) ++c[x[i]];
        //因为上一次循环已经算出了这次的第一关键字 所以直接加就行了
                for (int i=2; i<=m; ++i) c[i]+=c[i-1]; //第一关键字排名为1~i的数有多少个
                for (int i=n; i>=1; --i) sa[c[x[y[i]]]--]=y[i],y[i]=0;
        //因为y的顺序是按照第二关键字的顺序来排的
        //第二关键字靠后的,在同一个第一关键字桶中排名越靠后
        //基数排序
                swap(x,y);
        //这里不用想太多,因为要生成新的x时要用到旧的,就把旧的复制下来,没别的意思
                x[sa[1]]=1;
                num=1;
                for (int i=2; i<=n; ++i)
                    x[sa[i]]=(y[sa[i]]==y[sa[i-1]] && y[sa[i]+k]==y[sa[i-1]+k]) ? num : ++num;
        //因为sa[i]已经排好序了,所以可以按排名枚举,生成下一次的第一关键字
                if (num==n) break;
                m=num;
        //这里就不用那个122了,因为都有新的编号了
            }
        }
        
        void get_height() {
            int k=0;
            for (int i=1; i<=n; ++i) rank[sa[i]]=i;
            for (int i=1; i<=n; ++i) {
                if (rank[i]==1) continue;//第一名height为0
                if (k) --k;//h[i]>=h[i-1]-1;
                int j=sa[rank[i]-1];
                while (j+k<=n && i+k<=n && s[i+k]==s[j+k]) ++k;
                height[rank[i]]=k;//h[i]=height[rk[i]];
            }
            for (int i = 1; i <= n; i++) h[i] = height[rank[i]];
        }
        
        void build_st() {
            for (int i = 1; i <= n; i++)
                f[i][0] = height[i];
            int t = log(n) / log(2) + 1;
            for (int j = 1; j < t; j++) {
                for (int i = 1; i <= n - (1 << j) + 1; i++)
                    f[i][j] = min(f[i][j - 1], f[i + (1 << (j - 1))][j - 1]);
            }
        }
        
        int query(int l, int r) {
            if(l > r) return 0;
            int k = log(r - l + 1) / log(2);
            return min(f[l][k], f[r - (1 << k) + 1][k]);
        }
    };
    
    SA solve;
    
    int build(int l, int r) {
        int p = ++tot;
        if (l == r) {
            tr[p].sum = 0;
            tr[p].lc = tr[p].rc = 0;
            return p;
        }
        int mid = (l + r) >> 1;
        tr[p].lc = build(l, mid);
        tr[p].rc = build(mid + 1, r);
        tr[p].sum = tr[tr[p].lc].sum + tr[tr[p].rc].sum;
        return p;
    }
    int insert(int now, int l, int r, int x, int val) {
        int p = ++tot;
        tr[p] = tr[now];
        if(l == r) {
            tr[p].sum = 1;
            return p;
        }
        int mid = (l + r) >> 1;
        if(x <= mid) tr[p].lc = insert(tr[now].lc, l, mid, x, val);
        else tr[p].rc = insert(tr[now].rc, mid + 1, r, x, val);
        tr[p].sum = tr[tr[p].lc].sum + tr[tr[p].rc].sum;
        return p;
    }
    int query(int lnow, int rnow, int l, int r, int remain) {
        if(l > r) return 0;
        if(l == r) {
            return l;
        }
        int mid = (l + r) >> 1;
        int tmp = tr[tr[rnow].lc].sum - tr[tr[lnow].lc].sum;
        if(tmp >= remain) return query(tr[lnow].lc, tr[rnow].lc, l, mid, remain);
        else return query(tr[lnow].rc, tr[rnow].rc, mid + 1, r, remain - tmp); 
    }
    int main() {
        int T, m, l, r, k, ql, qr;
    //    freopen("cin.txt", "r", stdin);
    //    freopen("cout.txt", "w", stdout);
        scanf("%d", &T);
        while(T--) {
            tot = 0;
            scanf("%d%d", &n, &m);
            scanf("%s", s + 1);
            for (int i = 1; i <= n; i++)
                s[i] -= ('a' - 1);
            solve.build_sa(30);
            solve.get_height();
            solve.build_st();
            root[0] = build(1, n);
            for (int i = 1; i <= n; i++) {
                root[i] = insert(root[i - 1], 1, n, solve.sa[i], 1);
            }
            for (int i = 1; i <= m; i++) {
                scanf("%d%d%d", &l, &r, &k);
                int p = solve.rank[l];
                int L = 1, R = p;
                while(L < R) {
                    int mid = (L + R) >> 1;
                    if(solve.query(mid + 1, p) < r - l + 1) L = mid + 1;
                    else R = mid;
                }
                ql = L;
                L = p, R = n;
                while(L < R) {
                    int mid = (L + R + 1) >> 1;
                    if(solve.query(p + 1, mid) < r - l + 1) R = mid - 1;
                    else L = mid;
                }
                qr = R;
                if(qr - ql + 1 < k) printf("-1
    ");
                else printf("%d
    ", query(root[ql - 1], root[qr], 1, n, k));
            }
        }
        
    }
    

      

  • 相关阅读:
    电感和感抗
    电容和容抗
    ULN2003A驱动12V继电器
    5V转3.3V(TPS73101)
    电解电容和钽电容的区别
    svn 报错 Previous operation has not finished; run 'cleanup' if it was interrupted
    html格式 保持原样输出的标签
    微信公众号开发
    Hibernate各种主键生成策略与配置详解
    SVN符号说明
  • 原文地址:https://www.cnblogs.com/pkgunboat/p/11407332.html
Copyright © 2011-2022 走看看