zoukankan      html  css  js  c++  java
  • hdu 3518 Boring counting 后缀数组LCP

    题目链接

    题意:给定长度为n(n <= 1000)的只含小写字母的字符串,问字符串子串不重叠出现最少两次的不同子串个数;

    input:

    aaaa
    ababcabb
    aaaaaa
    #
    output
    2
    3
    3
     
    思路:套用后缀数组求解出sa数组和height数组,之后枚举后缀的公共前缀长度i,由于不能重叠,所以计数的是相邻height不满足LCP >= i的。
    写写对后缀数组倍增算法的理解:
    1.如果要sa数组对应的值也是1~n就需要在最后加上一个最小的且不出现的字符'#',里面y[]是利用sa数组对第二个关键字重新排序,由于使用的是基数排序,所以当前一次长度为k时相同的子串,在下一次长为2*k时,y排在前面的下标得到的sa是要小的;
     
    2.在getHeight函数中,rk[i]:后缀i在sa中的排名;height[i]表示s[i] 与s[i-1]的公共前缀长度。且s[i] 与 s[j] 的值为 RMQ(min{ height[i+1]...height[j] }),加上i < j;同时可以借助辅助数组h[i] = height[rk[i]],得到h[i] >= h[i-1] + 1;这样使用递推就可以将求解height[]的时间复杂度降为O(n);
     
    注意:在输入串s末尾加入字符之后 n = strlen(s) + 1;在求解rk[]时,sa[i]是从1开始的,sa[0] = '$';之后的求解height[]还是从0开始;细节
     
    #include<bits/stdc++.h>
    using namespace std;
    typedef long long ll;
    const int MAXN = 1007;
    char s[MAXN];
    int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n;
    void build_sa(int m,int n) // m为字符ASCII码的最大值+1;n = strlen(s) + 1;
    {
        int i,*x = t, *y = t2;
        for(i = 0;i < m; i++) c[i] = 0;
        for(i = 0;i < n; i++) c[x[i] = s[i]]++;
        for(i = 1;i < m; i++) c[i] += c[i-1];
        for(i = n - 1;i >= 0; i--) sa[--c[x[i]]] = i;
        for(int k = 1;k <= n;k <<= 1){
            int p = 0;
            for(i = n - k;i < n;i++) y[p++] = i;
            for(i = 0;i < n;i++) if(sa[i] >= k) y[p++] = sa[i] - k;
    
            for(i = 0;i < m;i++) c[i] = 0;
            for(i = 0;i < n;i++) c[x[y[i]]]++;
            for(i = 1;i < m;i++) c[i] += c[i-1];
            for(i = n - 1;i >= 0;i--) sa[--c[x[y[i]]]] = y[i];
    
            swap(x,y);
            x[sa[0]] = 0;// 将字符彻底转变为序号;
            for(i = 1,p = 1;i < n;i++)
                x[sa[i]] = y[sa[i]] == y[sa[i-1]] && y[sa[i]+k] == y[sa[i-1]+k]?p-1:p++;
            if(p >= n) break;
            m = p;
        }
    }
    int rk[MAXN],height[MAXN];
    void getHeight()
    {
        int i,j,k = 0;
        for(i = 1;i <= n;i++) rk[sa[i]] = i; // rk[i]:后缀i在sa[]中的下标,从1开始
        for(i = 0;i < n;i++){
            if(k) k--;
            if(rk[i] == 0) continue;
            j = sa[rk[i] - 1];
            while(i+k<n && j+k<n && s[i+k] == s[j+k]) k++;
            height[rk[i]] = k; // h[i] = height[rk[i]]; h[i] >= h[i-1] - 1;
        }
    }
    int main()
    {
        while(scanf("%s",s) == 1 && s[0] != '#'){
            ll ans = 0;
            n = strlen(s);
            s[n] = '#';
            build_sa('z'+1,n+1);
            getHeight();
            for(int i = 1;i <= n/2; i++){
                int l = n+1,r = -1;
                for(int j = 2;j <= n;j++){
                    if(height[j] >= i){// 递推出最左最优的l,r;
                        r = max(r,max(sa[j],sa[j-1]));
                        l = min(l,min(sa[j],sa[j-1]));
                    }
                    else{
                        if(r-l >= i) ans++;
                        r = -1,l = n+1;
                    }
                }
                if(r-l >= i) ans++;
            }
            printf("%I64d
    ",ans);
        }
        return 0;
    }
     
  • 相关阅读:
    线性时间排序算法
    【MSSQL】MDF、NDF、LDF文件的含义
    SQL表变量与临时表区别 + 非游标临时表遍历
    SQL Server 备份和还原全攻略
    S​Q​L​_​S​e​r​v​e​r​_​2​0​0​8​定​期​自​动​备​份​详​细​图​解
    Global.asax 文件是什么
    SQL 视图 局部变量 全局变量 条件语句 事务 触发器
    XP禁用了U盘和移动硬盘方法
    java实现 数据结构:链表、 栈、 队列、优先级队列、哈希表
    Mysql 存储过程和函数区别
  • 原文地址:https://www.cnblogs.com/hxer/p/5376537.html
Copyright © 2011-2022 走看看