zoukankan      html  css  js  c++  java
  • 字符串子串去重之后的个数

    给定一个长度为N的字符串S,问所有它的子串Sl…r(1≤l≤r≤N),去重后有多少种。

    输入描述:

    一行一个字符串S。

    输出描述:

    一行一个整数,表示答案。
    示例1

    输入

    ababa

    输出

    9

    备注:

    1≤N≤105,字符都是小写字母
    #include <cstdio>
    #include <cstring>
    #include <algorithm>
    #define ll long long
    using namespace std;
    
    const int MAXN = 100005;
    
    char ch[MAXN], All[MAXN];
    int SA[MAXN], RANK[MAXN], Height[MAXN], tax[MAXN], tp[MAXN], a[MAXN], n, m; 
    char str[MAXN];
    //RANK[i] 第i个后缀的排名; SA[i] 排名为i的后缀位置; Height[i] 排名为i的后缀与排名为(i-1)的后缀的LCP
    //tax[i] 计数排序辅助数组; tp[i] RANK的辅助数组(计数排序中的第二关键字),与SA意义一样。
    //a为原串
    void RSort() {
        //RANK第一关键字,tp第二关键字。
        for (int i = 0; i <= m; i ++) tax[i] = 0;
        for (int i = 1; i <= n; i ++) tax[RANK[tp[i]]] ++;
        for (int i = 1; i <= m; i ++) tax[i] += tax[i-1];
        for (int i = n; i >= 1; i --) SA[tax[RANK[tp[i]]] --] = tp[i]; //确保满足第一关键字的同时,再满足第二关键字的要求
    } //计数排序,把新的二元组排序。
    
    int cmp(int *f, int x, int y, int w) { return f[x] == f[y] && f[x + w] == f[y + w]; } 
    //通过二元组两个下标的比较,确定两个子串是否相同
    
    void Suffix() {
        //SA
        for (int i = 1; i <= n; i ++) RANK[i] = a[i], tp[i] = i;
        m = 127 ,RSort(); //一开始是以单个字符为单位,所以(m = 127)
    
        for (int w = 1, p = 1, i; p < n; w += w, m = p) { //把子串长度翻倍,更新RANK
    
            //w 当前一个子串的长度; m 当前离散后的排名种类数
            //当前的tp(第二关键字)可直接由上一次的SA的得到
            for (p = 0, i = n - w + 1; i <= n; i ++) tp[++ p] = i; //长度越界,第二关键字为0
            for (i = 1; i <= n; i ++) if (SA[i] > w) tp[++ p] = SA[i] - w;
    
            //更新SA值,并用tp暂时存下上一轮的RANK(用于cmp比较)
            RSort(), swap(RANK, tp), RANK[SA[1]] = p = 1;
    
            //用已经完成的SA来更新与它互逆的RANK,并离散RANK
            for (i = 2; i <= n; i ++) RANK[SA[i]] = cmp(tp, SA[i], SA[i - 1], w) ? p : ++ p;
        }
        //离散:把相等的字符串的RANK设为相同。
        //LCP
        int j, k = 0;
        for(int i = 1; i <= n; Height[RANK[i ++]] = k) 
            for( k = k ? k - 1 : k, j = SA[RANK[i] - 1]; a[i + k] == a[j + k]; ++ k);
        //这个知道原理后就比较好理解程序
    }
    
    void Init() {
        scanf("%s", str);
        n = strlen(str);
        for (int i = 0; i < n; i ++) a[i + 1] = str[i];
    }
    
    int main() {
        Init();
        Suffix();
    
        ll ans=0;
        for(ll i=1;i<=n;i++)ans+=n+1-SA[i]-Height[i];
        printf("%lld
    ",ans);     
          
    }
  • 相关阅读:
    js判断空对象
    浅析css布局模型2
    Python 绘图
    我的第一个 Kaggle 比赛学习
    写代码 Log 也要认真点么?
    Python 线性回归(Linear Regression)
    Python
    Git
    算法4:插入排序和选择排序算法的比较
    《算法4》2.1
  • 原文地址:https://www.cnblogs.com/wysAC666/p/10705917.html
Copyright © 2011-2022 走看看