zoukankan      html  css  js  c++  java
  • 【后缀数组学习中】

    小白书 219 页入门


    大概懂得后缀数组原理 即后缀排序后的下标所形成的数组


    裸的算法是 n*n*logn:直接利用定义 对所有后缀快排........


    稍微好点. nlogn的倍增算法 原理懂了


    更好点 线性时间的...只是简单涉及了没有


    逛逛博客 学习前人优秀代码风格


    http://dongxicheng.org/structure/suffix-array/

    很好的将几篇国家队论文整合了,题目,介绍都有。好好研究


    http://blog.csdn.net/xymscau/article/details/8798046

    提供了代码和几个练习题

    http://www.cnblogs.com/kuangbin/archive/2013/05/20/3089189.html

    kuangbing写的

    const int MAXN=300000;
    char s[MAXN];
    int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n;
    void build_sa(int m){
        int *x=t, *y=t2;
        for(int i = 0 ; i < m ;i++) c[i] = 0;
        for(int i = 0 ; i < n ;i++) c[x[i]=s[i]]++;
        for(int i = 1 ; i < m ;i++) c[i] += c[i-1];
        for(int i=n-1 ; i >= 0;i--) sa[--c[x[i]]] = i;
        for(int k = 1 ; k <= n; k <<=1) {
            int p=0;
            //直接利用sa数组排序第二关键字
            for(int i = n-k ;i < n ;i++) y[p++]=i;
            for(int i = 0; i < n; i++)   if(sa[i] >= k) y[p++] = sa[i]-k;
            //基数排序第一关键字
            for(int i = 0; i < m; i++)   c[i]=0;
            for(int i = 0; i < n; i++)   c[x[y[i]]]++;
            for(int i = 0; i < m; i++)   c[i] += c[i-1];
            for(int i = n-1;i >= 0; i--) sa[--c[x[y[i]]]]=y[i];
            //根据sa和y数组重新计算新的y数组
            swap(x,y);
            p = 1; x[sa[0]] = 0;
            for(int i = 1;i < n; i++)
                x[sa[i]] = y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k] ? p-1: p++;
            if(p >=n ) break;
            m=p;
        }
    }

    以上代码还需好好研究.

    ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

    罗穗骞

    后缀数组——处理字符串的有力工具

    仔细研读后缀数组基本能全懂了


    一.后缀数组代码

    1.为什么要在最后加一个很小的在最后呢?(在第九页解释了)

    这里可以看到规定s[n]=0 的好处,如果s[a]=s[b] 说明以s[a]或s[b]开头的长度为l的字符串肯定不包括字符s[n]

    所以调用s[a+l] 和s[b+l] 不会导致数组下标越界,这样就不需要做特殊判断。


    二.后缀数组的应用

    2.1 最长公共前缀

    height 数组:定义 height[i]= suffix(sa[i-1]) 和 suffix(sa[i]) 的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀。

  • 相关阅读:
    mysql 索引学习笔记
    mysql mysqli pdo学习总结
    Flask-Login的实现
    Flask配置方法
    Flask-SQLAlchemy使用方法
    alpha阶段绩效考核
    Alpha版本后的心得体会
    代码及数据库展示
    功能简介
    最新的用户需求分析
  • 原文地址:https://www.cnblogs.com/zy691357966/p/5480328.html
Copyright © 2011-2022 走看看