zoukankan      html  css  js  c++  java
  • 后缀数组的一些技巧

    }一般的,我们在字符串最后补个0,使排名从1开始。

    后缀数组技巧:

    .对于可重复的最长重复子串问题,可以直接遍历height[1..n],易知排名相邻的字符串最相似。

    .对于不可重复的最长重复子串问题,可以二分答案,遍历height[1..n]分组:

    每组大于mid,若碰到一个小于mid的更新。

    判断这一组中的max(sa[i])-min(sa[i])是否大于等mid

    这意味着两个距离大于mid,且存在公共子串长于mid。重新开始一轮。

    有希望成为最长公共前缀不小于 k 的两个后缀一定在同一组.所以可以nlogn求出。

    .对于求一个字符串子串的个数(两两不同)

    可根据后缀数组的定义,求出以每个排名下标位置开头的数目:n-sa[i]-height[i];

    所以若求子串排名,可以二分答案,找到相应位置,

    若求出现的最前位置{

    往后排名找,若有height>答案串长度,

    可更新试探解,否则Break,这就必定有一个字符不等了

    }HDU5008

    ④(个人理解):后缀数组的sa[i-1]的后缀和sa[i]的后缀在另外一种含义上是:最相似的子串,相邻两个串相似度不够,之后的就更不行了,这种思想可以用来解释技巧2中分组的原因。

  • 相关阅读:
    Conda 中安装 Keras
    Clean Docker :
    Conservation Vs Non-conservation Forms of conservation Equations
    C语言之预处理命令
    const指针用法总结
    C语言中的小启发(陆续更新。。。)
    左值与右值
    计算的次序
    C语言中的符号重载
    C语言之switch语句详解
  • 原文地址:https://www.cnblogs.com/zzmmm/p/6919137.html
Copyright © 2011-2022 走看看