后缀数组 & 后缀自动机

zoukankan html css js c++ java

后缀数组 & 后缀自动机
本篇博文同时也作为 WC2021 Day2 的附文。
目录
后缀数组
定义
构造
后缀自动机
构建 SAM
后缀数组

定义

后缀是什么？(suffix_i = s_{i cdots |s|})。

后缀数组包括 (sa_i, rk_i)。分别表示将 (s) 的所有后缀排序后，排名第 (i) 小的后缀的起始位置，和起始位置在 (i) 上的后缀的排名。

注：这里的“排名”指的是对这些后缀按照字典序排序后的排名。如果现在还不清楚什么是字典序，请自行搜索。

在阅读接下来的内容之前，请务必清楚理解 (sa_i) 和 (rk_i) 的含义，否则会导致接下来的内容理解困难。

为了协助大家理解这两个数组的含义，博主在这里举出一个例子。

这是一个字符串 (S: ext{aabb})

为便于记录，我用一个二元组表示 (S) 的一个后缀极其起始位置，那么这个字符串的后缀所代表的二元组有：

[{left( ext{aabb}, 1 ight), left( ext{abb}, 2 ight), left( ext{bb}, 3 ight), left( ext{b}, 4 ight)} ]
将所有的后缀按照字典序排序，即：

[{left( ext{aabb}, 1 ight), left( ext{abb}, 2 ight), left( ext{b}, 4 ight), left( ext{bb}, 3 ight)} ]
回想之前的定义，(sa_i) 表示的是“排名为 (i) 的后缀的起始位置”。故 (sa) 数组为：({1, 2, 4, 3})，(rk_i) 表示的是 “起始位置为 (i) 的后缀的排名”。故 (rk) 数组为 ({1, 2, 4, 3})

emm 貌似这个例子举的不太好……

构造

倍增法构造 SA

直接找出所有后缀进行排序复杂度显然是 (mathcal Oleft(n^2 ight)) 的，我们需要找到一种更快的方式构造后缀数组。

后缀自动机

构建 SAM

采用“增量法”，利用 (S) 的 SAM 构建出 (S + c) 的 SAM。

其中 (S) 是一个字符串，(c) 是一个字符，(+) 表示连接运算。
查看全文

相关阅读:
《算法导论》第二章入门
 《算法导论》第6章堆排序 (3)K路归并
 斐波那契数列算法分析
 关于程序员成长的一点思考
 《C和指针》读书笔记
 《算法导论》第6章堆排序 (1)最大堆与堆排序
 《算法导论》第6章堆排序 (2)优先级队列
 WWF入门(二)(笔记):winform调用工作流中庸
 mysql or条件可以使用索引而避免全表
 HBase技术介绍

原文地址：https://www.cnblogs.com/zimujun/p/14364135.html

后缀数组 & 后缀自动机

后缀数组

定义

构造

后缀自动机

构建 SAM