zoukankan      html  css  js  c++  java
  • [模板]后缀自动机

    原理

    给自动机上的每个点定义两种属性:[min,max]和right集合,这个点表示(长度在[min,max]的、所有出现位置的右端点的集合为right的子串)

    然后可以证明,两个节点的right集合要么不相交,要么互相包含

    于是,让right直接包含(某个点的right)的点作为它的父亲,可以得到一个parent树

    再开一个root点,如果某个点没有被别的点包含,那就把它指向root

    所以就可以只用len(最大长度)和fa(parent树中的父亲)表示某个点

    如果有(在某点p所表示的某一子串后面加上字符x能被点q表示),那么有转移p-x->q

    于是点数和边数都是O(n)的,不会证。

    做法

    考虑在线构造,每次加入一个新字符,设它是x

    记一下上次插的点lst,设增加一个新点p,让他能表示目前的整个字符串

    那么首先有len[p]=len[lst]+1(lst能表示插x前的字符串嘛)

    考虑lst和它的祖先们,把它们按len从大到小排序,可以发现[有x的转移]是单调的,就是说前面一些都没有,后面一些都有

    那我那些没有x转移的点就可以直接加上一个转移x到p

    然后考虑第一个有x转移的点o,设他转移到的点是q

    由于len[p]肯定是比len[q]大的,所以我想试着由p向q连parent边

    然而你直接连的话会发现len可能有些不合要求(考虑aabab,直接把5塞进原来表示aab的right集合(原来是{3})里会导致len变小,aab就表示不了了)

    那么要分两种情况:len[q]==len[o]+1?

    如果相等的话就没有以上的问题,直接连即可

    如果不相等,那我新开一个点nq强行让他相等

    nq的父亲和转移和q都是一样的,但是len会变成len[o]+1

    当然原来的q还要保留,并且让nq作为q的父亲,这时就可以让nq作为p的父亲了

    然后还有原来能转移到q的那些lst的祖先,现在都要改成转移到nq(可以发现这些祖先在刚才排序完以后也是连续的一段)

    另外,如果根本没有有转移x的祖先,那直接让p连向root就可以了

    均摊下来总复杂度大概是O(n)的

     1 inline int insert(int x,int o){
     2     int p=++pct;
     3     len[p]=len[o]+1;
     4     for(;o&&!tr[o][x];o=fa[o]) tr[o][x]=p;
     5     if(!o){fa[p]=rt;return p;}
     6     int q=tr[o][x];
     7     if(len[q]==len[o]+1){fa[p]=q;return p;}
     8     int nq=++pct;
     9     fa[nq]=fa[q],memcpy(tr[nq],tr[q],sizeof(tr[q]));
    10     fa[q]=fa[p]=nq;len[nq]=len[o]+1;
    11     for(;o&&tr[o][x]==q;o=fa[o]) tr[o][x]=nq;
    12     return p;
    13 }

    例题

    以后再补吧

  • 相关阅读:
    SQL Server系统表sysobjects介绍
    tofixed方法 四舍五入
    (function($){})(jQuery);
    DOS批处理命令-字符串操作
    IF ERRORLEVEL 和 IF %ERRORLEVEL% 区别
    Gpupdate命令详解
    DOS批处理中%cd%和%~dp0的区别
    SetACL 使用方法详细参数中文解析
    Lazarus 1.6 增加了新的窗体编辑器——Sparta_DockedFormEditor.ipk
    Lazarus 1.44升级到1.6 UTF8处理发生变化了
  • 原文地址:https://www.cnblogs.com/Ressed/p/10773861.html
Copyright © 2011-2022 走看看