zoukankan      html  css  js  c++  java
  • O(n)回文子串算法

    如何在O(n)时间内处理字符串以每个位置为中心的最长回文。这里转载一个Manacher算法的论文翻译。
    原文地址:
    http://zhuhongcheng.wordpress.com/2009/08/02/a-simple-linear-time-algorithm-for-finding-longest-palindrome-sub-string/
        其实原文说得是比较清楚的,只是英文的,我这里写一份中文的吧。
        首先:大家都知道什么叫回文串吧,这个算法要解决的就是一个字符串中最长的回文子串有多长。这个算法可以在O(n)的时间复杂度内既线性时间复杂度的情况下,求出以每个字符为中心的最长回文有多长,
        这个算法有一个很巧妙的地方,它把奇数的回文串和偶数的回文串统一起来考虑了。这一点一直是在做回文串问题中时比较烦的地方。这个算法还有一个很好的地方就是充分利用了字符匹配的特殊性,避免了大量不必要的重复匹配。
        算法大致过程是这样。先在每两个相邻字符中间插入一个分隔符,当然这个分隔符要在原串中没有出现过。一般可以用‘#’分隔。这样就非常巧妙的将奇数长度 回文串与偶数长度回文串统一起来考虑了(见下面的一个例子,回文串长度全为奇数了),然后用一个辅助数组P记录以每个字符为中心的最长回文串的信息。 P[id]记录的是以字符str[id]为中心的最长回文串,当以str[id]为第一个字符,这个最长回文串向右延伸了P[id]个字符。
        原串:    w aa bwsw f d
        新串:   # w # a # a # b # w # s # w # f # d #
    辅助数组P:  1 2 1 2 3 2 1 2 1 2 1 4 1 2 1 2 1 2 1
        这里有一个很好的性质,P[id]-1就是该回文子串在原串中的长度(包括‘#’)。如果这里不是特别清楚,可以自己拿出纸来画一画,自己体会体会。当然这里可能每个人写法不尽相同,不过我想大致思路应该是一样的吧。
        好,我们继续。现在的关键问题就在于怎么在O(n)时间复杂度内求出P数组了。只要把这个P数组求出来,最长回文子串就可以直接扫一遍得出来了。
        由于这个算法是线性从前往后扫的。那么当我们准备求P[i]的时候,i以前的P[j]我们是已经得到了的。我们用mx记在i之前的回文串中,延伸至最右 端的位置。同时用id这个变量记下取得这个最优mx时的id值。(注:为了防止字符比较的时候越界,我在这个加了‘#’的字符串之前还加了另一个特殊字符 ‘$’,故我的新串下标是从1开始的)
    好,到这里,我们可以先贴一份代码了。
    复制代码void pk()
    {
        int i;
        int mx = 0;
        int id;
        for(i=1; i<n; i++)
        {
            if( mx > i )
                p[i] = MIN( p[2*id-i], mx-i );        
            else
                p[i] = 1;
            for(; str[i+p[i]] == str[i-p[i]]; p[i]++)
                ;
            if( p[i] + i > mx )
            {
                mx = p[i] + i;
                id = i;
            }
        }
    }
     


        代码是不是很短啊,而且相当好写。很方便吧,还记得我上面说的这个算法避免了很多不必要的重复匹配吧。这是什么意思呢,其实这就是一句代码。


    if( mx > i )
        p[i] = MIN( p[2*id-i], mx-i );


    就是当前面比较的最远长度mx>i的时候,P[i]有一个最小值。这个算法的核心思想就在这里,为什么P数组满足这样一个性质呢?
       (下面的部分为图片形式)




    以上都是翻译部分,这里在贴一个poj3974的AC代码,果然是瞬秒啊。
    #include <cstdio>
    #include <algorithm>
    #include <cstring>
    #include <iostream>
    using namespace std;
    const int MAXN=1000010;
    char str[MAXN],s[MAXN*2];
    int n,p[MAXN*2],ans,cases=1;
    void rebuild()
    {
        s[0]='$',s[1]='#';
        n=strlen(str);
        for(int i=0;i<n;++i)
        s[2*i+2]=str[i],s[2*i+3]='#';
        s[n=n*2+2]=0;
    }
    void solve()
    {
        int mx=0,id,ans=1;
        for(int i=0;i<n;++i)
        {
            if(mx>i)p[i]=min(p[2*id-i],mx-i);
            else p[i]=1;
            for(;s[i-p[i]]==s[i+p[i]];p[i]++);
            if(p[i]+i>mx)mx=p[i]+i,id=i;
            ans=max(ans,p[i]);
        }
        printf("Case %d: %d\n",cases++,ans-1);
    }
    int main()
    {
        while(scanf("%s",str),str[0]-'E')
        {
            rebuild();
            solve();
        }
        return 0;
    }



    --
    搜索,动态规划,图论,网络流,数论,博弈论,大模拟,数据结构,NP-HARD
    全部是浮云-----除了计算几何

    ※ 修改:·rainy 于 Jul 23 21:32:56 2011 修改本文·[FROM: 2001:da8:a800:2046:880:670:c2b0:8124]
    ※ 来源:·BBS 碧海青天站 http://bbs.dlut.edu.cn·[FROM: 2001:da8:a800:2046:880:670:c2b0:8124]

    附件: 这里,我介绍一下O(n)回文串处.txt (3410 字节)

    O(n)回文子串算法此主题相关图片如下:8_56_4f13d6e009ae79e.png (88KB)
    O(n)回文子串算法

  • 相关阅读:
    杨老师课堂_VBA学习教程之一键合并所有文件
    无题
    杨老师课堂_VBA学习教程之VBA中使用函数
    杨老师课堂_Java核心技术下之控制台模拟文件管理器案例
    杨老师课堂之JavaScript定时器_农夫山泉限时秒杀案例
    交换机级联,堆叠,集群技术介绍
    IP划分
    光纤
    交换机
    URL中“#” “?” &“”号的作用
  • 原文地址:https://www.cnblogs.com/waka401/p/2627352.html
Copyright © 2011-2022 走看看