zoukankan      html  css  js  c++  java
  • 使用Manacher算法解决最长回文子串问题

    要解决的问题

    求一个字符串最长回文子串是什么。且时间复杂度 O(N)

    具体描述可参考:

    LeetCode_5_最长回文子串

    LintCode_200_最长回文子串

    暴力解法

    以每个字符为中心向左右两边扩,直到扩不动为止,记录下每个字符对应能扩的范围大小。因为有每个位置左右两边能扩的最大范围,我们可以很方便还原出最长回文子串是什么。

    比如:AB1234321CD 这个字符串,以4字符为中心向左右两边能扩的位置最大,1234321 为最长回文子串。

    如上解法有个问题,即针对类似1ABBA2这样的字符串,如上算法会错过最长回文子串ABBA, 因为ABBA不是以任何一个字符串向左右两边扩散得到的。所以,需要预处理一下原始字符串,预处理的方式如下:

    在字符串的每两个位置之间插入一个特殊字符,变成一个预处理后的字符串,比如我们可以以#作为特殊字符(特殊字符选哪个无所谓,不必非要是原始串中不含有的字符),将1ABBA2这个字符串预处理成1#A#B#B#A#2,用预处理串来跑这个暴力解法,会得到#A#B#B#A#这个是预处理串的最长回文子串,我们可以很方便把这个串还原成原始串的最长回文子串。

    暴力解法时间复杂度为O(N^2)

    暴力方法的示例代码如下:

    public class LeetCode_0005_LongestPalindromicSubstring {
        // 暴力解法
        public static String longestPalindrome1(String s) {
            if (s.length() == 1) {
                return s;
            }
            char[] str = s.toCharArray();
            char[] mStr = manacherStr(str);
            int max = 1; // 最大回文长度至少是1
            int lM = 0; // 记录最长回文的左边界的上一个位置
            int rM = 0; // 记录最长回文的有边界的下一个位置
            for (int i = 1; i < mStr.length; i++) {
                int curMax = 1; // 当前的最大回文长度至少是1
                int l = i - 1;
                int r = i + 1;
                while (l >= 0 && r < mStr.length) {
                    if (mStr[l] == mStr[r]) {
                        // 暴力扩充
                        l--;
                        r++;
                    } else {
                        break;
                    }
                }
                curMax = r - l - 1;
                if (curMax > max) {
                    // 当前最长回文长度已经超过了max了
                    // 更新中心值
                    // 更新max值
                    max = curMax;
                    lM = l;
                    rM = r;
                }
            }
            StringBuilder sb = new StringBuilder();
            for (int i = lM + 2; i < rM; i += 2) {
                sb.append(mStr[i]);
            }
            return sb.toString();
        }
    
        public static char[] manacherStr(char[] str) {
            final char c = '#';
            char[] mStr = new char[(str.length << 1) | 1];
            mStr[0] = c;
            mStr[1] = str[0];
            int index = 1;
            for (int i = 2; i < mStr.length; i++) {
                if ((i & 1) != 1) {
                    mStr[i] = c;
                } else {
                    mStr[i] = str[index++];
                }
            }
            return mStr;
        }
    }
    

    Manacher算法

    Manacher算法可以用O(N)时间复杂度解决这个问题。同样的,Manacher算法也需要对原始字符串进行上述的预处理过程。

    相关变量说明

    pArr

    一个整型数组,长度和预处理串一样,存每个位置的最长回文半径是多少。

    比如#A#B#B#A#这个字符串,

    位于数组2号位置的A的回文半径是A#或者#A, 长度为2,则pArr[2] = 2

    位于数组4号位置的#的回文半径是#B#A#或者#A#B#, 长度为5, 则pArr[4] = 5

    其他位置以此类推。

    通过pArr的定义,我们显然可以得到如下结论

    pArr[0] = 1

    i

    整型,当前遍历到的位置,因为pArr[0]=1, 所以i可以从1开始遍历。

    r

    整型,回文最右边界,只要某个位置能扩到超过这个位置,就更新r这个值,初始值为0,因为一个字符串回文字符串至少是1,可以以第0个字符为中心且以0为最右边界(即:第0个字符本身作为一个回文串)

    c

    整型,就是扩到r位置的的中心点,即pArr[c] = r - c + 1,初始值为0,与r的初始值定为0一样的考虑。

    流程

    考虑i, r, c三个变量之间的位置关系,无非有以下两种情况

    情况1. ir外,比如初始状态下:i=1, r,c = 0

    情况2. ir内或者i==r

    关于情况1,流程如暴力解法一样,以i位置为中心,左右两边扩到不能再扩的位置,更新pArr[i],c, r的值。

    关于情况2,我们假设i'i关于c对称的点,r'r关于c对称的点,示例图如下:

    image

    细分如下几种情况:

    情况2-1

    i'自己的回文区域都在[r'...r]内。

    例如下图中[6...10]i'的最长回文区域,左边界并未超过r'

    image

    由此可以推出,由于i位置和i'位置是关于c位置对称的,则i位置的回文区域至少包括[14...19]这一段,如下图

    image

    pArr[i']至少等于pArr[i],接下来考虑i能否继续扩散,即考虑19位置的值是否等于13位置的值,

    我们可以假设19位置的值和13位置的值相等,同时,有如下两个显而易见的结论

    1. 19位置的值等于5位置的值。

    2. 13位置的值等于11位置的值。

    推出5位置的值和11位置的值相等,那么由于我们前面假设i'只能扩散到最左6位置以及最右10位置,所以,推出的结论和我们的假设矛盾,所以,19位置的值不等于13位置的值

    所以情况2-1的结论是:i的最长回文区域长度和i'的答案一样, 即:pArr[i'] = pArr[i]

    情况2-2

    i'自己的回文区域在[r'...r]

    如下图

    image

    其中[2...14]范围是以i'为中心的最长回文区域。

    在情况2-2下,我们可以得到如下几个结论:

    1. 根据ii'的关系,以i为中心,从[13...19]至少是回文的。

    2. 根据i'的回文区域,12位置的值等于4位置的值,以c为中心,4位置的值又等于20位置的值,所以12位置的值等于20位置的值,即以i为中心,最长回文区域还可以扩展到[12...20]

    3. 根据i'的回文区域,13位置的值等于3位置的值,以c为中心,13位置的值又等于11位置的值,3位置的值等于21位置上的值,所以11位置的值等于21位置的值,即以i为中心,最长回文区域还可以扩展到[11...21]

    4. 继续判断以i为中心,是否可以继续扩散,即要继续判断10位置的值是否等于22位置的值,我们假设10位置的值等于22位置的值,以c为中心,10位置的值等于14位置的值,以i'为中心,14位置的值等于2位置的值,所以10位置的值等于2位置的值,根据我们的假设,2位置的值会等于22位置的值。这个与我们的前提矛盾了,因为我们的前提是c只能扩展到[3...21]这个区域,即:2位置的值不可能等于22位置的值,所以我们的假设不成立,所以10位置的值不等于22位置的值。

    所以,情况2-2的结论是:ir的距离就是i的回文半径,即:pArr[i] = r - i + 1

    情况2-3

    i'自己的回文区域左边界和r'压线

    如下图

    image

    其中[3...13]区域为以i'为中心能扩的最大回文区域。

    有了情况2-2的铺垫,i在情况2-3条件下至少可以扩充的范围是[11...21], 但是接下来是否可以继续扩充,还需要逐个判断。

    自此,所有情况考虑完毕。

    由于i在遍历过程中,始终不回退,所以,Manacher算法时间复杂度O(N)

    完整代码

    public class LeetCode_0005_LongestPalindromicSubstring {
        
        public static String longestPalindrome(String s) {
            if (s == null || s.length() <= 1) {
                return s;
            }
            char[] str = s.toCharArray();
            char[] strs = manacherStr(str);
            int[] pArr = new int[strs.length];
            int c = 0;
            int r = 0;
            int i = 1;
            int len = strs.length;
            int max = 1;
            while (i < len) {
                // pArr[i] 至少不需要扩的大小
                pArr[i] = i < r ? Math.min(r - i, pArr[c - (i - c)]) : 1;
                // 暴力扩
                while (i + pArr[i] < len && i - pArr[i] >= 0) {
                    if (strs[i + pArr[i]] == strs[i - pArr[i]]) {
                        pArr[i]++;
                    } else {
                        break;
                    }
                }
                // 扩散的位置能否更新回文有边界R
                // 如果可以更新,则更新R,且把C置于当前的i,因为是当前的i让回文右边界扩散的
                if (i + pArr[i] > r) {
                    r = i + pArr[i];
                    c = i;
                }
                max = Math.max(pArr[i++], max);
            }
    
            // 定位最大回文有边界的回文中心是哪个
            int n = 0;
            for (; n < len; n++) {
                if (pArr[n] == max) {
                    break;
                }
            }
    
            // 构造最大回文子串
            StringBuilder sb = new StringBuilder();
            for (i = n - max + 2; i < n + max; i += 2) {
                sb.append(strs[i]);
            }
            return sb.toString();
        }
    
        public static char[] manacherStr(char[] str) {
            char[] strs = new char[str.length << 1 | 1];
            for (int i = 0; i < strs.length; i++) {
                strs[i] = ((i & 1) == 1) ? str[i >> 1] : '#';
            }
            return strs;
        }
    }
    

    相关习题

    LeetCode_0005_LongestPalindromicSubstring

    LintCode_0200_LongestPalindromicSubstring

    LeetCode_0647_PalindromicSubstrings

    LeetCode_0214_ShortestPalindrome

    更多

    算法和数据结构笔记

    参考资料

  • 相关阅读:
    JS 缓冲运动 带运动的留言本 小案例
    ===>===>===>特色思TERSUS元件学习整理
    TERSUS无代码开发(笔记29)-分页(转载)
    TERSUS无代码开发(笔记28)-英文日期改成中文日期设置
    TERSUS无代码开发(笔记27)-按钮加图标
    TERSUS无代码开发(笔记26)-复杂表格中字体通过逻辑设置颜色
    TERSUS无代码开发(笔记25)-弹窗的样式设置
    TERSUS无代码开发(笔记24)-排序显示和高级查询
    TERSUS无代码开发(笔记23)-数据库字段设置
    TERSUS无代码开发(笔记22)-利用CSS制作一个悬浮子菜单(转载)
  • 原文地址:https://www.cnblogs.com/greyzeng/p/15314213.html
Copyright © 2011-2022 走看看