zoukankan html css js c++ java

Leetcode 010 正则表达式匹配(剑指 Offer 19.)

地址 https://leetcode-cn.com/problems/regular-expression-matching/

作为算法问题实战策略 WILDCARD 的拓展把leetcode的这题也解决掉了

这题是leetcode开头的第一道新人劝退题

给你一个字符串 s 和一个字符规律 p，请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配，是要涵盖 整个 字符串 s的，而不是部分字符串。

说明:

s 可能为空，且只包含从 a-z 的小写字母。
p 可能为空，且只包含从 a-z 的小写字母，以及字符 . 和 *。
示例 1:

输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:

输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此，字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:

输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个（'*'）任意字符（'.'）。
示例 4:

输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个，这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:

输入:
s = "mississippi"
p = "mis*is*p*."
输出: false

解答

问题的是确认*作为替代字符会提到什么字符会替代几次

暴力遍历可以模拟* 提到0次到n次的各种尝试然后递归求解。显然时间和空间的压力很大

所以我们可以采用动态规划

dp[i][j] 表示字符串p 1~i的字符子串能成功匹配字符串s1~j的字符子串

dp[i][j]能否成功匹配取决于dp[i]-1[j-1]是否匹配成功且 p[i]是否等于s[j].当然如果p[i]=='.' 就肯定等于s[j]

p[i]=='*'的情况就需要考虑*重复0到n次的情况，由于动规是逐层递进，且成功匹配具有传递性。

也就是dp[i][j] = dp[i][j-1]=dp[i][j-2]....... 一旦任意一个dp[i][j-x]=1 dp[i][j]就=1

所以状态方程只需要解决 '*'代替重复字母为0次和1次的情况就可以解决'*'重复0到n次的情况

1 假设 p[i] == '*' 在'*'重复0次的情况下 dp[i][j] = dp[i-2][j];

如图 p字符串 z* 重复了0次整个字符串相等与否取决于 s[1~j] 与 p[1~(i-2)] 是否匹配

2 假设p[i] == '*' 重复1次dp[i][j] = dp[i-2][j-1]

如图 p字符串中 b*重复1次是否匹配取决于b*重复0次的情况

代码如下

考虑到字符串是以0开始 dp还需要考虑空字符串的比较那么最好添加一层空层处理就可以从索引1开始比较便于调试和理解

class Solution {
public:
    
int dp[1100][1100];

bool isMatch(string s, string p) {
    s = " " + s;
    p = " " + p;

    dp[0][0] = 1;

    for (int i = 1; i < p.size(); i++) {
        if (p[i] == '*') dp[i][0] = dp[i-2][0];
        for (int j = 1; j < s.size(); j++) {
            if (p[i] == '.') {
                dp[i][j] = dp[i - 1][j - 1];
            }
            else if (p[i] == s[j]) {
                dp[i][j] = dp[i - 1][j - 1];
            }else if (p[i] == '*') {
                dp[i][j] |= dp[i-2][j];
                if(p[i-1] == '.' || p[i-1] == s[j])
                    dp[i][j] |=  dp[i][j-1];
            }
        }
    }

    return dp[p.size()-1][s.size()-1];
}

    
};

//==================================================================

// 20201217

//朴素的逐步缩小字符串的想法

class Solution {
public:

    bool isMatch_emptyS(string s, string p) {
        if (p.empty() && s.empty()) return true;
        if (p.back() != '*') return false;

        if (p.size() >= 2 && p.back() == '*') {
            return isMatch_emptyS(s,p.substr(0,p.size()-2));
        }
        
        return false;
    }


    bool isMatch(string s, string p) {
        if (p.empty() && s.empty()) return true;
        if (p.empty() && !s.empty()) return false;

        // s = ""  p = "a*" ".*"  或者其他不符合情况 p="xaas"
        if (s.empty()) {
            return isMatch_emptyS(s,p);
        }
        int psize = p.size() - 1; int ssize = s.size() - 1;
        // s="x" p="." ||  p ="x"
        if (p.back() != '*' && (p.back() == s.back() || p.back() == '.')) {
            return isMatch(s.substr(0,ssize), p.substr(0,psize));
        }

        bool ret = false;


        if (ret == false && p.back() == '*' && p.size() >= 2) {
            //s="abcxx"  p="abcx*"  || p="abc.*"
            if (p[psize - 1] == s[ssize] || p[psize - 1] =='.') {
                ret = isMatch(s.substr(0, ssize ), p);
            }

            //s="abcx"  p="abcxx*"  || p="abcx.*"
            if (ret ==false && (p[psize - 1] == s[ssize] || p[psize - 1] == '.')) {
                ret = isMatch(s, p.substr(0, psize - 1));
            }
        }

        if (false == ret && p.back() == '*' && p.size() >= 3 && s.size() >= 1) {
            //s = "abcx" p ="abcxz*"  p = "abc.z*"
            if (p[psize - 1] != s[ssize] && (p[psize - 2] == s[ssize] || p[psize - 2] == '.' )) {
                ret = isMatch(s.substr(0, ssize ), p.substr(0,psize-2));
            }
            //s = "abcx" p ="abcxz*"  p = "abc.z*"
            if (ret ==false && p[psize - 1] != s[ssize]) {
                ret = isMatch(s, p.substr(0, psize - 1));
            }
        }

        return ret;
    }
};

可以考虑增加哈希减少重复检索的操作增加速度

//dp
class Solution {
public:
    int dp[100][100];
    bool isMatch(string s, string p) {
        s.insert(s.begin(), '^'); p.insert(p.begin(), '^');
        memset(dp, 0, sizeof(dp[0][0]) * 100 * 100);
        dp[0][0] = 1;

        for (int i = 0; i < s.size(); i++) {
            for (int j = 0; j < p.size(); j++) {
　　　　　　　　　　// s[i] = "b"  p[j] = "b" || p[j] = "."
                if (p[j] != '*' && (s[i] == p[j] || p[j] == '.') && j >= 1  &&i >= 1 ) {
                    dp[i][j] |= dp[i - 1][j - 1];
                }

                if (p[j] == '*') {
                    if(j >=2){
　　　　　　　　　　　　　　// s[i] = "a"  p[j-2...j] = "a.*"  || p[j-2..j]="az*"
                        dp[i][j] |= dp[i][j - 2];
                    }
                    if (i >= 1 &&  j>=1 && (p[j-1] == s[i] || p[j-1] == '.' )) {
　　　　　　　　　　　　　　// s[i] = "aaa"  p[j-2...j] = "aa*" || p[j-2..j] = "a.*" 
                        dp[i][j] |= dp[i - 1][j ];
                    }
                }
            }
        }

        return dp[s.size()-1][p.size()-1];
    }
};

作者: itdef
欢迎转帖请保持文本完整并注明出处
技术博客 http://www.cnblogs.com/itdef/
B站算法视频题解
https://space.bilibili.com/18508846
qq 151435887
gitee https://gitee.com/def/
欢迎c c++ 算法爱好者 windows驱动爱好者服务器程序员沟通交流
如果觉得不错，欢迎点赞，你的鼓励就是我的动力
阿里打赏

查看全文

相关阅读:
jQuery 选择器
 使用JQuery获取对象的几种方式
 多层架构+MVC+EF+AUTOFAC+AUTOMAPPER
ASP.NET 2.0服务器控件开发的基本概念(转载)
系统构架设计应考虑的因素
 超级面试题
 架构的点滴
 程序员的职业素养---转载
 imovie的快速入门
 实用的设计模式【二】——类的组织

原文地址：https://www.cnblogs.com/itdef/p/13069736.html