zoukankan      html  css  js  c++  java
  • Leetcode 010 正则表达式匹配(剑指 Offer 19.)

    地址  https://leetcode-cn.com/problems/regular-expression-matching/

    作为算法问题实战策略 WILDCARD 的拓展 把leetcode的这题也解决掉了

    这题是leetcode开头的第一道新人劝退题

    给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。
    
    '.' 匹配任意单个字符
    '*' 匹配零个或多个前面的那一个元素
    所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
    
    说明:
    
    s 可能为空,且只包含从 a-z 的小写字母。
    p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
    示例 1:
    
    输入:
    s = "aa"
    p = "a"
    输出: false
    解释: "a" 无法匹配 "aa" 整个字符串。
    示例 2:
    
    输入:
    s = "aa"
    p = "a*"
    输出: true
    解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
    示例 3:
    
    输入:
    s = "ab"
    p = ".*"
    输出: true
    解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
    示例 4:
    
    输入:
    s = "aab"
    p = "c*a*b"
    输出: true
    解释: 因为 '*' 表示零个或多个,这里 'c'0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
    示例 5:
    
    输入:
    s = "mississippi"
    p = "mis*is*p*."
    输出: false

    解答

    问题的是确认*作为替代字符 会提到什么字符会替代几次

    暴力遍历可以模拟* 提到0次到n次的各种尝试 然后递归求解。显然时间和空间的压力很大

    所以我们可以采用动态规划

    dp[i][j] 表示 字符串p 1~i的字符子串能成功匹配 字符串s1~j的字符子串

    dp[i][j]能否成功匹配 取决于dp[i]-1[j-1]是否匹配成功 且 p[i]是否等于s[j].当然 如果p[i]=='.' 就肯定等于s[j]

    p[i]=='*'的情况就需要考虑*重复0到n次的情况,由于动规是逐层递进,且成功匹配具有传递性。

    也就是dp[i][j] = dp[i][j-1]=dp[i][j-2]....... 一旦任意一个dp[i][j-x]=1  dp[i][j]就=1 

    所以状态方程只需要解决 '*'代替重复字母为0次和1次的情况就可以解决'*'重复0到n次的情况

     假设 p[i] == '*' 在'*'重复0次的情况下 dp[i][j] = dp[i-2][j]; 

    如图 p字符串 z* 重复了0次  整个字符串相等与否 取决于  s[1~j] 与 p[1~(i-2)] 是否匹配

    2 假设p[i] == '*' 重复1次dp[i][j] = dp[i-2][j-1]

    如图 p字符串中  b*重复1次是否匹配取决于b*重复0次的情况

    代码如下

    考虑到字符串是以0开始 dp还需要考虑空字符串的比较 那么最好添加一层空层 处理就可以从索引1开始 比较便于调试和理解

    class Solution {
    public:
        
    int dp[1100][1100];
    
    bool isMatch(string s, string p) {
        s = " " + s;
        p = " " + p;
    
        dp[0][0] = 1;
    
        for (int i = 1; i < p.size(); i++) {
            if (p[i] == '*') dp[i][0] = dp[i-2][0];
            for (int j = 1; j < s.size(); j++) {
                if (p[i] == '.') {
                    dp[i][j] = dp[i - 1][j - 1];
                }
                else if (p[i] == s[j]) {
                    dp[i][j] = dp[i - 1][j - 1];
                }else if (p[i] == '*') {
                    dp[i][j] |= dp[i-2][j];
                    if(p[i-1] == '.' || p[i-1] == s[j])
                        dp[i][j] |=  dp[i][j-1];
                }
            }
        }
    
        return dp[p.size()-1][s.size()-1];
    }
    
        
    };

    //==================================================================

    // 20201217

    //朴素的逐步缩小字符串的想法

    class Solution {
    public:
    
        bool isMatch_emptyS(string s, string p) {
            if (p.empty() && s.empty()) return true;
            if (p.back() != '*') return false;
    
            if (p.size() >= 2 && p.back() == '*') {
                return isMatch_emptyS(s,p.substr(0,p.size()-2));
            }
            
            return false;
        }
    
    
        bool isMatch(string s, string p) {
            if (p.empty() && s.empty()) return true;
            if (p.empty() && !s.empty()) return false;
    
            // s = ""  p = "a*" ".*"  或者其他不符合情况 p="xaas"
            if (s.empty()) {
                return isMatch_emptyS(s,p);
            }
            int psize = p.size() - 1; int ssize = s.size() - 1;
            // s="x" p="." ||  p ="x"
            if (p.back() != '*' && (p.back() == s.back() || p.back() == '.')) {
                return isMatch(s.substr(0,ssize), p.substr(0,psize));
            }
    
            bool ret = false;
    
    
            if (ret == false && p.back() == '*' && p.size() >= 2) {
                //s="abcxx"  p="abcx*"  || p="abc.*"
                if (p[psize - 1] == s[ssize] || p[psize - 1] =='.') {
                    ret = isMatch(s.substr(0, ssize ), p);
                }
    
                //s="abcx"  p="abcxx*"  || p="abcx.*"
                if (ret ==false && (p[psize - 1] == s[ssize] || p[psize - 1] == '.')) {
                    ret = isMatch(s, p.substr(0, psize - 1));
                }
            }
    
            if (false == ret && p.back() == '*' && p.size() >= 3 && s.size() >= 1) {
                //s = "abcx" p ="abcxz*"  p = "abc.z*"
                if (p[psize - 1] != s[ssize] && (p[psize - 2] == s[ssize] || p[psize - 2] == '.' )) {
                    ret = isMatch(s.substr(0, ssize ), p.substr(0,psize-2));
                }
                //s = "abcx" p ="abcxz*"  p = "abc.z*"
                if (ret ==false && p[psize - 1] != s[ssize]) {
                    ret = isMatch(s, p.substr(0, psize - 1));
                }
            }
    
            return ret;
        }
    };

    可以考虑增加哈希 减少重复检索的操作 增加速度

    dp

    //dp
    class Solution {
    public:
        int dp[100][100];
        bool isMatch(string s, string p) {
            s.insert(s.begin(), '^'); p.insert(p.begin(), '^');
            memset(dp, 0, sizeof(dp[0][0]) * 100 * 100);
            dp[0][0] = 1;
    
            for (int i = 0; i < s.size(); i++) {
                for (int j = 0; j < p.size(); j++) {
              // s[i] = "b" p[j] = "b" || p[j] = "."
    if (p[j] != '*' && (s[i] == p[j] || p[j] == '.') && j >= 1 &&i >= 1 ) { dp[i][j] |= dp[i - 1][j - 1]; } if (p[j] == '*') { if(j >=2){
                  // s[i] = "a" p[j-2...j] = "a.*" || p[j-2..j]="az*" dp[i][j]
    |= dp[i][j - 2]; } if (i >= 1 && j>=1 && (p[j-1] == s[i] || p[j-1] == '.' )) {
                  // s[i] = "aaa" p[j-2...j] = "aa*" || p[j-2..j] = "a.*" dp[i][j]
    |= dp[i - 1][j ]; } } } } return dp[s.size()-1][p.size()-1]; } };
    作 者: itdef
    欢迎转帖 请保持文本完整并注明出处
    技术博客 http://www.cnblogs.com/itdef/
    B站算法视频题解
    https://space.bilibili.com/18508846
    qq 151435887
    gitee https://gitee.com/def/
    欢迎c c++ 算法爱好者 windows驱动爱好者 服务器程序员沟通交流
    如果觉得不错,欢迎点赞,你的鼓励就是我的动力
    阿里打赏 微信打赏
  • 相关阅读:
    四则运算
    自我介绍
    代练第七天
    代练第六天
    代练第五天
    代练第四天
    补充总结
    对软件工程课程的总结
    作业4:结对编程项目四则运算
    psp记录个人项目花费时间
  • 原文地址:https://www.cnblogs.com/itdef/p/13069736.html
Copyright © 2011-2022 走看看