zoukankan      html  css  js  c++  java
  • LeetCode 10. 正则表达式匹配 | Python

    10. 正则表达式匹配


    题目来源:https://leetcode-cn.com/problems/regular-expression-matching

    题目


    给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

    '.' 匹配任意单个字符
    '*' 匹配零个或多个前面的那一个元素
    所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

    说明:

    • s 可能为空,且只包含从 a-z 的小写字母。
    • p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。

    示例 1:

    输入:
    s = "aa"
    p = "a"
    输出: false
    解释: "a" 无法匹配 "aa" 整个字符串。
    

    示例 2:

    输入:
    s = "aa"
    p = "a*"
    输出: true
    解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
    

    示例 3:

    输入:
    s = "ab"
    p = ".*"
    输出: true
    解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
    

    示例 4:

    输入:
    s = "aab"
    p = "c*a*b"
    输出: true
    解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
    

    示例 5:

    输入:
    s = "mississippi"
    p = "mis*is*p*."
    输出: false
    

    解题思路


    暴力解

    先从【暴力解】的角度理清问题。

    这个题目中,难点就在于处理 .* 两个符号。

    如果只是要求检查两个普通字符是否匹配。那么通过直接遍历,检查每个数组对应的元素是否相同来判断是否匹配即可。例如:

    def isMatch(s, p):
        if len(s) != len(p):
            return False
        for i in range(p):
            if s[i] != p[i]:
                return False
        return True
    

    那代码大概就会是这样。那我们用递归的形式来书写,以下为伪代码:

    def isMatch(s, p):
        """
        s: text
        p: pattern
        """
        if p is empty:
            return s is empty
        first_match = (s not empty) and p[0] == s[0]
        return first_match and isMatch(s[1:], p[1:])
    

    在上面的代码中,其实就是通过先判断前面的元素是否匹配,逐层往下判断后面的元素是否也匹配,从而来找到答案。

    现在来处理两个符号的问题,. 这个符号,表示的是匹配处换行符以外的任意字符(这里就不展开说明了,若需详细了解,可直接上网搜索)。

    了解这个符号的含义后,这里所能表达的意义,也会相应的改变,即是说,当 p 中出现 . 号,s 对应的元素无论是什么字符(题目说明 s 仅包含 a-z 字符)都能够匹配,现在根据上面的伪代码进行修改:

    def isMatch(s, p):
        """
        s: text
        p: pattern
        """
        if not p:
            return not s
        first_match = bool(s) and p[0] in {s[0], '.'}
        return first_match and isMatch(s[1:], p[1:])
    

    这里唯一不同的就是 first_match 这部分的判断中,因为 p 中的元素可能出现固定字符,或者 . 号,所以当 p 出现的字符与 s 中对应的字符相同,或者 p 此处是 . 字符,这里两者都表示能够匹配。

    那么现在往下看 * 符号,这个符号表示的含义是重复零次或多次。那么这里最明显的字符就是重复多少次的问题?在这里考虑使用递归的方式书写,假设重复 n 次,其实这里先不需要考虑 n 是多少,把这个交给递归实现。要考虑那么当下的情况,这里应该就只有两个选择,要么是匹配 0 次,要么是匹配 1 次。

    那么相应的代码就应该修改为(这里书写发现 * 的情况):

    # 这里表示发现 `*` 的情况下,
    if len(p) >= 2 and p[1] == '*':
        # 这里需要考虑匹配 0 次的问题,例如 aa,c*aa
        # 也要考虑匹配多次的问题,例如 aa, a*
        return isMatch(s, p[2:]) or first_match and isMatch(s[1:], p)
    

    在这段代码当中,isMatch(s, p[2:]) 这里表示,字符匹配 0 次,跳过 p 中字符与 * 结合这部分。后面的表示,p[0] 和 s[0] 匹配之后,继续判断 s 接下来的元素。其中保留 p,只向后移动 s,是为了实现 * 匹配多次的功能。

    这样来看,其实已经可以说理清两个符号的具体实现方式。

    关于完整的代码请查看【代码实现】部分。

    动态规划

    思路:动态规划

    在上面暴力解的方法中,频繁使用切片操作,复杂度高。这里在暴力解的基础上,使用动态规划的方法,定义变量 i,j 来记录当前匹配到的位置,用 dp(i, j) 表示 s[i:] 和 p[j:] 是否能够匹配。,避免频繁切片。这里也引入备忘录的概念,用来避免重复的运算。

    具体代码同样请查看【代码实现】部分。

    代码实现


    暴力解 | 代码实现
    class Solution:
        def isMatch(self, s: str, p: str) -> bool:
            if not p:
                return not s
    
            first_match = bool(s) and p[0] in {s[0], '.'}
    
            if len(p) >= 2 and p[1]=="*":
                return self.isMatch(s, p[2:]) or first_match and self.isMatch(s[1:], p)
            else:
                return first_match and self.isMatch(s[1:], p[1:])
    
    动态规划 | 代码实现
    class Solution:
        def isMatch(self, s: str, p: str) -> bool:
            memo = {}
            def dp(i, j):
                if (i, j) not in memo:
                    if j == len(p):
                        return i == len(s)
    
                    else:
                        first_match = i < len(s) and p[j] in {s[i], '.'}
                        if j + 1 < len(p) and p[j+1] == '*':
                            ans = dp(i, j+2) or first_match and dp(i+1, j)
                        else:
                            ans = first_match and dp(i+1, j+1)
    
                    memo[(i, j)] = ans
    
                return memo[(i, j)]
    
            return dp(0, 0)
    
    
    

    实现结果


    暴力解 | 实现结果

    暴力解 | 实现结果

    动态规划 | 实现结果

    动态规划 | 实现结果


    以上就是使用暴力解的形式,理清题目的难点,进而使用动态规划加备忘录的形式来进一步降低复杂度,更高效的解决《10. 正则表达式匹配》问题的主要内容。


    欢迎关注微信公众号《书所集录》

  • 相关阅读:
    linux中mysql表名默认区分大小写导致表找不到的问题
    将hive的hql执行结果保存到变量中
    excel导出功能优化
    shell中执行hive命令错误:delimited by end-of-file (wanted `EOF')
    javascript中全局变量的定义
    datagrid中reoload提交时如何批量提交表单中的查询条件
    Linux下查看文件和文件夹大小
    Linux 时间修改--date -s命令
    Unicode字符集,各个语言的区间
    js实现可兼容IE、FF、Chrome、Opera及Safari的音乐播放器
  • 原文地址:https://www.cnblogs.com/yiluolion/p/12819347.html
Copyright © 2011-2022 走看看