zoukankan      html  css  js  c++  java
  • 算法题之字符串匹配问题

    我最近复习一道困难程度的算法题,发现了许多有趣之处。在借鉴了他人解法后,发现从最简单的情况反推到原题是一种解锁新进阶的感觉。从递归到动态规划,思维上一步一步递进,如同一部跌宕起伏的小说,记录下来和诸君共赏之。

    题目如下:

    给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。
    
    '.' 匹配任意单个字符
    '*' 匹配零个或多个前面的那一个元素
    所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
    
    说明:
    
    s 可能为空,且只包含从 a-z 的小写字母。
    p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
    示例 1:
    
    输入:
    s = "aa"
    p = "a"
    输出: false
    解释: "a" 无法匹配 "aa" 整个字符串。
    示例 2:
    
    输入:
    s = "aa"
    p = "a*"
    输出: true
    解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
    示例 3:
    
    输入:
    s = "ab"
    p = ".*"
    输出: true
    解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
    示例 4:
    
    输入:
    s = "aab"
    p = "c*a*b"
    输出: true
    解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
    示例 5:
    
    输入:
    s = "mississippi"
    p = "mis*is*p*."
    输出: false
    
    来源:力扣(LeetCode)
    

    这是一道关于字符串匹配的问题,其中匹配字符串里面可能含有两种特殊符号「.」和「*」。

    说时候刚拿到这道题的时候我很懵逼,直接动手分析到带有「*」符号的时候,感觉不同情况挺难分析下去的,甚至陷入了思维的僵局。

    如果能让问题简化一下该多好呀,没错,如果我们把问题变成我们以前做过的问题或者容易做的问题,是否能从中发现新的思路?

    假设问题变成:求两个纯字符串进行匹配。实现代码可以如下:

    package main
    
    func isMatch(text string, pattern string) bool {
    	if pattern == "" {
    		if text != "" {
    			return false
    		} else {
    			return true
    		}
    	}
    	first_match := false
    
    	if pattern[0] == text[0] {
    		first_match = true
    	}
    
    	return first_match && isMatch(text[1:], pattern[1:])
    }
    
    func main() {
    	text := "abc"
    	pattern := "ab"
    	isMatch(text, pattern)
    }
    

    这里用到了递归,之所以这么处理,是为了后续迭代。
    那么如果再增加一个条件,把「.」符号加上,如果是带有「.」符号的字符串去匹配一段字符串呢?

    需要在实现的时候考虑第一个字节是否是该特殊符号

    func isMatch2(text string, pattern string) bool {
    	if pattern == "" {
    		if text != "" {
    			return false
    		} else {
    			return true
    		}
    	}
    	first_match := false
    
    	if pattern[0] == text[0] || pattern[0] == '.' {
    		first_match = true
    	}
    	return first_match && isMatch2(text[1:], pattern[1:])
    }
    
    

    能解决「.」符号的情况,针对「*」符号的情况,我们可以进一步思考。
    可能性:

    • 1.匹配0次。
    • 2.匹配1次。
      具体代码如下:
    func isMatch(text string, pattern string) bool {
        if pattern == "" {
    		if text != "" {
    			return false
    		} else {
    			return true
    		}
    	}
    	first_match := false
    	
        text_bool := false
    	if text != "" {
    	    text_bool = true
    	}
    	
    	if text_bool && (pattern[0] == text[0] || pattern[0] == '.') {
    		first_match = true
    	}
    	
    	if len(pattern) >=2 && pattern[1] == '*' {
    	    return isMatch(text, pattern[2:]) || first_match && isMatch(text[1:], pattern)
    	} else {
            return first_match && isMatch(text[1:], pattern[1:])
        }
    }
    
    

    这段代码都是用递归实现的,但是递归的时间复杂度消耗更大,完全可以考虑将每一次递归的结果保存下来,于是我们又可以往动态规划的方向思考。
    选择dp保存结果,dp[i][j]表示前i个字符串被j个字节pattern匹配的结果。

    func isMatch(s string, p string) bool {
    	memory := make(map[string]bool)
    	return dp(0, 0, memory, s, p)
    
    }
    
    func dp(i int, j int, memory map[string]bool, s string, p string) bool {
    	iToStr := strconv.Itoa(i)
    	jToStr := strconv.Itoa(j)
    	keyStr := iToStr + "," + jToStr
    	if _, ok := memory[keyStr]; ok {
    		return memory[keyStr]
    	}
    	if j == len(p) {
    		return i == len(s)
    	}
    
    	first := (i < len(s)) && (p[j] == s[i] || p[j] == '.')
    	var ans bool
    	if j <= (len(p) -2) && p[j+1] == '*' {
    		ans = dp(i, j+2, memory,s, p) || first && dp(i+1, j, memory, s, p)
    	} else {
    		ans = first && dp(i+1, j+1, memory, s, p)
    	}
    	memory[keyStr] = ans
    	return ans
    }
    

    反思:还有无更好的解法呢?比如把循环放到外层,而不是封装成dp函数?

  • 相关阅读:
    Redis之使用python脚本监控队列长度
    ELK之filebate收集日志传递至Logstash
    [转] SOLID五大设计原则
    [转] 面向对象原则之GOF是招式,九大原则才是精髓
    [转] (CQRS)命令和查询责任分离架构模式(一) 之 什么是CQRS
    [0] 四色原型
    [0] C#软件项目版本号的命名规则及格式介绍
    [0] AssemblyInfo.cs文件介绍
    [0] 服务器 TCP 提供程序无法在 [ 'any' <ipv4> *] 上侦听。TCP 端口已在使用中。
    [0] C#异常种类
  • 原文地址:https://www.cnblogs.com/freephp/p/12113150.html
Copyright © 2011-2022 走看看