zoukankan      html  css  js  c++  java
  • [leetcode]10. Regular Expression Matching正则表达式的匹配

    Given an input string (s) and a pattern (p), implement regular expression matching with support for '.' and '*'.

    '.' Matches any single character.
    '*' Matches zero or more of the preceding element.

    The matching should cover the entire input string (not partial).

    Note:

    • s could be empty and contains only lowercase letters a-z.
    • p could be empty and contains only lowercase letters a-z, and characters like . or *.
    Input:
    s = "aab"
    p = "c*a*b"
    Output: true

    题意:

    '.' any single character.
    '*' 0 or more of the preceding element.
    whether p can match s ? 

    Solution1: DP

    Step1: 初始化, dp[0][0] = true

            初始化, 是否需要预处理第一个row: dp[0][j] ?  发现当S为空,P为'*' 时,P若取0个preceding element就可能变成空,此时两个字符串match。需要预处理。

            初始化, 是否需要预处理第一个col:dp[i][0]? 发现当P为空,S为任意字符时,肯定不match。不需要预处理,因为默认default就是false。

    Step2: 找到转移方程,

    若两个字符串当前的char不同:

    若两个字符串当前的char相同:

    p.charAt(j-1) == s.charAt(i-1) or  p.charAt(j-1) == '.'  则当前字符match, 那么dp[i][j] 的结果可以直接拿dp[i-1][j-1]的取值

    若两个字符串当前的char不同:

    1.  p.charAt(j-1) == '*' 时,先退后两步去check一下T/F。因为 "*" 可以消掉其preceding element,dp[i][j] = dp[i][j-2]  【讨论 '*'代表 0 preceding element 】

    2. p.charAt(j-1) == '*'  且 s.charAt(i-1)  == p.charAt(j-2) || p.charAt(j-2)  == '.' 时 , 则S当前的字符可以看成是 P的

      “ precding element + '*' ” 一部分, 此时可以get rid of S当前的字符, dp[i][j] = dp[i-1][j]   【讨论 '*'代表 1 or more preceding element 】

    code

     1 class Solution {
     2     public boolean isMatch(String s, String p) {
     3         boolean[][] dp = new boolean[s.length() + 1][p.length() + 1]; // size大小
     4         dp[0][0] = true;
     5         for(int j = 1; j<=p.length(); j++){
     6              if(p.charAt(j-1) == '*') {
     7                  dp[0][j] = dp[0][j-2] ; 
     8              }
     9         }
    10         
    11         for(int i = 1; i<=s.length(); i++){
    12             for(int j = 1; j<=p.length(); j++){
    13                 if( p.charAt(j-1) == s.charAt(i-1) ||  p.charAt(j-1) == '.' ) {
    14                      dp[i][j] = dp[i-1][j-1];
    15                 }else {
    16                      if( p.charAt(j-1) == '*') {
    17                          dp[i][j] = dp[i][j-2] ; 
    18                          if (s.charAt(i-1)  == p.charAt(j-2) || p.charAt(j-2)  == '.'){
    19                              dp[i][j] =  dp[i][j] || dp[i-1][j]; 
    20                          }
    21                      }
    22                 }
    23             }
    24         }
    25         return dp[s.length()][p.length()];//坐标
    26     }
    27 }

    注意: 写二维DP,每个人的写code的方法和细节处理不一致。

    尤其是为了方便预处理,而多加了空字符' '的二维DP时。

    在写code时,很容易弄混到底是dp[s.length()] 还是dp[s.length() + 1]? 到底是 p.charAt(j) 还是 p.charAt(j-1)? 

    最好的做法是,严格按照自己画的drawing来写,这样不容易出错!

  • 相关阅读:
    Spring boot 使用多个RedisTemplate
    Spring boot 连接Redis实现HMSET操作
    Spring boot 工具类静态属性注入及多环境配置
    向量空间模型(Vector Space Model)的理解
    双数组Trie树中叶子结点check[t]=t的证明
    谈谈我对隐马尔可夫模型的理解
    Information Retrieval 倒排索引 学习笔记
    朴素贝叶斯文本分类简单介绍
    Python Thrift 简单示例
    迭代器模式(Iterator)
  • 原文地址:https://www.cnblogs.com/liuliu5151/p/9059134.html
Copyright © 2011-2022 走看看