zoukankan      html  css  js  c++  java
  • 正则表达式匹配二次转义的东西 / 怎么处理?

    原来的源码里的数据大概是这么形式的
    <div class="WB_handle W_fr" mid="4170395588014391">XXXXXX<em>XXXXXXX</em>.*?</div>
    然后就死活出不来了
    经过思考(其实是我之前好像遇到过,记忆模糊但随便试了试)写成下面这样的可以匹配到
    <div class=\\"WB_handle W_fr\\" mid=\\"4170395588014391\\">.*?<em>(.*?)<\/em>.*?<\/div>

    这里,我们可以看一下,我们这一个/用了////表示,但是后面的\/可以\\/可以\\/也可以

    找了一点资料 https://blog.csdn.net/zttaiwx/article/details/53981755

    由此可见,在字符串中,两个反斜杠被解释为一个反斜杠,然后在作为正则表达式, \ 则被正则表达式引擎解释为 ,所以在正则表达式中需要使用四个反斜杠。 
    也就是说,前两个反斜杠在字符串中被解释为一个反斜杠,后两个也被解释为一个反斜杠,这时解释完毕后变成两个反斜杠,再由正则表达式解释两个反斜杠,就又解释成了一个反斜杠,所以,在正则表达式中要匹配一个反斜杠时,需要四个反斜杠。

    同理,要匹配点号时,需要在点号之前加上两个反斜杠,否则将被正则表达式当作一个点号,一个点号在正则表达式中表示匹配任意字符了。

    那么\/是两个用来转义了  \\/则是\\视为一个  而\\/ 前四个视为一个后面视为转义

    目前是这么理解的,以后有待考验

  • 相关阅读:
    声律启蒙(上 下卷,珍藏版)
    笠翁对韵(全卷,珍藏版附注释)
    Oracle 中 nvl、nvl2、nullif、coalesce、decode 函数的用法详解
    Groovy
    spring各版本jar包和源码
    Java 调用翻译软件实现英文文档翻译
    oracle导出序列的几种办法
    Oracle数据库内存使用情况分析查看
    window Maven私服搭建——nexus
    用户管理的备份与恢复
  • 原文地址:https://www.cnblogs.com/palace/p/9598426.html
Copyright © 2011-2022 走看看