zoukankan      html  css  js  c++  java
  • 请问这个「 (?<=<(w+)>).*(?=</1>) 」正则表达式是什么意思呢?


     (?<=<(w+)>).*(?=</1>)
    ----------------------------------------------------

    正则表达式看懂的最好方法就是一步步分开解析:

    1)以 '.*' 为分界,前面括号中的内容可以划分为 ‘?<=’ 和 ‘<(w+)>’,其中‘<(w+)>'表示匹配尖括号里面是字母、数字或下划线的内容,类似<span>,外面还要加个括号是要实现分组;而‘?<=’用到的是零宽断言语法,表示的是断定‘<(w+)>’后面有或没有内容,而且与内容的间隔宽度为零。

    2)再看' .* '后面的部分,括号里面的内容可以分为 ‘?=’ 和 ‘<(/1>’,其中‘?=’用零宽断言表示匹配‘<(/1>’前面的部分,而对于‘<(/1>’,‘/’匹配‘/’符号,类似</span>,这里可能有些同学不太明白‘1’是什么意思?这里用到的是捕获分组的思想,上述提到的‘<(w+)>’外面加个小括号就表示一个分组,对于正则表达式的分组结果,索引 0表示匹配的整个内容,而1表示的是第1个子分组,所以这里的'1'指向的就是前面的第一个分组‘<(w+)>’,2表示重复第2个子项, 表示重复第n个子项;

    3).* 就比较简单了,表示的是匹配 除了换行符意外的任意字符0次或多次。

    综上,改表达式匹配的是类似html标签这种内容的,如<body>你好,正则!</body>

  • 相关阅读:
    将excel单元格中的内容,批量转化成批注
    装饰器的入门到精通
    自定义dict
    python2.7 + PyQt4安装
    一些好用的python模块
    人工智能-自然语言处理
    websocket-单群聊
    UA池和代理池
    scrapy框架持久化存储
    SQL Server 2012 酸爽的安装体验
  • 原文地址:https://www.cnblogs.com/oxspirt/p/8041717.html
Copyright © 2011-2022 走看看