zoukankan      html  css  js  c++  java
  • Python正则表达式:最短匹配

    最短匹配应用于:假如有一段文本,你只想匹配最短的可能,而不是最长。

    例子

    比如有一段html片段,'<a>this is first label</a><a>the second label</a>',如何匹配出每个a标签中的内容,下面来看下最短与最长的区别。

    代码

    >>> import re
    >>> str = '<a>this is first label</a><a>the second label</a>'
    
    >>> print re.findall(r'<a>(.*?)</a>', str)  # 最短匹配
    ['this is first label', 'the second label']
    
    >>> print re.findall(r'<a>(.*)</a>', str)
    ['this is first label</a><a>the second label']
    

    解释

    例子中,模式r'(.*?)'的意图是匹配被包含的文本,但是正则表达式中*操作符是贪婪的,因此匹配操作会查找出最长的可能。
    但是在*操作符后面加上?操作符,这样使得匹配变成非贪婪模式,从而得到最短匹配。

  • 相关阅读:
    C++模板元编程(二)
    C++模板元编程(一)
    interpret_cast
    Bresenham算法
    Windows中编译Lua源码
    MathJax基础教程与快速参考
    散列表
    Bash脚本实例
    Bash基础
    【iOS】重读《精通Objective-C》(一)
  • 原文地址:https://www.cnblogs.com/jhao/p/5989241.html
Copyright © 2011-2022 走看看