zoukankan      html  css  js  c++  java
  • python正则表达式--编译正则表达式re.compile

     编译正则表达式-- re.compile

    使用re的一般步骤是先将正则表达式的字符串形 式编译为pattern实例,然后使用pattern实例处理文本并获取匹配结果(一个Match实例(值为True)),最后使用Match实例获取信息,进行其他的操作。

    可以把那些经常使用的正则表达式编译成正则表达式对象,可以提高程序的执行速度。一处编译,多出复用

    re.compile(pattern, flags=0)

    第二个参数flag是匹配模式,取值可以使用按位或运算符“|”表示同时生效,

    比如re.I | re.M。当然你也可 以在regex字符串中指定模式。

    以下两种写法等价:

    re.compile('pattern', re.I | re.M)

    re.compile('(?im)pattern')

    pattern对象属性及方法

    Pattern对象是一个编译好的正则表达式,也就是通过re.compile()函数编译后得到结果。

    通过pattern提供的一系列方法可以对文本进行匹配查找

    pattern提供了几个可读属性及方法用于处理正则表达式

    (1)flags属性

    通过pattern.flags我们可以查看编译时的选项,该属性表示获取编译时用的匹配模式,以数字形式返回

    例:

    pattern = re.compile(r'w+', re.DOTALL)

    print pattern.flags

    >>>16

    通过上面的例子可以看到,flags返回结果既不是re.S也不是re.DOTALL,而是一个数值16。

    其实re.S是一个整数,16就是它的值。re.S 、 re.DOTALL 、 16 三者等价,如果是I,则显示数值为2。

    编译正则表达式时,也可以使用数字指定匹配模式

    例:

    re.compile(r'w+', 16)

    (2)groups属性

    该属性表示获取表达式中分组的数量。

    例:

    pattern = re.compile(r'(w+)(d)',re.I)

    print pattern.groups

    >>>2

    (3)groupindex属性

    以表达式中有别名的组的别名为键、以该组对应的编号为值的字典,没有别名的组不包含在内

    p = re.compile(r'(w+)(?P<sign>.*)', re.DOTALL)

    print p.groupindex

    >>>{'sign': 2}

  • 相关阅读:
    leetcode 309. Best Time to Buy and Sell Stock with Cooldown
    leetcode 714. Best Time to Buy and Sell Stock with Transaction Fee
    leetcode 32. Longest Valid Parentheses
    leetcode 224. Basic Calculator
    leetcode 540. Single Element in a Sorted Array
    leetcode 109. Convert Sorted List to Binary Search Tree
    leetcode 3. Longest Substring Without Repeating Characters
    leetcode 84. Largest Rectangle in Histogram
    leetcode 338. Counting Bits
    git教程之回到过去,版本对比
  • 原文地址:https://www.cnblogs.com/jinan1/p/10760836.html
Copyright © 2011-2022 走看看