zoukankan      html  css  js  c++  java
  • python正则表达式--编译正则表达式re.compile

     编译正则表达式-- re.compile

    使用re的一般步骤是先将正则表达式的字符串形 式编译为pattern实例,然后使用pattern实例处理文本并获取匹配结果(一个Match实例(值为True)),最后使用Match实例获取信息,进行其他的操作。

    可以把那些经常使用的正则表达式编译成正则表达式对象,可以提高程序的执行速度。一处编译,多出复用

    re.compile(pattern, flags=0)

    第二个参数flag是匹配模式,取值可以使用按位或运算符“|”表示同时生效,

    比如re.I | re.M。当然你也可 以在regex字符串中指定模式。

    以下两种写法等价:

    re.compile('pattern', re.I | re.M)

    re.compile('(?im)pattern')

    pattern对象属性及方法

    Pattern对象是一个编译好的正则表达式,也就是通过re.compile()函数编译后得到结果。

    通过pattern提供的一系列方法可以对文本进行匹配查找

    pattern提供了几个可读属性及方法用于处理正则表达式

    (1)flags属性

    通过pattern.flags我们可以查看编译时的选项,该属性表示获取编译时用的匹配模式,以数字形式返回

    例:

    pattern = re.compile(r'w+', re.DOTALL)

    print pattern.flags

    >>>16

    通过上面的例子可以看到,flags返回结果既不是re.S也不是re.DOTALL,而是一个数值16。

    其实re.S是一个整数,16就是它的值。re.S 、 re.DOTALL 、 16 三者等价,如果是I,则显示数值为2。

    编译正则表达式时,也可以使用数字指定匹配模式

    例:

    re.compile(r'w+', 16)

    (2)groups属性

    该属性表示获取表达式中分组的数量。

    例:

    pattern = re.compile(r'(w+)(d)',re.I)

    print pattern.groups

    >>>2

    (3)groupindex属性

    以表达式中有别名的组的别名为键、以该组对应的编号为值的字典,没有别名的组不包含在内

    p = re.compile(r'(w+)(?P<sign>.*)', re.DOTALL)

    print p.groupindex

    >>>{'sign': 2}

  • 相关阅读:
    Ubuntu18.04下的音频录制和编辑软件Ardour及QjackCtl(jackd gui)
    Adobe After Effects CS6 操作记录
    编译安装和apt安装Nginx1.14.0
    Centos7.4和Ubuntu18.04安装PHP7.2
    Ubuntu与Windows7双系统下, 系统时间不一致的问题
    关于Thinkpad的立体声麦克风输入
    坑人的小米净水器: 漏水, 废水堵塞, 费用陷阱
    Photoshop CS6 操作记录
    Win7 64bit下值得推荐的免费看图软件
    Redis C客户端Hiredis代码分析
  • 原文地址:https://www.cnblogs.com/jinan1/p/10760836.html
Copyright © 2011-2022 走看看