zoukankan      html  css  js  c++  java
  • python 正则表达式 re.match

     1 #coding:utf-8
     2 
     3 import re
     4 #匹配内容:单词+空格+单词+任意字符
     5 #w 单词字符[A-Za-z0-9_]
     6 #(?P<name>...) 分组,除了原有的编号外在指定一个额外的别名
     7 # * 匹配前一个字符0或无限次 
     8 m=re.match(r'(w+) (w+)(?P<sign>.*)','whoami ufo')
     9 
    10 #string: 匹配时使用的文本。
    11 print 'm.string :',m.string
    12 #re: 匹配时使用的Pattern对象
    13 print 'm.re :',m.re
    14 #pos: 文本中正则表达式开始搜索的索引。值与Pattern.match()
    15 # 和Pattern.seach()方法的同名参数相同。
    16 print 'm.pos :',m.pos
    17 #endpos: 文本中正则表达式结束搜索的索引。值与Pattern.match()
    18 # 和Pattern.seach()方法的同名参数相同。
    19 print 'm.endpos :',m.endpos
    20 #lastindex: 最后一个被捕获的分组在文本中的索引。
    21 # 如果没有被捕获的分组,将为None。
    22 print 'm.lastindex :',m.lastindex
    23 #lastgroup: 最后一个被捕获的分组的别名。
    24 # 如果这个分组没有别名或者没有被捕获的分组,将为None。
    25 print 'm.lastgroup :',m.lastgroup
    26 #.group([group1, …]):获得一个或多个分组截获的字符串;
    27 # 指定多个参数时将以元组形式返回。group1可以使用编号也可以使用别名;
    28 # 编号0代表整个匹配的子串;不填写参数时,返回group(0);
    29 # 没有截获字符串的组返回None;截获了多次的组返回最后一次截获的子串。
    30 print 'm.group() :',m.group()
    31 print 'm.group(1,2)  :',m.group(1,2)
    32 print 'm.group(1, 2) :',m.group(1, 2)
    33 #groups([default]):以元组形式返回全部分组截获的字符串。
    34 # 相当于调用group(1,2,…last)。default表示没有截获字符串的组以这个
    35 # 值替代,默认为None。
    36 print 'm.groups() :',m.groups()
    37 print 'm.groups(3) :',m.groups(3)
    38 #groupdict([default]):返回以有别名的组的别名为键、以该组截获的子串
    39 # 为值的字典,没有别名的组不包含在内。default含义同上。
    40 print 'm.groupdict() :',m.groupdict()
    41 #start([group]):返回指定的组截获的子串在string中的起始索引
    42 #(子串第一个字符的索引)。group默认值为0。
    43 print 'm.start(2) :',m.start(2)
    44 print 'm.start(3) :',m.start(3)
    45 #end([group]):返回指定的组截获的子串在string中的结束索引
    46 #(子串最后一个字符的索引+1)。group默认值为0。
    47 print 'm.end(2) :',m.end(2)
    48 print 'm.end(3) :',m.end(3)
    49 #span([group]):返回(start(group), end(group))。
    50 print 'm.span(1) :',m.span(1)
    51 print 'm.span(2) :',m.span(2)
    52 #expand(template):将匹配到的分组代入template中然后返回。
    53 # template中可以使用id或g、g引用分组,但不能使用编号0。
    54 # id与g是等价的;但10将被认为是第10个分组,如果你想表达1之后是字符’0’,
    55 # 只能使用g0。
    56 print r"m.expand(r'g') 1:",m.expand(r'1')
    57 print r"m.expand(r'g') 2:",m.expand(r'2')
    58 print r"m.expand(r'g') 3:",m.expand(r'3')
    59 
    60 print r"m.expand(r'g gg') :",m.expand(r'2 22')
    61 print r"m.expand(r'g gg') :",m.expand(r'2 13')

    Output:

     1 m.string : whoami ufo
     2 m.re : <_sre.SRE_Pattern object at 0x0000000002591140>    #这里与原文不同,猜测:返回值为pattern对象的存储位置
     3 m.pos : 0
     4 m.endpos : 10
     5 m.lastindex : 3
     6 m.lastgroup : sign
     7 m.group() : whoami ufo
     8 m.group(1,2)  : ('whoami', 'ufo')    
     9 m.group(1, 2) : ('whoami', 'ufo')    #测试,空格无作用
    10 m.groups() : ('whoami', 'ufo', '')
    11 m.groups(3) : ('whoami', 'ufo', '')    #传入任意参数,结果相同
    12 m.groupdict() : {'sign': ''}
    13 m.start(2) : 7
    14 m.start(3) : 10
    15 m.end(2) : 10
    16 m.end(3) : 10
    17 m.span(1) : (0, 6)
    18 m.span(2) : (7, 10)
    19 m.expand(r'g') 1: whoami
    20 m.expand(r'g') 2: ufo
    21 m.expand(r'g') 3: 
    22 m.expand(r'g gg') : ufo ufoufo
    23 m.expand(r'g gg') : ufo whoami

    quote:http://cuiqingcai.com/977.html

  • 相关阅读:
    专题页移动端适配实例
    iconfont字体图标使用方法
    HBuilder常用快捷键
    tab
    tab-qq
    微信小程序之购物车功能
    margin塌陷
    weui-wxss-master下载地址
    python_vlc 播放http流
    go学习笔记-简述
  • 原文地址:https://www.cnblogs.com/sub2020/p/7920845.html
Copyright © 2011-2022 走看看