zoukankan      html  css  js  c++  java
  • Python正则表达式re.findall一个有趣的现象

    下面通过几个案例来分析一下,
    注意:本节的parsematch函数请参考《妙用re.sub分析正则表达式解析匹配过程

    案例一:

    >>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['断魔归本合元神']
    >>> parsematch(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
        匹配子串group(1): 断魔归本合元神,位置为:(12, 19)
    >>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['断魔归本合元神']
    

    案例二:

    >>> re.findall("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['神', '']
    >>> parsematch("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
        匹配子串group(1): 神,位置为:(18, 19)
    第2次匹配,匹配情况:
        匹配子串group(0): ,位置为:(19, 19)
    
    

    案例三:

    >>> re.findall(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['第二回 悟彻菩提真妙理u3000断魔归本合元神', '']
    >>> parsematch(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
    第2次匹配,匹配情况:
        匹配子串group(0): ,位置为:(19, 19)
    >>>
    

    案例四:

    >>> re.findall(r"(.*) (.*) (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    [('第二回', '悟彻菩提真妙理', '断魔归本合元神')]
    >>>
    

    上述4个案例的前2个案例,在第一次匹配存在group(1)的情况下,findall中返回的第一个元素为group(1)的匹配子串,而group(0)的数据没有在findall中返回,而3个案例的第2次匹配以及第3个案例的第1次匹配都只有group(0),此时findall返回的就是group(0)的整体搜索串,第4个案例返回的是group(1,2,3)。

    从这几个案例的情况来看,findall在匹配后,如果匹配的子串只有一个组,则返回组0,否则返回组0后面的组,而组0不再返回。

    老猿Python,跟老猿学Python!
    博客地址:https://blog.csdn.net/LaoYuanPython

    请大家多多支持,点赞、评论和加关注!谢谢!

  • 相关阅读:
    hdu 2196 树形dp
    codeforces 1A
    [日常摸鱼]bzoj1218[HNOI2003]激光炸弹-二维前缀
    [日常摸鱼]bzoj2724蒲公英-分块
    [日常摸鱼]关于离散化
    [OI笔记]后缀自动机
    [日常摸鱼]poj1509Glass Beads-SAM
    [日常摸鱼]bzoj1083[SCOI2005]繁忙的都市-最小生成树
    [日常摸鱼]bzoj2038[2009国家集训队]小Z的袜子-莫队算法
    [日常摸鱼]三分法
  • 原文地址:https://www.cnblogs.com/LaoYuanPython/p/13643610.html
Copyright © 2011-2022 走看看