zoukankan      html  css  js  c++  java
  • Python正则表达式re.findall一个有趣的现象

    下面通过几个案例来分析一下,
    注意:本节的parsematch函数请参考《妙用re.sub分析正则表达式解析匹配过程

    案例一:

    >>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['断魔归本合元神']
    >>> parsematch(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
        匹配子串group(1): 断魔归本合元神,位置为:(12, 19)
    >>> re.findall(r".* .* (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['断魔归本合元神']
    

    案例二:

    >>> re.findall("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['神', '']
    >>> parsematch("(.)*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
        匹配子串group(1): 神,位置为:(18, 19)
    第2次匹配,匹配情况:
        匹配子串group(0): ,位置为:(19, 19)
    
    

    案例三:

    >>> re.findall(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    ['第二回 悟彻菩提真妙理u3000断魔归本合元神', '']
    >>> parsematch(".*",'第二回 悟彻菩提真妙理 断魔归本合元神')
    第1次匹配,匹配情况:
        匹配子串group(0): 第二回 悟彻菩提真妙理 断魔归本合元神,位置为:(0, 19)
    第2次匹配,匹配情况:
        匹配子串group(0): ,位置为:(19, 19)
    >>>
    

    案例四:

    >>> re.findall(r"(.*) (.*) (.*)",'第二回 悟彻菩提真妙理 断魔归本合元神')
    [('第二回', '悟彻菩提真妙理', '断魔归本合元神')]
    >>>
    

    上述4个案例的前2个案例,在第一次匹配存在group(1)的情况下,findall中返回的第一个元素为group(1)的匹配子串,而group(0)的数据没有在findall中返回,而3个案例的第2次匹配以及第3个案例的第1次匹配都只有group(0),此时findall返回的就是group(0)的整体搜索串,第4个案例返回的是group(1,2,3)。

    从这几个案例的情况来看,findall在匹配后,如果匹配的子串只有一个组,则返回组0,否则返回组0后面的组,而组0不再返回。

    老猿Python,跟老猿学Python!
    博客地址:https://blog.csdn.net/LaoYuanPython

    请大家多多支持,点赞、评论和加关注!谢谢!

  • 相关阅读:
    JAVA软件工程师应该具备哪些基本素质?
    java编程题(一)
    js继承之Object.create()
    【3D计算机图形学】变换矩阵、欧拉角、四元数
    JS的get和set使用示例
    深入浅析JavaScript中的constructor
    图片预加载之模拟img.load()
    threejs里面的vector3源码解析
    javascript事件轮询
    关于URL编码的一些结论
  • 原文地址:https://www.cnblogs.com/LaoYuanPython/p/13643610.html
Copyright © 2011-2022 走看看