zoukankan      html  css  js  c++  java
  • 用python的re(正则表达式)模块匹配英文环境下的括号

    在用re(正则表达式)模块匹配掉文本中的括号时,总是出现各种各样的问题,经过将近一个小时的摸索,终于找到了问题的所在。

     案例:

    将 txt = 'Linux系统安装 - 1.1(Av20994127,P1).Flv' 中的(Av20994127,P1)匹配出来,再用re.sub()去掉。

    初次尝试:

    import re
    txt = 'Linux系统安装 - 1.1(Av20994127,P1).Flv' 

    tx = re.search('.*?((.*?)).Flv', txt)
    re.sub(tx.group(1), '', txt) 
    Out[
    1]: 'Linux系统安装 - 1.1().Flv' # 括号()仍在,无法去掉。

    解决方案:

    import re
    
    tx = re.search('.*?((.*?)).Flv', txt)
    
    re.sub('('+tx.group(1)+')', '', txt)        # 在tx.group(1) 前后分别加上 '(' 与 ')‘
                                                  # 由于才疏学浅,具体原理不明,如有高人路过,还望解答。
    Out[2]: 'Linux系统安装 - 1.1.Flv'    # 括号()被去掉。

    进阶:

    当文本中只有一个括号(单括号)时,即:text = 'Linux系统安装 - 1.1(Av20994127,P.Flv'

    用相同的方法,出现 error: missing ), unterminated subpattern 的错误。

    经摸索发现,解决方案如下:

    import re

    text = 'Linux系统安装 - 1.1(Av20994127,P.Flv'

    result = re.search('.*?((.*?,P),Flv', text)

    new = re.sub('\' + result.group(1), '', text)   # 在result.group(1)前面加 ’\‘

    Out[3]: 'Linux系统安装 - 1.1.Flv'

  • 相关阅读:
    wampserver服务器离线,无法访问此网站 找不到 项目 的服务器 DNS 地址。
    node.js(一)介绍与安装
    js全局函數
    类和对象的定义
    iframe框架学习
    while和do-while的区别
    html5视频音频
    列表
    html表格的学习
    云课堂数组1
  • 原文地址:https://www.cnblogs.com/xiangsui/p/9693886.html
Copyright © 2011-2022 走看看