zoukankan      html  css  js  c++  java
  • Python re 模块中,如何使用反斜杠 ""分割字符串?

     Python 语言使用反斜杠()作为转义符,对一些字符进行转义(escape),例如 " " " " 等。所以当 Python 字符串中如果出现反斜杠,则会自动转义其后的字符。但这会导致一个问题,就是,如果只是把反斜杠作为字符字面(liberal)意义,应该如何处理?

    如果不使用 re 模块(regular expression module),在 Python 字符串中,使用两个反斜杠转义,即可表示一个反斜杠。示例代码如下:

    import sys 
    
    # backslash escape
    enter = "
    " if sys.platform == "win32" else "
    "
    
    # backslash liberal
    backslash_liberal = "\"

    此时,如果使用 Python 字符的 split 方法,用两个反斜杠作为分割符,是没有问题的。示例代码如下:

    # Use str type's split() method
    print("aa\bb".split("\"))

    但是如果使用 re 模块的 split() 方法,依旧使用两个反斜杠,去分割 Python 字符串,则会出现错误信息。示例代码如下:

    import re
    
    s = "aa\bb"
    try:
        re.split("\", s) 
    except Exception as e:
        print("error:", e)

    这个错误的原因是 re 模块中,也将反斜杠作为转义字符,而导致的。具体来说,当输入两个反斜杠时,两个反斜杠首先在 Python 解释器进行转义,变成一个反斜杠,然后将这一个反斜杠输入到 re 模块中,而此时 re 模块找不到相应的有效转义结尾,所以会出现错误信息 “bad escape (end of pattern) at position 0” (Python 3.8)。

    常用的解决方法有两种方式:

    一是使用四个反斜杠 "\\" ;二是使用原始字符串(raw string),即 r"\"。示例代码如下:

    print("Solution 1: ", re.split("\\", s))
    print("Solution 2: ", re.split(r"\", s))

    参考资料

    [1] Regular Expressions: Regexes in Python (Part 1). https://realpython.com/regex-python/ 

  • 相关阅读:
    洛谷P3819 松江1843路
    洛谷P1896 [SCOI2005]互不侵犯King
    洛谷P1197 [JSOI2008]星球大战
    洛谷P1171 售货员的难题
    2017-10-24 NOIP模拟赛
    LibreOJ #6192. 「美团 CodeM 复赛」城市网络
    洛谷P2258 子矩阵
    Cogs 9. 中心台站建设
    Cogs 6. 线型网络
    洛谷P3138 [USACO16FEB]负载平衡Load Balancing_Silver
  • 原文地址:https://www.cnblogs.com/klchang/p/13974651.html
Copyright © 2011-2022 走看看