zoukankan      html  css  js  c++  java
  • Python re 模块中,如何使用反斜杠 ""分割字符串?

     Python 语言使用反斜杠()作为转义符,对一些字符进行转义(escape),例如 " " " " 等。所以当 Python 字符串中如果出现反斜杠,则会自动转义其后的字符。但这会导致一个问题,就是,如果只是把反斜杠作为字符字面(liberal)意义,应该如何处理?

    如果不使用 re 模块(regular expression module),在 Python 字符串中,使用两个反斜杠转义,即可表示一个反斜杠。示例代码如下:

    import sys 
    
    # backslash escape
    enter = "
    " if sys.platform == "win32" else "
    "
    
    # backslash liberal
    backslash_liberal = "\"

    此时,如果使用 Python 字符的 split 方法,用两个反斜杠作为分割符,是没有问题的。示例代码如下:

    # Use str type's split() method
    print("aa\bb".split("\"))

    但是如果使用 re 模块的 split() 方法,依旧使用两个反斜杠,去分割 Python 字符串,则会出现错误信息。示例代码如下:

    import re
    
    s = "aa\bb"
    try:
        re.split("\", s) 
    except Exception as e:
        print("error:", e)

    这个错误的原因是 re 模块中,也将反斜杠作为转义字符,而导致的。具体来说,当输入两个反斜杠时,两个反斜杠首先在 Python 解释器进行转义,变成一个反斜杠,然后将这一个反斜杠输入到 re 模块中,而此时 re 模块找不到相应的有效转义结尾,所以会出现错误信息 “bad escape (end of pattern) at position 0” (Python 3.8)。

    常用的解决方法有两种方式:

    一是使用四个反斜杠 "\\" ;二是使用原始字符串(raw string),即 r"\"。示例代码如下:

    print("Solution 1: ", re.split("\\", s))
    print("Solution 2: ", re.split(r"\", s))

    参考资料

    [1] Regular Expressions: Regexes in Python (Part 1). https://realpython.com/regex-python/ 

  • 相关阅读:
    构建企业级数据湖?Azure Data Lake Storage Gen2实战体验(中)
    构建企业级数据湖?Azure Data Lake Storage Gen2实战体验(上)
    寻觅Azure上的Athena和BigQuery (二):神奇的PolyBase
    寻觅Azure上的Athena和BigQuery(一):落寞的ADLA
    Azure中国CDN全球覆盖功能初探
    第一次负责项目感悟
    C#读取静态类常量属性和值
    std::thread使用
    C#泛型编程
    C++模板类
  • 原文地址:https://www.cnblogs.com/klchang/p/13974651.html
Copyright © 2011-2022 走看看