zoukankan      html  css  js  c++  java
  • Python re 模块中,如何使用反斜杠 ""分割字符串?

     Python 语言使用反斜杠()作为转义符,对一些字符进行转义(escape),例如 " " " " 等。所以当 Python 字符串中如果出现反斜杠,则会自动转义其后的字符。但这会导致一个问题,就是,如果只是把反斜杠作为字符字面(liberal)意义,应该如何处理?

    如果不使用 re 模块(regular expression module),在 Python 字符串中,使用两个反斜杠转义,即可表示一个反斜杠。示例代码如下:

    import sys 
    
    # backslash escape
    enter = "
    " if sys.platform == "win32" else "
    "
    
    # backslash liberal
    backslash_liberal = "\"

    此时,如果使用 Python 字符的 split 方法,用两个反斜杠作为分割符,是没有问题的。示例代码如下:

    # Use str type's split() method
    print("aa\bb".split("\"))

    但是如果使用 re 模块的 split() 方法,依旧使用两个反斜杠,去分割 Python 字符串,则会出现错误信息。示例代码如下:

    import re
    
    s = "aa\bb"
    try:
        re.split("\", s) 
    except Exception as e:
        print("error:", e)

    这个错误的原因是 re 模块中,也将反斜杠作为转义字符,而导致的。具体来说,当输入两个反斜杠时,两个反斜杠首先在 Python 解释器进行转义,变成一个反斜杠,然后将这一个反斜杠输入到 re 模块中,而此时 re 模块找不到相应的有效转义结尾,所以会出现错误信息 “bad escape (end of pattern) at position 0” (Python 3.8)。

    常用的解决方法有两种方式:

    一是使用四个反斜杠 "\\" ;二是使用原始字符串(raw string),即 r"\"。示例代码如下:

    print("Solution 1: ", re.split("\\", s))
    print("Solution 2: ", re.split(r"\", s))

    参考资料

    [1] Regular Expressions: Regexes in Python (Part 1). https://realpython.com/regex-python/ 

  • 相关阅读:
    dotnet core 3.0 linux 部署小贴士
    Akka.net 性能测试兼使用小技巧
    如何给小学生讲清楚ECC椭圆曲线加密
    Typescript骚操作,在TS里面直接插入HTML
    源自于NEO的KeyValue 数据库面世啦
    编译ROCKSDB总结
    Windows linux子系统 使用说明
    dotnetcore http服务器研究(二)性能分析
    dotnetcore Http服务器研究(一)
    使用信号量来 限制无边界池子与队列
  • 原文地址:https://www.cnblogs.com/klchang/p/13974651.html
Copyright © 2011-2022 走看看