zoukankan      html  css  js  c++  java
  • Python3 字符串前面加u,r,b的含义


    u/U:表示unicode字符串

    不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码。
    一般英文字符在使用各种编码下, 基本都可以正常解析, 所以一般不带u;但是中文, 必须表明所需编码, 否则一旦编码转换就会出现乱码。 建议所有编码方式采用utf8。在python3中,字符串默认创建即以Unicode编码存储,可以存储中文。

    例子一:
    u"我是含有中文字符组成的字符串。"

    作用:
    后面字符串以 Unicode 格式 进行编码,一般用在中文字符串前面,防止因为源码储存格式问题,导致再次使用时出现乱码。

    例子二:
    string = 'a' 等效于 string = u'a'

    Unicode中通常每个字符由2个字节表示。
    u'a' 即 u'u0061' 实际内存中为 [0000 0000] [0110 0001]


    r/R:表示非转义的原始字符串。

    与普通字符相比,其他相对特殊的字符,其中可能包含转义字符,即那些反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的” ”表示换行,” ”表示Tab等。而如果是以r开头,那么说明后面的字符,都是普通的字符了,即如果是“ ”那么表示一个反斜杠字符,一个字母n,而不是表示换行了。
    以r开头的字符,常用于正则表达式,对应着re模块。
    例:r" ”  # 表示一个普通生字符串 ,而不表示换行了。

    作用:
    去掉反斜杠的转移机制。(特殊字符:即那些,反斜杠加上对应字母,表示对应的特殊含义的,比如最常见的” ”表示换行,” ”表示Tab等。 )

    应用:
    常用于正则表达式,对应着re模块。


    b:表示bytes类型字符串

    python3.x里,默认的str是(py2.x里的)unicode,bytes是(py2.x)的str,b”“前缀代表的就是bytes。
    python2.x里,b前缀没什么具体意义, 只是为了兼容python3.x的这种写法。

    **例子一: **

    response = b'<h1>Hello World!</h1>'     # b' ' 表示这是一个 bytes 对象
    

    作用:
    b" "前缀表示:后面字符串是bytes 类型。

    用处:
    网络编程中,服务器和浏览器只认bytes 类型数据。如:send 函数的参数和 recv 函数的返回值都是 bytes 类型。

    例子二:
    字符串存储为Ascll码,无法存储中文。

    result = b'你好20190101'
    

    编译会报如下错误:
    SyntaxError: bytes can only contain ASCII literal characters.

    每个字符由1个字节表示(8位)
    b'a'即b'x61' 实际内存中位 [0110 0001]

    附:
    在 Python3 中,bytes 和 str 的互相转换方式是
    str.encode('utf-8')
    bytes.decode('utf-8')


    print(r'A	A')        结果为A	A
    print(b'A	A')         结果为b'A	A'
    print(u'A	A')         结果为A     A
    

    注意:b'A A' 打印结果中自带一个b'',表示该字符串是一个字节数组。

  • 相关阅读:
    Linux 实用指令(5)--组管理和权限管理
    Linux 实用指令(4)
    Linux用户管理 (3)
    Oracle如何用单字段或多字段进行查重
    SQL中的左连接与右连接,内连接有什么不同
    Markdown语法--整理
    应用程序无法正常启动0xc000007b
    Linux开机、重启和用户登录注销(2)
    Linux vi和vim编辑器(1)
    SecureCRT 64位 破解版和安装,以及解决乱码问题
  • 原文地址:https://www.cnblogs.com/eustoma/p/10204370.html
Copyright © 2011-2022 走看看