zoukankan html css js c++ java

06 Day Python编码的转换

ascii
            A : 00000010  8位 一个字节

unicode     A : 00000000 00000001 00000010 00000100 32位  四个字节
            中：00000000 00000001 00000010 00000110 32位  四个字节


utf-8      A :  00100000 8位 一个字节
          中 :  00000001 00000010 00000110 24位 三个字节


gbk        A : 00000110  8位 一个字节
         　中  : 00000010 00000110 16位 两个字节


1，各个编码之间的二进制，是不能互相识别的，会产生乱码。
2，文件的储存，传输，不能是unicode（只能是utf-8 utf-16 gbk,gb2312,asciid等）

py3:
    str 在内存中是用unicode编码。
        bytes类型
        对于英文：
             str  ：表现形式：s = 'alex'
                    编码方式： 010101010  unicode
            bytes ：表现形式：s = b'alex'
                    编码方式： 000101010  utf-8 gbk。。。。

        对于中文：
             str  ：表现形式：s = '中国'
                    编码方式： 010101010  unicode
            bytes ：表现形式：s = b'xe91e91e01e21e31e32'
                    编码方式： 000101010  utf-8 gbk。。。。

编码的转换：（输出的 b 不影响任何操作。只是告诉用户该str是bytes类型）

s1 = 'alex'
s11 = s1.encode()
print(s11)
输出：b'alex'

查看全文

相关阅读:
街边的泥人张
 没事试试50mm1.4
WWOOF介绍一下，但貌似我们利用不了
 护照和签证
 071205还是晴photo
忘年旅行
 12月6日大雪
 12月5日
 周六
 071204 晴

原文地址：https://www.cnblogs.com/lidaxu/p/8082011.html