ascci:字母、数字、特色字符,1个字节-8位
Unicode:两个字节-16位,升级版四个字节-32位
uft-8:最少一个字节-8位,英文字母-1个字节-8位,欧洲-2个字节-16位,中文-3个字节-24位
gbk:中文-2个字节-16位,英文1个字节-8位
1,各个编码之间是不能相互识别,会产生乱码
2,文件的存储、传输,不能是Unicode,只能是utf-8 utf-16 gbk gb2312 asciic等bytes类型
3,bytes类型:将Unicode编码方式转换为可存储的utf-8之类的方式,采用编码:encode() 解码使用decode()
ey:
s1 = 'python is good'
print(s1.encode('utf-8'))
result:b'python is good'
ey:
s1 = '中国'
print(s1.encode('utf-8'))
result:b'xe4xb8xadxe5x9bxbd'
解码:decode
ey:
s1 = '中国'
print(s1.encode('utf-8').decode('utf-8'))
result:中国