字符编码与解码:
Unicode 默认都占两个字符,用ASCII码英文占一个字节,ASCII码不能存中文
Unicode 存放英文会浪费空间
utf-8 存放时因为是一个字节,中文三个字节
unicode -------->通过编码 encode 转换为其他编码
其他编码 ————> 解码decode 为 unicode
![](https://images.cnblogs.com/OutliningIndicators/ContractedBlock.gif)
1 a = "时间煮雨" 2 print(a) 3 print(a.encode("utf-8")) 4 print(a.encode("utf-8").decode("utf-8")) 5 print(a.encode("utf-8").decode("utf-8").encode("gbk")) 6 print(a.encode("utf-8").decode("utf-8").encode("gbk").decode("gbk")) 7 8 9 ''' 10 时间煮雨 11 b'xe6x97xb6xe9x97xb4xe7x85xaexe9x9bxa8' 12 时间煮雨 13 b'xcaxb1xbcxe4xd6xf3xd3xea' 14 时间煮雨 15 '''
python 3中系统默认编码是Unicode,并且使用encode编码后会变成 bytes类型,python3文件编码是utf-8 但python 3 中信息是unicode编码
可以通过-*- coding:gbk -*- 修改文件编码