py3: str bytes
str: unicode
bytes: 十六进制
str>>>>>>>bytes:编码
bytes>>>>>str:解码
python在读取文件时出现 'gbk' codec can't decode byte 0x89 in position 68: illegal multibyte sequence
python在读取文件时出现“UnicodeDecodeError:'gbk' codec can't decode byte 0x89 in position 68: illegal multibyte sequence”错误
翻译为:“GBK”编解码器不能解码位置68中的字节0x89:非法多字节序列
可能是解码的时候读取文件和编辑器所用的编码导致的(我读取的文档是UTF - 8,但pycharm是GBK)。
解决办法有两种:
第一种:
f= open('file','r', encoding='UTF-8')
得到的结果与原文档一致
第二种:
f= open('f','rb')
得到的结果:字符显示的是二进制码
推荐使用第一种