python中requests库中文乱码问题 - 走看看

zoukankan html css js c++ java

python中requests库中文乱码问题
当使用这个库的时候经常会出现各种乱码的情况。

首先要知道：

text返回的是处理过的unicode的数据。

content返回的是bytes的原始数据

也就是说r.content比r.text更加节省资源

如果headers没有charset字符集的化,text()会调用chardet来计算字符集，这又是消耗cpu的事情

倘若在conttent-type字段中没有制定charset的时候，默认使用的是ISO-8859-1编码，在处理英文的时候是没有问题，但是在处理中文的时候就会出现乱码的情况了。

解决

如果在确定使用text，并已经得知该站的字符集编码时，可以使用 r.encoding = ‘xxx’ 模式，当你指定编码后，requests在text时会根据你设定的字符集编码进行转换.

使用apprent_encoding可以获得真实编码
1 >>> import requests 2 >>> respone = requests.get("http://www.baidu.com/") 3 >>> respone.apparent_encoding 4 'utf-8'
查看全文

相关阅读:
day02 Python 字符串编码
 地坛——我的最爱 (2006-11-12 09:33:18)
心灵噬血虫 (2007-01-02 12:33:36)
ArcSDE for oracle10g安装后post的时候出现错误
 创建featureclass，为它赋别名，并移动到数据集下
 feature.shape和feature.shapecopy的区别
 IPoint从自定义的投影坐标系转换到自定义的地理坐标系
 女儿傻女儿悲 2014-2-23
自嘲 2014-2-7
写在双节 2014-2-14

原文地址：https://www.cnblogs.com/nul1/p/9232484.html

Copyright © 2011-2022 走看看