python（22）总结下最近遇到的编码问题 - 走看看

zoukankan html css js c++ java

python（22）总结下最近遇到的编码问题
最近爬取，或者解析网页是总是遇到编码问题（我的版本：python2.7）

一、常见异常：UnicodeEncodeError: 'ascii' codec can't encode character u'xb4' in position 0: ordinal not in range(128)

常见解决方案：在代码头添加如下文件
import sys reload(sys) sys.setdefaultencoding("utf-8")
有时也会遇到字符转换的问题：
>>> str(u'我') Traceback (most recent call last): File "<stdin>", line 1, in <module> UnicodeEncodeError: 'ascii' codec can't encode character u'u6211' in position 0: ordinal not in range(128)
解决方法如下：
>>> str(u'我'.encode('utf-8')) 'xe6x88x91'
二、在爬取网页进行解析的时候，遇到中文需要存储的，一般要先看一下中文是什么格式的，如果是unicode则需要进行转码
xx = xxx.encode('utf-8') f.write(xx)
注：以上解决方案有所借鉴其他博友，未能找到源博
查看全文

相关阅读:
林大妈的JavaScript基础知识（二）：编写JavaScript代码前的一些简单工作
 林大妈的JavaScript基础知识（一）：JavaScript简史
 制作X509证书
 浏览器对象模型
 JS事件
 CSS操作
 Element节点
 Document节点
 Dom中的一些接口
 DOM节点的属性和方法

原文地址：https://www.cnblogs.com/lovychen/p/5780150.html

Copyright © 2011-2022 走看看