zoukankan      html  css  js  c++  java
  • 解决UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position

    最近用Python写了些爬虫,在爬取一个gb2312的页面时,抛出异常:

    1. UnicodeEncodeError: 'ascii' codec can't encode characters in position 21-23: ordinal not in range(128)

    解决方案如下:

    首先设置系统的默认编码为utf-8:

    1. import sys
    2.  
    3. reload(sys)
    4. sys.setdefaultencoding('utf-8')

    然后将网页以gbk解码后转为utf-8:

    1.         result = urllib2.urlopen(req).read()
    2.         result = unicode(result,'GBK').encode('UTF-8')

    之后就正常了。

  • 相关阅读:
    day74作业
    day072作业
    Serializer类
    day067作业
    day066作业
    day065作业
    django
    jQuery
    JavaScript
    mediaplayer state
  • 原文地址:https://www.cnblogs.com/sundahua/p/7248209.html
Copyright © 2011-2022 走看看