zoukankan      html  css  js  c++  java
  • 关于python爬虫的编码错误

     现在才发现很多错误只有自己一点点的去尝试才能发现。不管之前别人怎么和你说,总是不可能面面俱到,所以提升自己的方法就是亲手实践,自己一点点的去发现问题,并一个个的解决。慢慢享受其中无言的快感。

    今天就发现了一个:

    运行爬虫时出现了这个错误:

    UnicodeEncodeError: 'ascii' codec can't encode character u'xa0' in position 10: ordinal not in range(128)

    上网一查才知道原来这个错误很普遍。当将列表转为字符串的时候一般出现这种错误。

    python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错,python没办法处理非ascii编码的,此时需要自己设置将python的默认编码,一般设置为utf8的编码格式。

    虽然已经在文件开头加入了 utf-8 ,但还是不行。这时我们需要在python文件头部加入以下代码

    import sys
    reload(sys)
    sys.setdefaultencoding( "utf-8" )

  • 相关阅读:
    react开发环境搭建
    react 组件创建
    Redux 视频教程
    echars3.0 柱状图y轴字体斜放
    echars3.0 柱状图大小设置
    ECharts地图详解 【转】
    html 超出出现省略号
    html JS打印添加水印图片
    js 重庆38区县 数组
    docker 暴露2375 端口。
  • 原文地址:https://www.cnblogs.com/qsyll0916/p/7679372.html
Copyright © 2011-2022 走看看