zoukankan      html  css  js  c++  java
  • scrapy使用response.body时编码问题

    scrapy使用response.body时编码问题

    摘要:scrapy使用response.body时编码问题。如果在使用responses.body获取数据时,需要将其编码转换成unicode,即如下处理:

    response.body返回的结果是byte字节串,其编码是网页的原编码;

    如果在使用responses.body获取数据时,需要将其编码转换成unicode,即如下处理:

    body = response.body.decode('gbk') #假设网页编码是gbk.

    body = response.body.decode(response.encoding) #即可将其转化成默认的编码

    这样输出来的内容才正确。也可以直接用response.text这样可以直接是字符串了。

  • 相关阅读:
    Jenkins 插件管理
    持续集成 目录
    gitlab 目录
    jenkins 目录
    POJ 2828
    POJ 2782
    POJ 2725
    POJ 2769
    POJ 2739
    POJ 2707
  • 原文地址:https://www.cnblogs.com/xiao-xue-di/p/13901394.html
Copyright © 2011-2022 走看看