zoukankan      html  css  js  c++  java
  • python-requests模块中常用的解码方式

    python-requests模块中常用的解码方式

    在得到返回的对象(response)后,一般不去刻意查看,是不知道编码方式的。
    通常直接猜即可,因为大多数都是使用的“utf-8”。

    在requests里的快捷的解码方式可以使用如下几种:

    response.text

    类型 : str
    解码类型:根据http头部对响应的编码作出推测
    修改:response.encoding="utf-8"

    response.content.encode()

    • 注意:这里encode默认使用“utf-8”

    类型 :bytes
    解码方式:没指定

    response.content.encode("gbk')

    • 注意:这是指定解码方式

    常见的编码解码方式有:

    • ISO-8859-1
    • utf-8

    是Unicode字符的实现方式之一,它使用1-4个字符表示一个符号,根据不同的符号而变化字节长度

    • ASCII码

    用来表示英文,它使用1个字节表示,其中第一位规定为0,其他7位存储数据,一共可以表示128个字符。

    • GBK/GB2312/GB18030

    表示汉字。GBK/GB2312表示简体中文,GB18030表示繁体中文。

    • Unicode编码

    包含世界上所有的字符,是一个字符集。

    pip安装镜像: https://pypi.doubanio.com/simple

  • 相关阅读:
    Java 类和对象12
    Java类和对象11
    java 类和对象10
    Java类和对象9
    Java类和对象8
    Java 类和对象7
    包装与方法
    JAVA链表
    泛型
    多态 接口
  • 原文地址:https://www.cnblogs.com/MrYuChen-Blog/p/14296758.html
Copyright © 2011-2022 走看看