zoukankan      html  css  js  c++  java
  • Python爬虫教程-04-response简介

    Spider-04-response简介

    本小节介绍urlopen的返回对象,和简单调试方法

    案例v3

    • 研究request的返回值,输出返回值类型,打印内容
    • geturl:返回请求对象的url
    • info:请求返回对象的meta信息
    • getcode:返回的http code
    • py04v3.py文件:https://xpwi.github.io/py/py爬虫/py04v3.py
    # py04v3.py
    
    from urllib import request
    
    if __name__ == '__main__':
    
        url = 'https://jobs.zhaopin.com/CC375882789J00033399409.htm'
    
        rsp = request.urlopen(url)
        # 按住Ctrl键不送,同时点击urlopen,可以查看文档,有函数的具体参数和使用方法
    
        print("rsp的类型:{0}".format(type(rsp)))
        print("rsp的内容:{0}".format(rsp))
        print("url为:{0}".format(rsp.geturl()))
        print("Info为:{0}".format(rsp.info()))
        print("Code为:{0}".format(rsp.getcode()))
    
    
        html = rsp.read()
    

    右键运行,截图如下
    这里写图片描述

    关于调试

    • 在代码左侧【行号】上单击,出现红点,及断点
    • 右键【Debug '项目名'】

    这里写图片描述

    控制台截图如下

    包括请求过程中的参数
    这里写图片描述
    urlopen的返回对象,和简单调试方法就介绍到这里了

    更多文章链接:Python 爬虫随笔


    - 本笔记不允许任何个人和组织转载
  • 相关阅读:
    基本运算符和if判断
    数据类型
    Day 5内存管理,定义变量
    Day 4 变量常量
    编辑语言的分类
    硬盘工作原理
    计算机组成原理
    hdu5293 lca+dp+树状数组+时间戳
    hdu5290树形dp
    hdu5294 网络流+dijskstr
  • 原文地址:https://www.cnblogs.com/xpwi/p/9600636.html
Copyright © 2011-2022 走看看