zoukankan      html  css  js  c++  java
  • 一只想成长的爬虫——requests库~~

    requests库

    1安装

    2.使用

    3.其他方法

    *requests的get方法

    他返回和我使用urllib.request构建走的:

      rq=urllib.request.Request(url[,data][,header])

      response=urllib.request.urlopen(rq)

      一样

     

     

    使用下图,利用response当返回的不是200(成功)的时候就产生HTTPError的异常

     

     

     

    put()将原有的数据覆盖掉

     requests.request方法

    13个控制访问参数

    **开头就需要把参数也给写上,如下面params=kv

     

    增加代理~~~

    params:对url进行修改的字段

    data:如果等于键值对,传入到Form中,以键值对显示,如果不是键值对,那么直接上传到data中

     json:将json传输出去

    *headers:定制头部信息,修改headers!!!

    cookies: 

    auth:

    *files:向指定网址或服务器上传文件,常和open一起使用

    timeout设置超时时间 /秒

    *proxies:字典/设置代理服务器

     allow_redirects:重定向开关

     stream:获取内容立即下载开关

    verify:认证SSL证书开关

    cert:本地SSL证书路径

     requests.get方法【最常用的的方法】

      【因为HTTP协议中向服务器提交是严格受控的】

      访问参数就是除了request中除了params的参数

      下面以此类推,总之,所有方法都在request的13个方法内

    head..

     post

     

    put

    patch...

     

    delete..

    一定要用try..except  方式保证异常能有效处理

      网络爬虫引发的问题~~~~

     

  • 相关阅读:
    在内容页中修改母版页中的内容
    mssql分页
    .net 时间格式(转)
    EnableViewState详细分析
    .net自带的邮件发送类
    只有在配置文件或 Page 指令中将 enableSessionState”的异常解决办法
    web.config配置
    Web.config配置文件详解(转载)
    [Resume]:Resume(English)
    Observer Pattern, Delegate and Event
  • 原文地址:https://www.cnblogs.com/ningxinjie/p/10972817.html
Copyright © 2011-2022 走看看