zoukankan      html  css  js  c++  java
  • urllib库添加headers的一般方法

    对于请求一些网站,我们需要加上请求头才可以完成网页的抓取,不然会得到一些错误,无法返回抓取的网页。下面,介绍两种添加请求头的方法。

    方法一:借助build_opener和addheaders完成

    复制代码
    1 import urllib.request
    2 url="http://www.meizitu.com"
    3 #注意:在urllib 中headers是元组
    4 headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE")
    5 
    6 opener=urllib.request.build_opener()
    7 opener.addheaders=[headers]
    8 data=opener.open(url)
    9 print(data.read())
    复制代码

    注意:此处的headers要写为一个元组类型才可以。写为字典类型的话会报错!

    方法二、创建一个Request实例对象

    复制代码
     1 # 案例1
     2 import urllib.request
     3 url="http://www.meizitu.com"
     4 #注意:在urllib 中这种的headers 是需要是字典的
     5 headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE"}
     6 req=urllib.request.Request(url=url,headers=headers)
     7 file=urllib.request.urlopen(req)
     8 
     9 #出现有些解码错误的话,加上“ignore”就可以啦
    10 print(file.read().decode("utf-8",'ignore'))
    复制代码
    • 注意:此处的headers要写为一个字典类型才可以。
    • 创建一个Reques对象,把需要的headers,url,proxy 都放进去,或者在post 请求中还可以把编码过后的data 值放进去,再用urlopen 打开,就比较方便了。

    另外,这种方法还可以用add_headers()来添加headers,代码如下:

    复制代码
     1 import urllib.request
     2 try:
     3     url="http://www.meizitu.com"
     4     
     5     req=urllib.request.Request(url=url)
     6  
     7     req.add_header("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36 QIHU 360SE")
     8     file=urllib.request.urlopen(req,timeout=10.1)
     9 
    10     print(file.read().decode("utf-8",'ignore'))
    11 except Exception as e:
    12     print("时间超时",str(e))

    总结:通过以上两种方法,可以完成请求头的相关参数设置,但是得注意headers是用字典类型来传入还是元组类型。

  • 相关阅读:
    Java Web学习总结(16)——JSP的九个内置对象
    Java Web学习总结(15)——JSP指令
    【我的物联网成长记11】8招带你玩转规则引擎
    云图说|高效管理华为云SAP的“秘密武器”
    Python 中更优雅的日志记录方案
    有了它,Python编码再也不为字符集问题而发愁了!
    【鲲鹏来了】手把手教你创造一个属于自己的鲲鹏开发者环境
    解密昇腾AI处理器--DaVinci架构(计算单元)
    使用Keil5构建GD32450i-EVAL工程
    云图说|SAP技术画册“一点通”
  • 原文地址:https://www.cnblogs.com/lincappu/p/12883519.html
Copyright © 2011-2022 走看看