zoukankan      html  css  js  c++  java
  • urllib2下载网页的三种方法

    1.最直接的方法

    #-*- coding: utf-8 -*-
    import urllib2
    #直接请求
    response = urllib2.urlopen('https://www.baidu.com')
    #获取状态码,如果是200,表示获取成功
    print response.getcode()
    print(response.read())
    View Code

    2.添加data、http header

    #-*- coding: utf-8 -*-
    import urllib2
    #创建request对象
    url = 'http://www.baidu.com'
    request = urllib2.Request(url)
    #添加数据
    request.add_data('a''1')
    
    #添加http的header
    request.add_header('User-Agent','Mozilla/5.0')
    #发送请求获取结果
    response = urllib2.urlopen(request)
    print(response.read())
    View Code

    3.添加特殊情景的处理器

    #-*- coding: utf-8 -*-
    import urllib2
    import cookielib
    #创建cookie容器
    cj = cookielib.CookieJar()
    #创建一个opener
    opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
    #给urllib2安装opener
    urllib2.install_opener(opener)
    #使用带有cookie的urllib2访问网页
    response = urllib2.urlopen('https://www.baidu.com')
    print(response.read())
    View Code
  • 相关阅读:
    ORACLE的自定义排序
    PDA上一个UDP通讯客户端
    构造
    sort()的使用
    VC2012链接mySql
    宏的一些代码
    试卷
    疑问
    代码1
    vector学习
  • 原文地址:https://www.cnblogs.com/XYJK1002/p/5313498.html
Copyright © 2011-2022 走看看