zoukankan      html  css  js  c++  java
  • python3中urllib的基本使用

    urllib

      在python3中,urllib和urllib2进行了合并,现在只有一个urllib模块,urllib和urllib2的中的内容整合进了urllib.request,urlparse整合进了urllib.parse

    urlparse  将urlstr解析成各个组件

    复制代码
    # -*- coding:utf-8 -*-
    import urllib.request
    import urllib.parse
    url = "http://www.baidu.com"
    parsed = urllib.parse.urlparse(url)
    print(parsed)
    #输出:ParseResult(scheme='http', netloc='www.baidu.com', path='', params='', query='', fragment='')
    复制代码

    urljoin(baseurl,newurl,allowFrag=None)  将url的根域名和新url拼合成一个完整的url

    import urllib.parse
    url = "http://www.baidu.com"
    new_path = urllib.parse.urljoin(url,"index.html")
    print(new_path)
    #输出:http://www.baidu.com/index.html

    urlopen(url,data,timeout)  打开一个url的方法,返回一个文件对象,然后可以进行类似文件对象的操作

    import urllib.request
    req = urllib.request.urlopen('http://www.baidu.com')
    print(req.read())

      read() , readline() , readlines() , fileno() , close() 

      info():返回一个httplib.HTTPMessage 对象,表示远程服务器返回的头信息。

      getcode():返回Http状态码,如果是http请求,200表示请求成功完成;404表示网址未找到。

      geturl():返回请求的url。

    urlretrieve(url,filename,reporthook,data)  下载url定位到的html文件,不写路径filename则会被存为临时文件可以用 urllib.urlcleanup() 来清理缓存

    file_name = urllib.request.urlretrieve('http://www.baidu.com','%s/baidu.html'%BASE_DIR)

    urlencode()   将dict中的键值对以连接符&划分

    import urllib.parse
    dic = {'name':'melon','age':18}
    data = urllib.parse.urlencode(dic)
    
    print(data)     #age=18&name=melon

    GET请求

      GET请求 和我们平常get访问方式一样,直接把参数写到网址上面就好了

    复制代码
    import urllib.request
    import urllib.parse
    
    dic = {'name':'melon','age':18}
    data = urllib.parse.urlencode(dic)
    
    req = urllib.request.urlopen('http://127.0.0.1:8000/index?%s'%data)
    content = req.read()
    复制代码

    POST请求

    复制代码
    import urllib.request
    import urllib.parse
    import json
    
    dic = {'name':'melon','age':18}
    data = urllib.parse.urlencode(dic)
    
    req = urllib.request.Request('http://127.0.0.1:8000/index', data.encode())
    opener = urllib.request.urlopen(req)
    content = json.loads(opener.read().decode())
    复制代码

    当你 urllib.urlopen一个 https 的时候会验证一次 SSL 证书,当目标使用的是自签名的证书时就会出现一个URLError,如果是这样可以在开头加上

    import ssl
    ssl._create_default_https_context = ssl._create_unverified_context
  • 相关阅读:
    [HNOI2006]超级英雄
    [CTSC1999]家园
    火星探险问题
    [HNOI2008]GT考试
    [USACO14DEC]后卫马克Guard Mark
    [NOI2018]归程
    [USACO15DEC]最大流Max Flow
    [NOIPlus]斗地主
    [LUOGU] P3128 [USACO15DEC]最大流Max Flow
    [BZOJ] 1878: [SDOI2009]HH的项链
  • 原文地址:https://www.cnblogs.com/ExMan/p/9807158.html
Copyright © 2011-2022 走看看