zoukankan      html  css  js  c++  java
  • 第1课-urlib

    1、urllib库

        request模块:
           1、发送请求:request.urlopen(url);
           2、下载网页:request.urlretrieve(url);
           3、代理模块:ProxyHandler
               1、使用proxyHandler,传入代理构建一个handler
               handler = request.ProxyHandler({"http":"136.228.128.14:61158"})
               2、使用上面创建的handler构建一个opener
               opener = request.build_opener(handler)
               3、使用opener去发送一个请求
               resp = opener.open(url)
         parse模块:
               1、url加密:parse.urlencode(dict);
               2、url解密:parse.parse_sq(str);
               3、域名解析:parse.urlsplit(url)

    2、带header及data的请求发送
        my_request = request.Request(url,headers,data=parse.urlencode(data).encode("utf-8"),method="POST")
        resp = request.urlopen(my_request)
        resp.read().decode("utf-8")

    3、from http.cookiejar import CookieJar(使用cookie)
        1、使用cookie
        cookie_jar = CookieJar()
        handler = request.HTTPCookieProcessor(cookie_jar)
        opener = request.build_opener(handler)
        req = request.Request(url=login_url,data=parse.urlencode(data).encode("utf-8"),headers=headers,method="POST")
        opener.open(req)
        2、请求需要cookie认证的接口
        req1 = request.Request(url=dapeng_url,headers=headers,data=parse.urlencode(data).encode("utf-8"),method="POST")
        resp = opener.open(req1)
        3、保存网页
        with open("dapeng.html","w",encoding="utf-8") as fp:
        fp.write(resp.read().decode("utf-8"))


  • 相关阅读:
    计数器应用-数据清洗案例
    Map Join实战案例
    Reduce Join实战案例
    自定义OutputFormat代码实现
    Golang的序列化-RPC和GRPC
    jetty服务器的安装和部署、新增到开机启动服务
    myeclipse不编译解决方法
    MyEclipse从数据库反向生成实体类之Hibernate方式 反向工程
    MyEclipse自动生成hibernate实体类和配置文件攻略
    eclipse从数据库逆向生成Hibernate实体类
  • 原文地址:https://www.cnblogs.com/win0211/p/11956718.html
Copyright © 2011-2022 走看看