zoukankan      html  css  js  c++  java
  • urllib基础

    python爬虫,突然想学一学,导入urllib后开始愉快地玩耍。 https://httpbin.org 是开发者测试网站,调试向服务器请求的代码。

    import urllib.request
    import urllib.parse
    import ssl
    
    ssl._create_default_https_context = ssl.SSLContext
    
    
    def main():
        req = urllib.request.Request('https://httpbin.org/post')    # 请求url
        req.add_header('User-Agent',    # 更改请求方从python到browser
                       'Mozilla/6.0 (iPhone; CPU iPhone OS 8_0 like Mac OS X) AppleWebKit/536.26'
                       ' (KHTML, like Gecko) Version/8.0 Mobile/10A5376e Safari/8536.25')
        data = bytes(urllib.parse.urlencode({"hello": "world"}), encoding="utf-8")  # post提交的信息
        response = urllib.request.urlopen(req, data=data)   # 打开url并提交data
        print('Status:', response.status, response.reason)  # 返回状态码
        print(response.read().decode("utf-8"))  # 返回响应体
        for k, v in response.getheaders():  # 返回响应头
            print('%s: %s' % (k, v))
    
    
    if __name__ == '__main__':
        main()
  • 相关阅读:
    每天一个命令
    2017-2-21
    egrep []+ 和awk总结
    ifconfig eth0 取行取列
    stat /etc/hosts 取行取列644
    压缩解压缩
    目录
    公告
    To do list
    CSP 2019 游记
  • 原文地址:https://www.cnblogs.com/faded828x/p/14646193.html
Copyright © 2011-2022 走看看