zoukankan      html  css  js  c++  java
  • urllib发送请求

    from urllib import request
    
    url = "http://www.baidu.com"
    res = request.urlopen(url) # 获取相应
    
    print(res.info()) # 响应头
    print(res.getcode()) # 状态码
    print(res.geturl()) # 返回响应地址

    输出结果为:

    from urllib import request
    
    url = "http://www.baidu.com"
    res = request.urlopen(url) # 获取相应
    
    html = res.read()
    html = html.decode("utf-8")
    print(html)

    上面这种方式是最初级的,没有考虑任何反爬机制,换个网站就行不通了

    from urllib import request
    
    url = "http://www.dianping.com"
    res = request.urlopen(url) # 获取相应
    
    print(res.info()) # 响应头
    print(res.getcode()) # 状态码
    print(res.geturl()) # 返回响应地址

    最基础的措施为添加header,可以输入F12,在network选项中的Request Headers找到

    找到后,给User-Agent添加引号,对冒号后面的部分也添加引号,然后写入header变量中

    再通过request.Request(url,headers=header)来发送请求

    # 添加header信息,这是最基本的反爬措施
    url = "http://www.dianping.com"
    header = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3741.400 QQBrowser/10.5.3863.400"
    }
    req = request.Request(url,headers=header)
    res = request.urlopen(req) # 获取响应
    
    print(res.info()) # 响应头
    print(res.getcode()) # 状态码
    print(res.geturl()) # 返回响应地址

  • 相关阅读:
    MySQL语法
    Linux常用命令大全
    触发器使用UTL_SMTP包发送邮件
    MySQL——触发器的创建和使用总结
    MySQL数据库备份
    Nginx配置文件(nginx.conf)配置详解
    JS弹出框,打开文件,保存文件,另存为。。。。
    java excel两种操作方式
    Zookeeper的优缺点
    activemq linux安装
  • 原文地址:https://www.cnblogs.com/cyx-b/p/12996705.html
Copyright © 2011-2022 走看看