zoukankan      html  css  js  c++  java
  • python 的requests如何使用代理

    headers.py

    import random
    
    first_num = random.randint(55, 62)
    third_num = random.randint(0, 3200)
    fourth_num = random.randint(0, 140)
    
    
    class FakeChromeUA:
        os_type = [
                    '(Windows NT 6.1; WOW64)', '(Windows NT 10.0; WOW64)', '(X11; Linux x86_64)',
                    '(Macintosh; Intel Mac OS X 10_12_6)'
                   ]
    
        chrome_version = 'Chrome/{}.0.{}.{}'.format(first_num, third_num, fourth_num)
    
        @classmethod
        def get_ua(cls):
            return ' '.join(['Mozilla/5.0', random.choice(cls.os_type), 'AppleWebKit/537.36',
                             '(KHTML, like Gecko)', cls.chrome_version, 'Safari/537.36']
                            )
    
    
    headers = {
        'User-Agent': FakeChromeUA.get_ua(),
        'Accept-Encoding': 'gzip, deflate, sdch',
        'Accept-Language': 'zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3',
        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
        'Connection': 'keep-alive'
    }
    

      1.首选定义session

       

    import requests
    session=requests.Session()
    

    2.proxy的格式

    proxies的格式如下

    用户名username、 密码password、 代理地址hogehoge.proxy.jp、 端口号8080 

    proxy_dict = {
        "http": "http://username:password@hogehoge.proxy.jp:8080/",
        "https": "http://username:password@hogehoge.proxy.jp:8080/"
    }

    3.接上开始设置headers和url

    url="http://www.baidu.cpom"
    headers=headers(headers.py的字典)
    req=session.get(url,headers=headers,proxies=proxy_dict)
    

      

  • 相关阅读:
    关于unittest框架的传参问题
    爬虫的框架:Scarpy
    Robot Frameworke在python3上搭建环境以及快捷方式的创建
    安装第三方模块报错:read time out
    操作正则表达式遇到的问题
    gil锁 线程队列 线程池
    并发编程
    网络编程传输文件
    粘包现象
    UDP协议下的socket
  • 原文地址:https://www.cnblogs.com/c-x-a/p/8951794.html
Copyright © 2011-2022 走看看