zoukankan      html  css  js  c++  java
  • Python爬虫教程-11-proxy代理IP,隐藏地址(猫眼电影)

    Python爬虫教程-11-proxy代理IP,隐藏地址(猫眼电影)

    ProxyHandler处理(代理服务器),使用代理IP,是爬虫的常用手段,通常使用UserAgent 伪装浏览器爬取仍然可能被网站封了IP,但是我们使用代理IP就不怕它封了我们的IP了

    获取代理IP的的网站:

    • www.goubanjia.com
    • www.xicidaili.com
    • 使用代理来隐藏真实访问中,代理也不允许频繁访问某一个固定网站,所以,代理一定要很多很多
    • 需要使用,从上面的网站拷贝

    基本使用步骤:

    # 使用代理服务器访问猫眼
    # https://maoyan.com/
    from urllib import request,error
    
    if __name__ == '__main__':
    
        url = "https://baidu.com/"
    
        # 1.设置代理地址
        proxy = {'http': '218.60.8.83:3129'}
        # 2.创建ProxyHandler
        proxy_handler = request.ProxyHandler(proxy)
        # 3.创建Opener
        opener = request.build_opener(proxy_handler)
        # 4.安装Opener
        request.install_opener(opener)
    
        # 下面再进行访问url就会使用代理服务器
        try:
            rsp = request.urlopen(url)
            html = rsp.read().decode()
            print(html)
    
        except error.HTTPError as e:
            print(e)
    
        except Exception as e:
            print(e)
    

    运行结果

    这里写图片描述
    关于爬虫使用代理服务器,使用代理IP,就介绍到这里了,使用代理IP是爬虫的常用手段,好处多多

    更多文章链接:Python 爬虫随笔


    - 本笔记不允许任何个人和组织转载
  • 相关阅读:
    Easyui 表格底部加合计
    jQuery设置checkbox 为选中状态
    HTML 列表中的dl,dt,dd,ul,li,ol区别
    jQuery的toggle事件
    EasyUI 的日期控件单击文本框显示日历
    HTML设置span宽度
    JQuery获取与设置select
    生命周期
    钩子函数
    组件
  • 原文地址:https://www.cnblogs.com/xpwi/p/9600727.html
Copyright © 2011-2022 走看看