zoukankan      html  css  js  c++  java
  • Python+Selenium+Chrome 的一个案例

    第一步,下载chromeDrive:http://npm.taobao.org/mirrors/chromedriver(我下载的是2.43版本的chromedriver_win32.zip)

    下载之后,把chromedriver.exe 解压到安装JetBrains PyCharm 2018.2.4 x64的路径下。

    第二步,在JetBrains PyCharm 2018.2.4 x64 工具中下载selenium库,具体如何下载,请看我的博客"JetBrains PyCharm 2018.2.4 x64 工具里如何安装bs4"。

    第三步:自动打开chrome浏览器

    from selenium import webdriver
    from selenium.webdriver.common.keys import Keys
    
    dest = r"F:pythonchromedriver.exe"  #chromedriver本地保存的路径
    '''
    实例化webdriver时,可以通过参数对浏览器做些设置,如设置网络代理、浏览器下载文件保存路径等。若是不传参数,则默认继承本地浏览器设置,
    若是对浏览器启动时属性进行设置,则就利用到了ChromeOption类。具体信息可参考chromedriver官网。“Python+Selenium+第三方浏览器”可以处理多种爬虫场景,
    包括静态页面,post表单,以及JS等。应用场景很强大,使用selenium操作浏览器进行模拟点击的方式就可以让我们省心很多,不需要担心有什么“隐藏字段”、cookie追踪等。
    但对于包含验证码网页的操作,这种方式也不好处理,主要困难在于图像识别。若是页面包含验证码,那就需要结合图像识别工具了,
    这种情况相对也比较难处理,图像识别准确率受到图片内容影响。
    '''
    def init_webdriver(proxy=False):
    ''' 设置浏览器默认下载路径 '''
    PROXY ="x.x.x.x;8080"
    options
    =webdriver.ChromeOptions()
    options.add_experimental_option(
    "prefs", { "download.default.directory": r"F:pythondownload", "safebrowsing.enabled":True })
    if proxy:
    options.add_argument(
    '--proxy-seerver=%s'% PROXY)
    driver
    = webdriver.Chrome(executable_path=dest, chrome_options=options)
    return driver

    if __name__ == "__main__":
    browser_driver
    =init_webdriver(True)
    browser_driver.get(
    "https://connect.microsoft.com/site1304/Downloads")
    print ("客户端会完成重定向,跳转到登录界面")

    if "login." in browser_driver.current_url:
    print("获取登录框元素")
    elem
    = browser_driver.find_element_by_name("loginfmt")
    print("清空登录框内容")
    elem.clear()
    print("在账户框中输出账号,并回车,完成页面跳转")
    elem.send_keys(
    "current_key:"+Keys.RETURN)
  • 相关阅读:
    领域驱动设计精简版--阅读笔记
    ATM机的面向对象分析--笔记
    第一部分 Spring 基础
    spring in action 5 笔记--spring 实战 第4版和第5版对比
    Redis深度历险
    《Spring in action》之Spring之旅
    递归算法(java)
    java中static学习总结
    浅谈HookSSDT和和Resume(恢复)SSDT
    转---派遣例程与IRP结构
  • 原文地址:https://www.cnblogs.com/chendezhen/p/9909841.html
Copyright © 2011-2022 走看看