zoukankan      html  css  js  c++  java
  • Python+Selenium学习--下载文件

    场景

    webdriver 允许我们设置默认的文件下载路径。也就是说文件会自动下载并且存在设置的那个目录中,下面以firefox及chrome为例

    代码

    Firefox下载

    为了让Firefox浏览器能实现文件下载,需要通过FirefoxProfile()对其做一些设置。

    browser.download.foladerList :设置成0代表下载到浏览器默认下载路径,设置成2则可以保存到指定的目录。

    browser.download.manager.showWhenStarting  :是否显示开始:True为显示开始,Flase为不显示开始。

    browser.download.dir :用于指定所下载文件的目录。

    os.getcwd()函数不需要传递参数。用于返回当前的目录。

    browser.helperApps.neverAsk.saveToDisk  :对所给文件类型不再弹出框进行询问。

    #!/usr/bin/env python
    # -*- codinfg:utf-8 -*-
    '''
    @author: Jeff LEE
    @file: firefox下载文件.py
    @time: 2018-09-26 16:07
    @desc:
    '''
    from selenium import webdriver
    import os,time
    
    fp = webdriver.FirefoxProfile()
    fp.set_preference("browser.download.folderList",0)
    fp.set_preference("browser.download.manager.showhenStarting",True)
    fp.set_preference("browser.download.dir",os.getcwd())
    fp.set_preference("browser.helperApps.neverAsk.saveToDisk","binary/octet-stream")#下载文件类型
    
    driver = webdriver.Firefox(firefox_profile = fp)
    driver.get("http://pypi.Python.org/pypi/selenium")
    driver.find_element_by_xpath("//a[@id='files-tab']").click()
    time.sleep(5)
    
    #选择下载文件
    driver.find_element_by_xpath("//a[contains(@href,'.tar.gz')]").click()
    time.sleep(30)
    
    driver.quit()
    

      

    Chrome下载

    download.default_directory:设置下载路径

    profile.default_content_settings.popups:设置为0禁止弹出窗口

    #!/usr/bin/env python
    # -*- codinfg:utf-8 -*-
    '''
    @author: Jeff LEE
    @file: chrome下载.py
    @time: 2018-09-26 16:32
    @desc:
    '''
    from selenium import webdriver
    import time
    
    options = webdriver.ChromeOptions()
    prefs = {'profile.default_content_settings.popups': 0, 'download.default_directory': 'd:\'}
    options.add_experimental_option('prefs', prefs)
    
    driver = webdriver.Chrome(executable_path='F:chromedriverchromedriver.exe', chrome_options=options)
    driver.get("http://pypi.Python.org/pypi/selenium")
    driver.find_element_by_xpath("//a[@id='files-tab']").click()
    time.sleep(5)
    
    #选择下载文件
    driver.find_element_by_xpath("//a[contains(@href,'.tar.gz')]").click()
    time.sleep(30)
    driver.quit()
    

      

  • 相关阅读:
    Go语言十六进制转十进制
    Go语言中底层数组和切片的关系以及数组扩容规则
    Golang超时机制--2秒内某个函数没被调用就认为超时
    约瑟夫环问题(猴子选大王)
    冒泡排序优化
    斐波那契数列
    Linux下使用acme.sh (Let's Encrypt) 配置https 免费证书
    git 本地分支指定对应的远程分支
    Git分支开发 -- 利用git pull命令将远程指定仓库的分支拉取到本地
    phpStorm 之 本地开发,Linux上跑项目(连接远端服务器开发)
  • 原文地址:https://www.cnblogs.com/uniquefu/p/9707800.html
Copyright © 2011-2022 走看看