随笔记录方便自己和同路人查阅。
#------------------------------------------------我是可耻的分割线-------------------------------------------
学习selenium自动化之前,最好先学习HTML、CSS、JavaScript等知识,有助于理解定位及操作元素的原理。关于python和selenium安装请自行搜索别的资料,
这里就不多做介绍了,所有例子均使用python3.6+selenium执行的。
如今大多数Web应用程序使用AJAX技术。当浏览器在加载页面时,页面上的元素可能并不是同时被加载完成的,这给元素的定位增加了困难。如果因为在加载某个元素时延迟而造成ElementNotVisibleException的情况出现,那么就会降低自动化脚本的稳定性,我们可以通过设置元素等待改善这种问题造成的不稳定。
WebDriver提供了两种类型的等待:显式等待和隐式等待。
#------------------------------------------------我是可耻的分割线-------------------------------------------
显示等待
显式等待使WebDriver等待某个条件成立时继续执行,否则在达到最大时长时抛弃超时异常(TimeoutException)。
from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Chrome() driver.get("http://www.baidu.com") element = WebDriverWait(driver,5,0.5).until( EC.presence_of_element_located((By.ID,"kw")) ) element.send_keys('selenium') driver.quit()
WebDriverWait类是由WebDriver提供的等待方法。在设置时间内,默认每隔一段时间检测一次当前页面元素是否存在,如果超过设置时间检测不到则抛出异常。具体格式如下:
WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_excptions=None)
driver:浏览器驱动。
timeout:最长超时时间,默认以秒为单位。
poll_frequency:检测的间隔(步长)时间,默认为0.5s。
ignored_exceptions:超时后的异常信息,默认情况下抛NoSunchElementException异常。
WebDriverWait()一般由until或until_not()方法配合使用,下面是until和until_not()方法的说明。
until(method,message=’’)#调用该方法提供的驱动程序作为一个参数,直到返回值为True。
until_not(method,message=’’)#调用该方法提供的驱动程序作为一个参数,直到返回值为False。
在本例中,通过as关键字将expected_conditions重命名为EC,并调用presence_of_element_located()方法判断元素是否存在。
expected_conditions类所提供的预期条件判断的方法如下表:
方法 |
说明 |
title_is |
判断当前页面的标题是否等于预期 |
title_contains |
判断当前页面的标题是否包含预期字符串 |
presence_of_element_located |
判断元素是否被加载DOM树里,并不代表该元素一定可见 |
visibility_of_element_located |
判断当元素是否可见(可见代表元素非隐藏,并且元素的宽和高都不等于0) |
visibility_o |
与上一个方法作用相同,只是上一个方法参数为定位,该方法接收的参数为定位后的元素 |
presence_of_all_elements_located |
判断是否至少有一个元素存在于DOM树种。例如,在个页面中的n个元素的class为”wp”,那么只要有一个存在就返回True |
text_to_be_present_in_element |
判断某个元素中的text是否包含了预期的字符串 |
text_to_be_present_in_element_value |
判断某个元素的valueshuxing 是否包含了预期的字符串 |
frame_to_be_available_and_switch_to_it |
判断该表单是否可以切换进去,如果可以,返回True并且switch进去,否则返回False |
invisible_of_element_located |
判断某个元素是否不存在于DOM树或不可见 |
element_to_he_clickable |
判断元素是否可见并且是可以点击的 |
staleness_of |
等到一个元素从DOM树种移除 |
element_to_be_selected |
判断某个元素是否被选中,一般用在下拉列表 |
element_selection_state_to_be |
判断某个元素的选中状态是否符合预期 |
element_located_selection_state_to_be |
与上一个方法作用相同,只是上一个方法参数为定位后参数,该方法接收的参数为定位参数 |
alert_is_present |
判断页面上是否存在alert |
除expected_conditions所提供的丰富的预期条件判断方法外,还可以使用前面学过的is_displayed()方法来判断元素是否可见。
from selenium import webdriver from time import sleep,ctime driver = webdriver.Chrome() driver.get("http://www.baidu.com") print(ctime()) for i in range(5): try: el = driver.find_element_by_id('kw22') if el.is_displayed(): break sleep(1) except: print("time out") pass driver.close() print(ctime())
结果展示:
相对来说,这种方式更容易理解,通过for循环5次,每次循环判断元素的is_displayed()状态是否为true,如果为true,则break跳出循环;否则sleep(1)后继续循环判断,打印”time out”信息。