Selenium
Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,Selenium测试直接运行在浏览器中,就像真正的用户在操作一样,可以按指定的命令自动操作,是Selenium 可以直接运行在浏览器上,它支持Mozilla Firefox、Safari、Google Chrome、Opera、IE等主流的浏览器。
Selenium 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。
Selenium在执行时,需要安装对应浏览器的驱动,运行脚本时先调用对应浏览器驱动,驱动控制浏览器进行操作,原理图如下:
元素定位八种方式:
id:唯一的
name:元素的名称
class name:元素的类名
tag name:标签,不推荐,重复率太高
link text:文本链接
partial link text:对文本链接的一种补充
xpath:相对/绝对路径
css selector:css定位
1.通过id或name定位
<input type="text" class="s_ipt" name="wd" id="kw" maxlength="100" autocomplete="off">
通过元素所带的id和name属性对元素定位:
brower.find_element_by_id("kw")
brower.find_element_by_name("wd")
2.通过class name或tag name定位
<div class="jstEditor">
<textarea cols="60" rows="10" accesskey="e" class="wiki-edit" name="issue[description]" id="issue_description">
</textarea>
</div>
通过元素中带的class属性定位
brower.find_element_by_class_name("iki-edit")
通过元素中的tag标签定位,这种定位方式极不靠谱,不推荐采取此种方式。
brower.find_element_by_tag_name("div")
附加说明,如果class属性含有空格,那么取其中一个不重复的字段就可以了,例子:
<a title="新建版本" tabindex="200" class="icon-only icon-add" data-remote="true" data-method="get" href="/projects/bk_community/versions/new">新建版本</a>
其中class的属性值为“icon-only icon-add”,取其中“icon-only”、“ icon-add”都可以,但最好是取其中唯一的。
brower.find_element_by_class_name("icon-add")
3.通过linktext和partiallink text定位
<a href="http://news.baidu.com" target="_blank" class="mnav">新闻</a>
通过text link定位元素
brower.find_element_by_link_text("新闻")
通过partial link text定位元素,当文字链接很长时,可以通过此方式取其中一部分,只要取的部分可以作为唯一标识。
brower.find_element_by_partial_link_text("新")
4.xpath定位
调用的方法为:
brower.find_element_by_xpath("/html/body/div[1]/div/div[2]/ul/li[2]")
也可以通过相对路径自行填写,例如:
//*[@id="su"]/form/span/input #通过上三级目录的id属性定位
5.CSS定位
css定位有点麻烦,方法很多。以百度输入框html代码为例:
<input type="text" class="s_ipt" name="wd" id="kw" maxlength="100" autocomplete="off">
#定义浏览器
from selenium import webdriver
browser = webdriver.Chrome()
browser.get("https://www.baidu.com/")
#css通过id属性定位,用#号表示id属性
browser.find_element_by_css_selector("#kw").send_keys("css通过id属性定位")
#css通过class属性定位,用.表示class属性
browser.find_element_by_css_selector(".s_ipt").clear()
#通过标签定位
#css通过标签属性定位,无任何标识符,最好加上一个固定属性,否则会出错
browser.find_element_by_css_selector("input[class=s_ipt]").send_keys("css通过标签属性定位")
browser.find_element_by_css_selector("input#kw").send_keys("css通过标签属性定位")
#通过其他属性定位
#css通过其他属性定位
browser.find_element_by_css_selector("[name='wd']").send_keys("css通过name属性定位")
browser.find_element_by_css_selector("[autocomplete='off']").clear()
#通过css层级关系定位,以百度为例
#定位代码:
#css层级关系
browser.find_element_by_css_selector("form#form>span>input").send_keys("通过层级定位")
browser.find_element_by_css_selector("form.fm>span>input").clear()
#通过css索引定位
#定位代码:
#通过css索引定位
browser.find_element_by_css_selector("select.pagination-page-list>option:nth-child(1)").click