此前使用webdriver对浏览器进行了一些基本操作,可以说是基本接触了这个工具了,接下来就应该做更多事情了。
打开了网页,接下来就需要对网页中的内容进行操作了,例如定位网页中的元素、读取网页元素中的内容、对内容进行操作。
定位元素
selenium提供了多种方式进行定位元素: find_element_by_*
1 find_element_by_id 2 find_element_by_name 3 find_element_by_xpath 4 find_element_by_link_text 5 find_element_by_partial_link_text 6 find_element_by_tag_name 7 find_element_by_class_name 8 find_element_by_css_selector
当然也可以一次定位多个元素: find_elements_by_*
1 find_elements_by_name 2 find_elements_by_xpath 3 find_elements_by_link_text 4 find_elements_by_partial_link_text 5 find_elements_by_tag_name 6 find_elements_by_class_name 7 find_elements_by_css_selector
因为id是唯一的,所以一次定位多个元素是没有办法通过id进行定位的。
同样,可以通过 find_element 和 find_elements ,不过使用之前需要导入by类, from selenium.webdriver.common.by import By 。
# coding = utf-8 import time from selenium import webdriver from selenium.webdriver.common.by import By driver = webdriver.Chrome() # 打开一个网页 driver.get("https://www.zhihu.com/") # 查找一个元素的方法 ele = driver.find_element_by_xpath( '//*[@id="root"]/div/div[2]/header/div/nav/a[2]') ele.click() # 点击已定位的元素 driver.back() # 退回 time.sleep(5) ele = driver.find_element( By.XPATH, '//*[@id="root"]/div/div[2]/header/div/nav/a[2]') # ID = "id" # XPATH = "xpath" # LINK_TEXT = "link text" # PARTIAL_LINK_TEXT = "partial link text" # NAME = "name" # TAG_NAME = "tag name" # CLASS_NAME = "class name" # CSS_SELECTOR = "css selector" ele.click() driver.back() # 查找多个元素的方法 eles = driver.find_elements_by_class_name("Feed") print(eles) print(len(eles)) time.sleep(5) eles = driver.find_elements(By.CLASS_NAME, 'Feed') # XPATH = "xpath" # LINK_TEXT = "link text" # PARTIAL_LINK_TEXT = "partial link text" # NAME = "name" # TAG_NAME = "tag name" # CLASS_NAME = "class name" # CSS_SELECTOR = "css selector" print(eles) print(len(eles)) driver.quit()
以上就是定位元素的一些方法。说明下xpath是比较好用的方式,之后可以多多练习使用xpath进行定位元素。