在使用selenium+爬虫的时候,经常会遇到一个问题,就是NoSuchElementException,定位不到元素的问题
一,打开了新页面,一般selenium点击新链接跳转打开了一个新页面,那么定位不到元素就很正常了,这种情况一般我们使用driver.get(url)来代替click(),dirver.get(url)就不会打开信的界面,而是在原来的浏览器上刷新了页面
二,frame,如果说一个页面里有frame或者iframe的话,也会定位不到元素,这种我们要switch_to.frame(),先跳转到要定位的元素所在的frame上,才能进一步定位
三,动态的id或者xpath,这种很隐蔽,我之前使用driver.find_element_by_xpath()一直定位不到元素,后来发现xpath是动态的,最后使用了find_element_by_css_selector定位到了,还有的情况是xpath绝对定位不到,可以使用xpah的相对定位。/html/body/div[2]/div[1]/div/div[3]/a[7]这是绝对定位,如果中间的元素有变动或者隐藏了,那么它就没法定位到。r'//*[@id ='ul' ]/a[7]'这个是相对定位,结合了id定位,这种定位就比较精准。
四,对话框的话,分为两大类,第一类就是一个隐藏的div绑定的click点击事件,这种情况直接用id或者name定位就可以了。第二类是alert或者confirm这种windows对话框,这种对话框,要通过switch_to_alert.accept()或者swicth_to_alert.dismiss()这种处理。
五,等待时间不够,页面还没加载出来。
下面举个例子,selenium模拟登陆百度登陆对话框
# coding=utf-8 from selenium import webdriver import time obj = webdriver.Firefox() obj.get('https://www.baidu.com/') obj.find_element_by_xpath(r'//*[@id="u1"]/a[7]').click() time.sleep(1) obj.find_element_by_id('TANGRAM__PSP_10__footerULoginBtn').click() # obj.find_element_by_class_name('tang-content').find_element_by_name('userName').send_keys('1712256304') obj.find_element_by_id('TANGRAM__PSP_10__userName').send_keys('12341241') obj.find_element_by_id('TANGRAM__PSP_10__password').send_keys('123423') obj.find_element_by_id('TANGRAM__PSP_10__submit').click()