zoukankan      html  css  js  c++  java
  • 解决网页元素无法定位(NoSuchElementException: Unable to locate element)的几种方法

    只解决一个问题--NoSuchElementException: Message: Unable to locate element

    出错原因

    1.可能元素加载未完成

    元素加载没完成,同样的路径定位,每次测试结果确是不一样的,有时候抛出错误,有时候正常!这就比较蛋疼了,也就是说,和你的定位方法半毛钱关系没有,而很大程度上取决于你的电脑和网速!

    1.解决方案A:添加两行代码

    wait = ui.WebDriverWait(driver,10)
    wait.until(lambda driver: driver.find_element_by_方法("定位路径自己来"))
    • 1
    • 2

    WebDriverWait(driver,10)的意思是;10秒内每隔500毫秒扫描1次页面变化,当出现指定的元素后结束。driver是前面操作webdriver.firefox()的句柄
    完整的小段代码是:

    from selenium import webdriver
    import selenium.webdriver.support.ui as ui
    
    driver_item=webdriver.Firefox()
    url="https://movie.douban.com/"
    wait = ui.WebDriverWait(driver_item,10)
    driver_item.get(url)
    wait.until(lambda driver: driver.find_element_by_xpath("//div[@class='fliter-wp']/div/form/div/div/label[5]"))
    driver_item.find_element_by_xpath("//div[@class='fliter-wp']/div/form/div/div/label[5]").click()

    1.解决方案B:使用while+try…except结合

    下面来个例子,完整的可运行代码如下:

    from selenium import webdriver
    import time
    import os
    
    driver_item=webdriver.Firefox()
    url="https://movie.douban.com/"
    driver_item.get(url)
    
    while 1:
        start = time.clock()
        try:
            driver_item.find_element_by_xpath("//div[@class='fliter-wp']/div/form/div/div/label[5]").click()
            print '已定位到元素'
            end=time.clock()
            break
        except:
            print "还未定位到元素!"
    
    print '定位耗费时间:'+str(end-start)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20

    运行结果如下:

    还未定位到元素!
    已定位到元素
    定位耗费时间:0.262649990301
    • 1
    • 2
    • 3

    分析

    开启页面后,并不是元素都一次性加载完成的,依赖于网速和电脑,从B方法中可见,所耗费的时间,还有一种静态的方法就是我以前常用的sleep,一般睡一秒就够了,但是对于不同电脑不同网速的情况,建议还是使用动态方法,也就是A方法,以变应变!

    从代码可读性上和效率上都是A方法比较好,更加符合python的特性,简洁优美,而B方法应该是我这样初学者自己能想到的一种方法,先得自己想解决方案,然后再参考现有方法,我感觉这样才有意义。


    2.本身定位方法错误

    这也就是最常见的了,也是最容易犯的错误,自己对元素定位方法不够熟练,就很容易错误了,所以多想想该怎么定位才最容易,我现在最喜欢的是用xpath方法定位,DOM树的结构挺清晰的,可能我还是新手的原因吧!

    2.解决方案

    多查询元素定位方法,多使用多熟练,吐槽一下正则。。。相比较正则,我还是更喜欢BeautifulSoup或者xpath来用,额。。。

    比方说,我要看看BeautifulSoup到底规则效果怎么样,那我会单独写个测试模块

    # -*- coding: utf-8 -*-
    from bs4 import BeautifulSoup
    import re
    #find_all() 和 find() 只搜索当前节点的所有子节点,孙子节点等.
    # find_parents() 和 find_parent() 用来搜索当前节点的父辈节点,
    # 搜索方法与普通tag的搜索方法相同,搜索文档搜索文档包含的内容
    
    html = """
    <html><head><title>The Dormouse's story</title></head>
    <body>
    <p class="title" name="dromouse"><b>The Dormouse's story</b></p>
    <p class="story">Once upon a time there were three little sisters; and their names were
    <a href="http://example.com/elsie" class="sister" id="link1"><!-- Elsie --></a>,
    <a href="http://example.com/lacie" class="sister" id="link2">Lacie</a> and
    <a href="http://example.com/tillie" class="sister" id="link3">Tillie</a>;
    and they lived at the bottom of a well.</p>
    <p class="story">...</p>
    """
    
    soup=BeautifulSoup(html,"lxml")
    #soup=BeautifulSoup(open('index.html'),"lxml")#若本身有html文件,则打开
    
    #print  soup.prettify()
    print soup.title
    print soup.a.string
    print soup.a['href']
    print soup.a['class']
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27

    这个我就做个比方,什么时候我要用BS4了我会单独测试下自己的规则好不好使,毕竟不是老司机。
    这里写图片描述


    Tips

    1.测试阶段调用Firefox来做,这样更加直观具体,到最后可以调用phantomjs.exe。

    2.分模块测试自己的idea,光想远远不够。

    3.最好有分屏的电脑,一屏显示代码,一屏显示实现过程


    总结

    遇到问题看来还是需要一步步来,分析各个模块之间的衔接性和模块完整性,单独把模块拿出来进行测试,不然一个比较大点的程序出错在哪都很费劲,而且,如果是自己写的程序,那么推荐一步步实现,哪一步该有哪一步的功能,这样逻辑才够清晰,这是写给自己的话,如果对你有帮助,我也感到很荣幸!

     
  • 相关阅读:
    js定义一个处理字符串的函数
    linux设置别名
    php对图片加水印--将图片先缩小,再在上面加水印
    php对图片加水印--将文字作为水印加到图片
    虚拟机非正常关闭,里面的服务器重启报错:Error, some other host already uses address
    php对图片加水印--将一张图片作为水印加到另一张图片
    Fatal error: Call-time pass-by-reference has been removed in *****.php on line 18
    php中array_walk() 和 array_map()两个函数区别
    nginx 代理转发 wcf接口
    js 日期格式化
  • 原文地址:https://www.cnblogs.com/lh459384111/p/8460771.html
Copyright © 2011-2022 走看看