zoukankan html css js c++ java

Python爬虫之selenium各种注意报错

刚刚写完第一个selenuim+BeautifulSoup实战爬虫爬淘宝。发现代码写完后不加for 翻页的时候没什么问题解析操作都没问题也就是说第一页的内容完好

 1   pagebtn=wait .until(EC.presence_of_element_located((By.CSS_SELECTOR, "#mainsrp-pager > div > div > div > div.form > span.btn.J_Submit")))
 2           soup=BeautifulSoup(browser.page_source,'lxml')
 3           info=soup.find(attrs={'id':'mainsrp-itemlist'})
 4           imglist=info.find_all(attrs={'class':'J_ItemPic img'})
 5           pricelist=info.find_all('strong')
 6           locationlist=info.find_all(attrs={'class':'location'})
 7           shopnamelist=info.find_all(attrs={'class':'shopname J_MouseEneterLeave J_ShopInfo'})
 8           for imgsrcname,price,location, shopname in zip(imglist,pricelist,locationlist, shopnamelist):
 9               data={}
10               data={
11                   'name':imgsrcname.attrs['alt'],
12                   'imgsrc':imgsrcname.attrs['src'],
13                   'prick':price.get_text(),
14                   'location':location.get_text(),
15                   'shopname':shopname.contents[3].get_text()
16               }
17               collection.insert(data)
18 
19           pagebtn.click()

运行完好数据库也有数据

可是需要频繁点击翻页的时候

对于刚刚学习的人一大串英文显然看不懂百度翻译查

检查代码，

也加了等待啊显示等待

为什么还是报错

说实话我不知道，，

在前面+了一个sleep（5）让他慢点操作就可以了完美翻页100

总结：

我觉得在使用selenuim的时候尽可能的少操作网页（输入，点击），尽量模拟人的行为机器运行太快浏览器可能反应不过来。

查看全文

相关阅读:
exp 和imp 与expdp / impdp 区别
 nginx优化
 nginx root alias proxypass
mysql3
logrotate 用法
 SQL执行顺序
 http与RPC的关系
 docker
windows 时间同步
 Java生成指定长度的随机字符串

原文地址：https://www.cnblogs.com/ruogu/p/9573351.html