zoukankan html css js c++ java

python爬虫使用requests请求无法获取网页元素时终极解决方案

　　　　爬取数据时，有时候会出现无法通过正常的requests请求获取网页内容，导致数据无法抓取到，遇到这种情况时，可以换种思路去爬取数据，使用PhantomJS，即爬虫终极解决方案去获取页面元素。

#!/usr/local/bin/python3.7

from selenium import webdriver
import time

# phantomJS路径
path = '/Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs'
# 创建浏览器对象
browser = webdriver.PhantomJS(path)

# 打开百度并操作
url = 'https://www.baidu.com'
browser.get(url)
time.sleep(1)
# 截图
browser.save_screenshot('Reptile/phantomjs_img/baidu.png')
# 定位搜索框
search = browser.find_element_by_id('kw')
time.sleep(1)
# 在搜索框输入内容
search.send_keys('美女')
time.sleep(1)
# 截图
browser.save_screenshot('Reptile/phantomjs_img/meinv.png')
# 关闭浏览器
browser.quit()

查看全文

相关阅读:
POJ 2019
POJ 3368
POJ 3264
POJ 2828
POJ 3481
结构光相移法-多频外差原理+实践（上篇）
基于MAP-MRF的视差估计
 重磅直播|计算深度分割技术的实现与全局效应下的结构光三维重建
 用于类别级物体6D姿态和尺寸估计的标准化物体坐标空间
 通过几道CTF题学习Laravel框架

原文地址：https://www.cnblogs.com/lxmtx/p/13126534.html