zoukankan html css js c++ java

Python 获取 html 网页内容

一篇基础文章，不讲爬虫。单纯的获取标签元素的值、操作网页。
用到了 selenium 包。这个包需要给浏览器安装驱动，不同的浏览器需要的驱动不同。环境搭建参考：https://blog.csdn.net/weixin_36279318/article/details/79475388
需要注意，windows版本的驱动文件.exe需要放在python.exe所在的目录下，环境变量才能生效（别问我为什么，我也不知道 (✪ω✪)）
在这里插入图片描述

代码：

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from time import sleep

# 打开火狐浏览器
browser=webdriver.Firefox()

# 打开百度首页
browser.get("https://www.baidu.com/")

# 获取'新闻'超链接中的文字 3种方法
print(browser.find_element_by_name("tj_trnews").text)
print(browser.find_element_by_xpath("//*[@name='tj_trnews']").text)
print(browser.find_element_by_css_selector("div#u1 > a")[1].text)

# 在输入框输入'hello world'
browser.find_element_by_id("kw").send_keys("hello world")

# 点击'百度一下'按钮
browser.find_element_by_id("su").click()

# 清除搜索框内容
browser.find_element_by_id("kw").clear()

# 调用js代码
js="alert('hello world');"
browser.execute_script(js)

# 关闭浏览器
sleep(1)
browser.quit()

查看全文

相关阅读:
一行代码搞定图片缩放、旋转、加水印
 如何学习 Webpack
Webpack 概念
 Webpack 入门
 asp.net core教程（一）
asp.net core教程（二）
ap.net core 教程（三）
Grafana 安装配置
 zabbix-3.0.x LTS源码安装配置
 MariaDB Security

原文地址：https://www.cnblogs.com/csnd/p/15613636.html