zoukankan      html  css  js  c++  java
  • Python 获取 html 网页内容

    一篇基础文章,不讲爬虫。单纯的获取标签元素的值、操作网页。
    用到了 selenium 包。 这个包需要给浏览器安装驱动,不同的浏览器需要的驱动不同。环境搭建参考:https://blog.csdn.net/weixin_36279318/article/details/79475388
    需要注意,windows版本的驱动文件.exe需要放在python.exe所在的目录下,环境变量才能生效(别问我为什么,我也不知道 (✪ω✪))
    在这里插入图片描述

    代码:

    from selenium import webdriver
    from selenium.webdriver.common.action_chains import ActionChains
    from time import sleep
    
    # 打开火狐浏览器
    browser=webdriver.Firefox()
    
    # 打开百度首页
    browser.get("https://www.baidu.com/")
    
    # 获取'新闻'超链接中的文字 3种方法
    print(browser.find_element_by_name("tj_trnews").text)
    print(browser.find_element_by_xpath("//*[@name='tj_trnews']").text)
    print(browser.find_element_by_css_selector("div#u1 > a")[1].text)
    
    # 在输入框输入'hello world'
    browser.find_element_by_id("kw").send_keys("hello world")
    
    # 点击'百度一下'按钮
    browser.find_element_by_id("su").click()
    
    # 清除搜索框内容
    browser.find_element_by_id("kw").clear()
    
    # 调用js代码
    js="alert('hello world');"
    browser.execute_script(js)
    
    # 关闭浏览器
    sleep(1)
    browser.quit()
    
  • 相关阅读:
    团队作业(9)
    团队作业(8)
    团队作业(7)
    团队作业(6)
    团队作业(5)
    团队作业(4)
    团队作业(3)
    05数据爬去
    02周总结
    04结对开发
  • 原文地址:https://www.cnblogs.com/csnd/p/15613636.html
Copyright © 2011-2022 走看看