zoukankan      html  css  js  c++  java
  • 【Rollo的Python之路】Python 爬虫系统学习 (五) Selenium

    Selenium 与 PhantomJS  

    selenium:[səˈliːniəm]:# n. 硒(化学元素,用于制造电气设备和有色玻璃,人体缺此元素可致抑郁等病)
    phantom:[ˈfæntəm] :# n. 鬼; 鬼魂; 幽灵; 幻觉; 幻象; adj. 像鬼的; 幽灵似的; 幻觉的; 幻象的; 虚幻的
    • Selenium

    Selenium 是一个web的自动化测试工具,最初是为了网站自动化测试而开发的,Selenium可以直接运行在浏览器上,它支持所有主流的(包括PhantomJS这些无界面的浏览器),可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏。

    • PhantomJS

    PhantomJS 是一个基于webkit的“无界面”(headless)浏览器,它会把网站加载到内存并执行页面上的JaveScript

    1.0.1 Selenium 加载网页:

    from selenium import webdriver
    driver = webdriver.PhantomJS()
    driver.get()
    driver.save_screenshot("baidu.png")

     

    1.0.2 Selenium 定位和操作:

    driver.find_element_by_id("kw")
    driver.find_element_by_id("kw").send_keys("python")
    dirver.find_element_by_id("su").click()

     

    1.0.3 Selenium 查看请求信息:

    driver.page_source
    driver.get_cookies()
    driver.current_url
    
    #列表生成式
    
    {i["name"]:i["value"] for i in cookies }

    1.0.4 Selenium 退出:

    driver.close() #退出当前页面
    driver.quit() #退出浏览器

    中文文档:https://selenium-python-zh.readthedocs.io/en/latest/getting-started.html

  • 相关阅读:
    JQuery的常用方法
    Javascript的一些奇技淫巧 持续更新
    jQuery调用ASP.NET的WebService
    jquery easy ui 分页
    EF里查看/修改实体的当前值、原始值和数据库值
    oracle 游标变量ref cursor详解
    分页存储过程2
    分页存储过程
    取得HTML中所有图片的 URL 正则表达式
    Javascript跨域访问解决方案
  • 原文地址:https://www.cnblogs.com/rollost/p/11100109.html
Copyright © 2011-2022 走看看