zoukankan      html  css  js  c++  java
  • seleniium模块的基本使用

    一、selenium模块和爬虫之间具有怎样的关联

    • 便捷的获取网站中动态加载的数据
    • 便捷实现模拟登录

    二、什么是selenium模块

    基于浏览器自动化的一个模块

    三、selenium使用流程

    1、环境安装:pip install selenium -i https://mirrors.aliyun.com/pypi/simple

    2、下载一个浏览器的驱动程序,如谷歌 

    下载路径:http://chromedriver.storage.googleapis.com/index.html

    驱动程序和浏览器的映射关系:http://blog.csdn.net/huilan_same/article/details/51896672

    3、实例化一个浏览器对象

    bro = webdriver.Chrome(executable_path='./chromedriver')

    4、编写基于浏览器自动化的操作代码

    发起请求:get(url)

    标签定位:find系列的方法

    标签交互:send_keys('xxx')

    执行js程序:excute_script('jsCode')

    前进,后退:forward() back()

    关闭浏览器:quit()

    from selenium import webdriver
    from time import sleep
    
    bro = webdriver.Chrome(executable_path='./chromedriver')
    bro.get('https://www.taobao.com/')
    
    # 标签定位
    search_input = bro.find_element_by_id('q')
    # 标签交互
    search_input.send_keys('iphone')
    
    # 执行一组js程序
    bro.execute_script('window.scrollTo(0,document.body.scrollHeight)')
    sleep(2)
    # 点击搜索按钮
    btn = bro.find_element_by_css_selector('.btn-search')
    btn.click()
    
    bro.get('https://www.baidu.com')
    sleep(2)
    
    # 回退
    bro.back()
    sleep(2)
    
    # 前进
    bro.forward()
    
    
    sleep(5)
    
    bro.quit()
  • 相关阅读:
    Bitstream or PCM?
    centos7安装Redis-3.2.8
    【生肉】【不义联盟
    ES6中Map数据结构学习笔记
    机器学习基石入门
    2019/5/9 长难句
    文件遍历选取脚本
    [JS奇怪的世界]No.55 危險小叮嚀:陣列與for in
    OpenGL Panorama Player
    吴裕雄--天生自然MySQL学习笔记:MySQL 连接
  • 原文地址:https://www.cnblogs.com/nanjo4373977/p/12966885.html
Copyright © 2011-2022 走看看