zoukankan      html  css  js  c++  java
  • selenium模块的基本使用

    selenium模块的基本使用

    问题:selenium模块和爬虫之间的关联
    - 便捷的获取网站中动态加载的数据
    - 便捷实现模拟登录
    什么是selenium模块:基于浏览器自动化的模块
    - 环境安装

    下载安装selenium:pip install selenium
    
    下载浏览器驱动程序:
        http://chromedriver.storage.googleapis.com/index.html
    
    查看驱动和浏览器版本的映射关系:
        http://blog.csdn.net/huilan_same/article/details/51896672
    
    实例化一个浏览器对象:
    编写基于浏览器自动化的操作代码
        - 发起请求:get(url)
        - 标签定位:find系列的方法
        - 标签交互:send_keys('xxx')
        - 执行js程序:excute_script('jsCode')
        - 前进、后退:back(),forward()
        - 关闭浏览器:quit()
    selenium处理iframe
         - 如果定位的标签存在于iframe标签之中,则必须使用switch_to.frame(id)
         - 动作链拖动:from selenium.webdriver import ActionChains
            - 实例化一个动作链对象:action = ActionChains(bro)
            - click_and_hold(div):长安且点击操作
            - move_by_offset(x,y)
            - perform()让动作链立即执行
            - action.release()释放动作链对象
    

    12306模拟登录
    - 超级鹰:http://www.chaojiying.com/
    - 12306模拟登录编码流程
    - 使用selenium打开登陆页面
    - 对当前selenium打开的这张页面进行截图
    - 对当前局部区域(验证码图片)进行裁剪
    - 好处:将验证码图片和模拟登录进行一一对应
    - 使用超级鹰识别验证码图片(坐标)

  • 相关阅读:
    splunk linux安装
    [读书笔记]-时间管理-把时间当做朋友
    [读书笔记]-技术学习-Redis
    [读书笔记]-阅读方法-王者速读法
    vuex、localStorage、sessionStorage之间的区别
    vuex的使用
    Vue常用指令总结
    vue-router参数传递
    Vue-router的基本使用
    v-on精炼
  • 原文地址:https://www.cnblogs.com/gerenboke/p/13389255.html
Copyright © 2011-2022 走看看