zoukankan      html  css  js  c++  java
  • 第七篇:爬虫实战-

    破解极验滑动验证码

    一、介绍

       一些网站会在正常的账号密码认证之外加一些验证码,以此来明确地区分人/机行为,从一定程度上达到反爬的效果,对于简单的校验码Tesserocr就可以搞定,如下

        但一些网站加入了滑动验证码,最典型的要属于极验滑动认证了,极验官网:http://www.geetest.com/,下图是极验的登录界面

     现在极验验证码已经更新到了 3.0 版本,截至 2017 年 7 月全球已有十六万家企业正在使用极验,每天服务响应超过四亿次,广泛应用于直播视频、金融服务、电子商务、游戏娱乐、政府企业等各大类型网站

    对于这类验证,如果我们直接模拟表单请求,繁琐的认证参数与认证流程会让你蛋碎一地,我们可以用selenium驱动浏览器来解决这个问题,大致分为以下几个步骤

    复制代码
    #1、输入账号、密码,然后点击登陆
    #2、点击按钮,弹出没有缺口的图
    #3、针对没有缺口的图片进行截图
    #4、点击滑动按钮,弹出有缺口的图
    #5、针对有缺口的图片进行截图
    #6、对比两张图片,找出缺口,即滑动的位移
    #7、按照人的行为行为习惯,把总位移切成一段段小的位移
    #8、按照位移移动
    #9、完成登录
    复制代码

    二、实现

    复制代码
    安装:selenium+chrome/phantomjs
    
    #安装:Pillow
    Pillow:基于PIL,处理python 3.x的图形图像库.因为PIL只能处理到python 2.x,而这个模块能处理Python3.x,目前用它做图形的很多.
    http://www.cnblogs.com/apexchu/p/4231041.html
    
    C:UsersAdministrator>pip3 install pillow
    C:UsersAdministrator>python3
    Python 3.6.1 (v3.6.1:69c0db5, Mar 21 2017, 18:41:36) [MSC v.1900 64 bit (AMD64)] on win32
    Type "help", "copyright", "credits" or "license" for more information.
    >>> from PIL import Image
    >>>
    复制代码
     View Code

    案例:

     破解博客园后台登录
     修订版

    用类封装的版本

     svcr
     使用类
  • 相关阅读:
    技术学习之分析思想
    测试类的必要性
    Webstorm配置运行React Native
    React Native
    npm太慢, 淘宝npm镜像使用方法
    数据库设计那些事儿
    Linux 安装nodejs
    Java
    解决 vmware workstations 14 开启虚拟机黑屏
    编程与盖楼的思考
  • 原文地址:https://www.cnblogs.com/mqhpy/p/11370767.html
Copyright © 2011-2022 走看看