zoukankan      html  css  js  c++  java
  • 巧用Python脚本解决自动化图形验证码难题

    目标

    解决UI自动化过程中的图文验证码问题,过程大致分为两个步骤:

    1. 自动下载网页上指定的图片

    2. 识别图片上的文本内容

    本文以“识别页面上指定图片的文本“为例。

    代码实现效果

    环境准备

    • Pytesseract
    • Tesseract-OCR
    • Pillow

    手动安装pytesseract库

    命令:pip install pytesseract

    安装Tesseract-OCR.exe

    下载地址

    http://8rr.co/Krrw

    双击exe程序直接安装即可

    配置环境变量

    校验安装成功

    安装Pillow包

    Python自带的图文简单处理模块,正常安装Python的时候会自动安装,故无需另外手动安装。(若没自动安装则可手动安装:pip install Pillow)

    代码正文

    初始化浏览器和元素定位方式

    初始化并放大浏览器初始化元素定位方式:本文使用CSS选择器方式定位

    获取图片

    页面全屏截图截图转为Image对象获取指定图片的大小和位置裁剪图片

    识别图片上的文本

    识别裁剪后的图片上的文本内容

    问题:

    Python脚本运行报错:

    解决方案:

    修改tesseract文件的默认路径

     

  • 相关阅读:
    使用SELECT语句检索数据
    redis的安装和使用【2】redis的java操作
    Python之数据结构改造
    InnoDB undo log物理结构的初始化
    Redis-RDB持久化设置
    MySql(四)Select条件查询
    Node.js TLS/SSL
    Node.js 定时器
    Node.js 系统
    Node.js 字符串解码器
  • 原文地址:https://www.cnblogs.com/testfan2019/p/15440067.html
Copyright © 2011-2022 走看看