zoukankan      html  css  js  c++  java
  • 爬虫验证码识别免费开源版(5行代码解决)

    背景

    爬取数据的过程中难免遇到登录的问题,为了绕过登录,保存cookie是常见的的解决方法.在遇到有验证码的问题时,无疑增加了获取cookie的难度.该python包,解决你的实际问题,避免了购买云打码或者自己搭建机器学习,训练模型的过程,话不多说,直接进入主题.

    环境要求

    目前已经支持python3.8以下的了,python3.8以上毫无问题。

    调用方法

    pip install ddddocr

    如何使用

    import ddddocr
     
    ocr = ddddocr.DdddOcr()
     
    with open('test.png', 'rb') as f:
     
        img_bytes = f.read()
     
    res = ocr.classification(img_bytes)
     
    print(res)
    

      

     

    参数说明

    DdddOcr 接受两个参数:


    参数名

    默认值

    说明

    use_gpu

    False

    Bool 是否使用gpu进行推理,如果该值为False则device_id不生效

    device_id

    0

    int cuda设备号,目前仅支持单张显卡

            
    classification参数:
                


    参数名

    默认值

    说明

    img

    0

    bytes 图片的bytes格式


    我试了试很不错,而且是cpu的情况下,几毫秒返回结果。
    我的验证码如下:

     想要学习Python基础知识的,扫描右上角二维码关注作者的公众号,回复"专辑"俩字.进行知识的获取

  • 相关阅读:
    ISpout源码解析
    storm完全分布式部署
    sqoop工具
    sqoop安装步骤
    HBASE常用配置
    linux命令无法使用:命令行输入:set>lll cat lll echo $PATH
    BubbleSort
    QuickSortWithRec
    面试题
    Nginx配置安装
  • 原文地址:https://www.cnblogs.com/xiaozhangpython/p/15661194.html
Copyright © 2011-2022 走看看