zoukankan      html  css  js  c++  java
  • 小白学Python——用 百度AI 实现 OCR 文字识别

    百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别、MQTT服务器、语音识别等等,应有尽有。

       

    看看OCR识别免费的量

      

    快速安装:执行 pip install baidu-aip 即可

    新建一个AipOcr:

    from aip import AipOcr
    
    """ 你的 APPID AK SK """
    APP_ID = '你的 App ID'
    API_KEY = '你的 Api Key'
    SECRET_KEY = '你的 Secret Key'
    
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

    通用文字识别

    """ 读取图片 """
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    image = get_file_content('example.jpg')
    
    """ 调用通用文字识别, 图片参数为本地图片 """
    client.basicGeneral(image);
    
    """ 如果有可选参数 """
    options = {}
    options["language_type"] = "CHN_ENG"
    options["detect_direction"] = "true"
    options["detect_language"] = "true"
    options["probability"] = "true"
    
    """ 带参数调用通用文字识别, 图片参数为本地图片 """
    client.basicGeneral(image, options)
    
    url = "http//www.x.com/sample.jpg"
    
    """ 调用通用文字识别, 图片参数为远程url图片 """
    client.basicGeneralUrl(url);
    
    """ 如果有可选参数 """
    options = {}
    options["language_type"] = "CHN_ENG"
    options["detect_direction"] = "true"
    options["detect_language"] = "true"
    options["probability"] = "true"
    
    """ 带参数调用通用文字识别, 图片参数为远程url图片 """
    client.basicGeneralUrl(url, options)

    通用文字识别 请求参数详情

    通用文字识别 返回数据参数详情

    通用文字识别

    from aip import AipOcr
    
    #更换为自己的注册信息
    APP_ID = '---'
    API_KEY = '---'
    SECRET_KEY = '---'
    
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)#创建连接
    fp=open("tu2.png","rb").read()#打开并读取文件内容
    res=client.basicGeneral(fp)#普通
    #print(res)
    
    #将所有的文字都合并到一起
    strx=""
    for tex in res["words_result"]:#遍历结果
        strx+=tex["words"]#每一行
    print(strx)#输出内容

     最终代码

    from aip import AipOcr
     
    # 定义常量
    APP_ID = '14544448'
    API_KEY = 'yRZGUXAlCd0c9vQj1kAjBEfY'
    SECRET_KEY = 'sc0DKGy7wZ9MeWFGZnbscbRyoDB2IQlj'
     
    # 初始化AipFace对象
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
     
    # 读取图片
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
     
    image = get_file_content('binary_best.jpg')
    # 调用通用文字识别, 图片为本地图片
    res=client.general(image)
    print(res)
     
    for item in res['words_result']:
        print(item['words'])

    例:

    from aip import AipOcr
    import re
    APP_ID='17010327'
    API_KEY='X2MWCU1LG1PX5H6GAXgdlWD7'
    SECRET_KEY='vz6GZ6TkhSFvY3quqcuC3EG8oEW3kThB'
    client=AipOcr(APP_ID,API_KEY,SECRET_KEY)
    
    i=open(r'C:UsersAdministratorDesktopexample.png','rb')
    image = i.read()
    
    result=client.basicGeneral(image)
    
    #将所有的文字都合并到一起
    for item in result['words_result']:
        print(item['words'])

    通用文字识别client.basicGeneral(image)

    通用文字识别(高精度版)client.basicAccurate(image);

    通用文字识别(含位置信息版)client.general(image);

    通用文字识别(含位置高精度版)client.accurate(image);

    通用文字识别(含生僻字版)client.enhancedGeneral(image);

    网络图片文字识别client.webImage(image);

    Python SDK文档 http://ai.baidu.com/docs#/OCR-Python-SDK/53932383

    OCR文字识别笔记总结   https://www.cnblogs.com/wj-1314/p/9580387.html  

  • 相关阅读:
    JEECG弹出框提交表单
    JEECG开发第一个菜单显示设备列表
    优化jeecg底层高级查询,支持bool值和下拉框查询
    Jeecg中的<t:datagrid treegrid="true">实现
    JEECG 简单实例讲解权限控制
    jeecg 定时任务配置用法
    帆软报表和jeecg的进一步整合--ajax给后台传递map类型的参数
    JEECG与帆软报表集成
    helm部署Redis哨兵集群
    helm安装kafka集群并测试其高可用性
  • 原文地址:https://www.cnblogs.com/adam012019/p/11440353.html
Copyright © 2011-2022 走看看