zoukankan      html  css  js  c++  java
  • 如何快速将百度大脑AI技术内置智能小程序中

    实现效果:

    该AI智能小程序目前集成了百度AI开放平台数十个AI服务产品功能,包括人脸识别、文字识别、表格识别、红酒识别、货币识别、地标识别、手势识别、商标识别、果蔬识别、菜品识别等图片识别功能,以及黑白图像上色、图片风格变换等图像处理的功能。

    1 系统框架

    小程序将常用功能按Ai技术分为五大类:文字识别、语音技术、图像技术、视频技术和自然语言处理(NLP),然后根据具体功能再进行细分。本文主要介绍百度AI开放平台计算机视觉方面服务产品的测试过程及效果。通过微信小程序实现API调用。小程序将用户上传的图片提交给百度AI服务,返回识别结果。全部功能都在小程序客户端完成,不需要服务器,适合个人开发者学习调试使用,同时也为商业应用提供相应解决方案。

    开发平台:微信开发者工具 V1.02

    开发语言:java script

    测试环境:Andriod 9.0

    2 微信小程序开发过程

    2.1注册微信小程序

    注册地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CN

    注册成功后在开发->开发者ID里找到AppID,这是开发微信小程序所需要的身份标识。然后填写服务器域名,需要用到的均要填上,如下图。

    2.2 小程序的配置已基本完成,下一步需要下载开发工具了,微信自己开发的IDE,下载地址是:
    https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html

    2.3小程序开发文档:https://developers.weixin.qq.com/miniprogram/dev/framework/

    2.4小程序开发界面

    如下图,标红处需要填入注册时获得的APPID。

    2.5程序总体结构

    Pages下的每个文件夹对应实现一种AI功能。添加新的AI功能,比如添加驾驶证识别功能,在根目录的全局配置文件app.json中增加:"pages/ driving_license/ driving_license" ,会自动创建相关页面文件夹,其内部结构如下:

    driving_license.js:功能逻辑模块

    driving_license.wxss:页面样式文件

    driving_license.wxml:页面布局文件

    driving_license.json:页面配置文件

    3 程序功能实现说明

    想了解微信小程序中百度API接口的调用过程,请参看我之前的帖子:

    营业执照识别:https://ai.baidu.com/forum/topic/show/956171

    增值税发票识别:https://ai.baidu.com/forum/topic/show/956168

    车牌识别:https://ai.baidu.com/forum/topic/show/956167

    手写文字识别:https://ai.baidu.com/forum/topic/show/956153

    图像风格转换:https://ai.baidu.com/forum/topic/show/956135

    文字识别:https://ai.baidu.com/forum/topic/show/954152

    iOCR财会版:https://ai.baidu.com/forum/topic/show/956136

    当然,还有更多百度AI服务功能可以陆续添加,按照以上文章链接所提供的方法稍作修改即可。有兴趣的同学可以试试。

    4 测试效果

    以下选取了部分图片识别的测试效果:

    4.1菜品识别

    4.2 车型识别

    4.3地标识别

    4.4动物识别

    4.5红酒识别

    4.6 货币识别

    4.7 植物识别

    4.8 黑白图像上色

    4.9 清点人数

    4.10 通用物体与场景识别

    5 测试结论

    5.1识别能力

    根据拍摄照片,识别图片内容,广泛应用于娱乐类APP,自助结算等业务场景中。目前图像识别具备的识别能力如下:

    品牌logo识别 :识别4万种商品logo,支持定制logo图库

    植物识别 :识别2万多种通用植物和近8千种花卉

    动物识别 :识别近8千种动物

    菜品识别 :识别超过近九千种菜品,支持定制菜品图库

    地标识别 :识别5万中外著名地标、景点

    果蔬识别 :识别近千种水果和蔬菜

    红酒识别 :识别数十万中外红酒名称及详细介绍

    货币识别 :识别国内外常见货币,支持正反面、纪念钞

    车型识别 :识别3千款常见车型,可返回车型百科信息

    营业执照识别 :识别各版式营业执照所有关键字段

    增值税发票识别 :识别增值税普票或专票所有30个字段

    驾驶证识别 :识别机动车驾驶证正本所有9个字段

    车牌识别 :识别蓝牌、绿牌、单/双行黄牌等类型车牌

    手写文字识别 :识别图片中的手写数字、手写中文

    表格文字识别 :识别表头、表尾及每个单元格的文字内容

    人脸检测 :返回人脸框与关键点,识别多种人脸属性

    手势识别 :识别24种常见手势,支持自拍、他人拍摄

    5.2 特色优势

    1)图像识别功能丰富

    支持多种垂类业务场景的细粒度图像识别,精准识别超过十万种物体和场景,基于百度海量数据,持续丰富接口返回内容信息。

    2)识别准确性高

    基于百度丰富的海量数据,利用深度学习技术及精准的算法迭代模型,不断提高准确性。

    3)工作稳定性好

    提供24小时云端高稳定服务,宕机率低,故障恢复快,单图毫秒级响应,服务可用性高达99.95%。

    4)支持定制化识图

    支持根据不同的业务场景定制客户专属的AI识图能力,满足非通用场景下的业务需求。例如品牌logo,菜品识别均可自定义库。

    5)支持获取百科信息

    支持识别结果中返回百度百科的内容,让客户业务功能更完善、内容更丰富。

    作者:wangwei8638

  • 相关阅读:
    linux 学习笔记1
    IIS请求筛选模块被配置为拒绝超过请求内容长度的请求
    ipod锁定后的恢复
    HTTP报文
    数据仓库概念
    数据挖掘概念
    大数据处理工具
    eclipse 4.3 汉化
    在CentOS中安装输入法
    编译Hadoop1.1.2eclipse插件并测试
  • 原文地址:https://www.cnblogs.com/AIBOOM/p/11928217.html
Copyright © 2011-2022 走看看