zoukankan      html  css  js  c++  java
  • 如何快速将百度大脑AI技术内置智能小程序中

    实现效果:

    该AI智能小程序目前集成了百度AI开放平台数十个AI服务产品功能,包括人脸识别、文字识别、表格识别、红酒识别、货币识别、地标识别、手势识别、商标识别、果蔬识别、菜品识别等图片识别功能,以及黑白图像上色、图片风格变换等图像处理的功能。

    1 系统框架

    小程序将常用功能按Ai技术分为五大类:文字识别、语音技术、图像技术、视频技术和自然语言处理(NLP),然后根据具体功能再进行细分。本文主要介绍百度AI开放平台计算机视觉方面服务产品的测试过程及效果。通过微信小程序实现API调用。小程序将用户上传的图片提交给百度AI服务,返回识别结果。全部功能都在小程序客户端完成,不需要服务器,适合个人开发者学习调试使用,同时也为商业应用提供相应解决方案。

    开发平台:微信开发者工具 V1.02

    开发语言:java script

    测试环境:Andriod 9.0

    2 微信小程序开发过程

    2.1注册微信小程序

    注册地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?action=index&lang=zh_CN

    注册成功后在开发->开发者ID里找到AppID,这是开发微信小程序所需要的身份标识。然后填写服务器域名,需要用到的均要填上,如下图。

    2.2 小程序的配置已基本完成,下一步需要下载开发工具了,微信自己开发的IDE,下载地址是:
    https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html

    2.3小程序开发文档:https://developers.weixin.qq.com/miniprogram/dev/framework/

    2.4小程序开发界面

    如下图,标红处需要填入注册时获得的APPID。

    2.5程序总体结构

    Pages下的每个文件夹对应实现一种AI功能。添加新的AI功能,比如添加驾驶证识别功能,在根目录的全局配置文件app.json中增加:"pages/ driving_license/ driving_license" ,会自动创建相关页面文件夹,其内部结构如下:

    driving_license.js:功能逻辑模块

    driving_license.wxss:页面样式文件

    driving_license.wxml:页面布局文件

    driving_license.json:页面配置文件

    3 程序功能实现说明

    想了解微信小程序中百度API接口的调用过程,请参看我之前的帖子:

    营业执照识别:https://ai.baidu.com/forum/topic/show/956171

    增值税发票识别:https://ai.baidu.com/forum/topic/show/956168

    车牌识别:https://ai.baidu.com/forum/topic/show/956167

    手写文字识别:https://ai.baidu.com/forum/topic/show/956153

    图像风格转换:https://ai.baidu.com/forum/topic/show/956135

    文字识别:https://ai.baidu.com/forum/topic/show/954152

    iOCR财会版:https://ai.baidu.com/forum/topic/show/956136

    当然,还有更多百度AI服务功能可以陆续添加,按照以上文章链接所提供的方法稍作修改即可。有兴趣的同学可以试试。

    4 测试效果

    以下选取了部分图片识别的测试效果:

    4.1菜品识别

    4.2 车型识别

    4.3地标识别

    4.4动物识别

    4.5红酒识别

    4.6 货币识别

    4.7 植物识别

    4.8 黑白图像上色

    4.9 清点人数

    4.10 通用物体与场景识别

    5 测试结论

    5.1识别能力

    根据拍摄照片,识别图片内容,广泛应用于娱乐类APP,自助结算等业务场景中。目前图像识别具备的识别能力如下:

    品牌logo识别 :识别4万种商品logo,支持定制logo图库

    植物识别 :识别2万多种通用植物和近8千种花卉

    动物识别 :识别近8千种动物

    菜品识别 :识别超过近九千种菜品,支持定制菜品图库

    地标识别 :识别5万中外著名地标、景点

    果蔬识别 :识别近千种水果和蔬菜

    红酒识别 :识别数十万中外红酒名称及详细介绍

    货币识别 :识别国内外常见货币,支持正反面、纪念钞

    车型识别 :识别3千款常见车型,可返回车型百科信息

    营业执照识别 :识别各版式营业执照所有关键字段

    增值税发票识别 :识别增值税普票或专票所有30个字段

    驾驶证识别 :识别机动车驾驶证正本所有9个字段

    车牌识别 :识别蓝牌、绿牌、单/双行黄牌等类型车牌

    手写文字识别 :识别图片中的手写数字、手写中文

    表格文字识别 :识别表头、表尾及每个单元格的文字内容

    人脸检测 :返回人脸框与关键点,识别多种人脸属性

    手势识别 :识别24种常见手势,支持自拍、他人拍摄

    5.2 特色优势

    1)图像识别功能丰富

    支持多种垂类业务场景的细粒度图像识别,精准识别超过十万种物体和场景,基于百度海量数据,持续丰富接口返回内容信息。

    2)识别准确性高

    基于百度丰富的海量数据,利用深度学习技术及精准的算法迭代模型,不断提高准确性。

    3)工作稳定性好

    提供24小时云端高稳定服务,宕机率低,故障恢复快,单图毫秒级响应,服务可用性高达99.95%。

    4)支持定制化识图

    支持根据不同的业务场景定制客户专属的AI识图能力,满足非通用场景下的业务需求。例如品牌logo,菜品识别均可自定义库。

    5)支持获取百科信息

    支持识别结果中返回百度百科的内容,让客户业务功能更完善、内容更丰富。

    作者:wangwei8638

  • 相关阅读:
    java编译错误No enclosing instance of type TestFrame is accessible. Must qualify the allocation with an enclosing instance of type TestFrame (e.g. x.new A(
    java 2中创建线程方法
    动态规划基本思想
    关于eclipse编译一个工程多个main函数
    java Gui初识
    Eclipse中java项目的打包
    java 播放声音
    把资源文件夹导入到eclipse中
    Java建立JProgressBar
    How to grant permissions to a custom assembly that is referenced in a report in Reporting Services
  • 原文地址:https://www.cnblogs.com/AIBOOM/p/11928217.html
Copyright © 2011-2022 走看看