zoukankan      html  css  js  c++  java
  • [转载]快消品图像识别丨无人店背后的商品识别技术

    人工智能一浪接一浪地席卷全球,AI的其中一个重要分支——计算机视觉,也如雨后春笋,不断涌现出新的想法和应用。人脸识别已经逐渐渗透我们的日常生活,机器能够认准人脸,想必大家都有所耳闻;而另一类计算机视觉的应用,是进行商品识别。

    当前新兴的一些无人零售店,背后就需要机器对商品进行自动识别,拍图购物、AR互动营销等场景,也运用了商品识别技术。人工智能商业公司ImageDT(http://www.imagedt.com/),则利用商品图像识别技术提供2B商业服务,包括基于互联网图片大数据的商业分析,以及基于门店货架识别的渠道数据洞察,帮助消费品企业提升业绩。今天,图酱就跟大家科普应用在无人店、新零售中的商品识别技术。

    数据逻辑

    1 让小孩“记住”超市里的所有商品

    我们教一个小孩识物的时候,比如“苹果”,首先要让他反复的看到 “苹果”,他便能认识“苹果”;他可能会认错,把“梨”认成“苹果”,这个时候应该帮他指出来。小孩看到的“苹果”越多,辨识的能力就越强。

    0?wx_fmt=jpeg

    基于深度神经网络的人工智能,让机器具备理解的能力,基本过程就像教一个小孩认苹果一样。首先要有大量的数据, 比如“苹果”的图片;同时,要增加大量机器会认错的“负样本”,比如“梨”的图片;然后经过一个深度神经网络,反复学习,最终获得一个有效的识别模型。对于快消商品的识别,我们不仅要认出一个瓶子包装,还要认出是一瓶酸奶还是啤酒;不仅要认出酸奶,还要认出是哪个品牌的酸奶,甚至是哪个口味和规格。要让机器能够准确识别成千上万的快消商品SKU,是一项极其庞大而复杂的AI工程。

    数据采集

    2 让机器获得学习的原始素材

    首先,我们需要梳理出所有的目标商品清单,并设法获得每一件商品的图片数据。根据商品的特征辨识度,通常需要几十到几百张的有效图片。数据采集是一套组合拳。电商平台上拥有结构化的商品介绍图片以及大量的买家晒图,社交平台上也能获取到大量的消费者晒图,是性价比最高的数据源。超市店内的真实货架数据,是最可靠的数据源,但获取和后期处理的成本都比较高。除此之外,ImageDT还通过自主研发智能灯箱和智能采集车,模拟各种不同的场景对商品进行360°拍摄从而建立庞大的训练数据库,以此来获取最丰富的训练数据。

    0?wx_fmt=jpeg

    数据标注

    3 有多少人工,才有多少智能采集到原始图片数据,通常会混杂许多“脏数据”,需要进行清洗;大部分情况下,还需要对图片中的物体进行标注和分类。只有可靠的数据才能产生高质量的识别模型。在每一个人工智能公司,都有一支特殊的军队——数据标注团队。ImageDT也不例外,在背后支撑这个团队的是一个充满黑科技的标注系统。

    0?wx_fmt=jpeg

    比如,图片在标注前通常会先经过弱模型的处理,让机器先解决 50%的问题;系统有支持批量标注的小图模式,让标注员可以一目十行,成倍提高标注的速度;产品经理反复打磨每一个功能,做A/B测试,从每处细节提高标注的体验和效率。除此之外,标注团队还为不同任务配置了不同等级的质量保证机制,包括抽样审核、全量审核、交叉校验、埋点校验等,确保让机器学习最准确最可靠的训练数据。

    模型训练

    4 “活到老学到老”,机器也要不断学习

    准备好了数据,下一步就是让机器进行学习,建立识别模型的过程。同样的数据,选择不同的神经网络算法、以及不同的参数设置,将会影响最终模型的效果。模型建立之后,还需要进行管理:模型之间存在层次关系,数据和模型会存在版本的迭代,这些问题,当遇到大量商品类别的时候,显得非常艰难。在ImageDT内部,有一个自助式的深度学习平台,支持拖拉拽的算法和参数测试,甚至一个非程序员都可以傻瓜式的完成一次建模任务,并获得模型的效果评估报告。每一位ImageDT的新员工,不管是工程师,还是前台,都会接受一次半小时的建模培训;而在培训结束后,每个人都将能够独立的建立一个图像识别模型,整个过程只需要半小时。

    0?wx_fmt=jpeg

    同时,深度学习平台就像一个模型仓库,兼顾着对象、数据和模型的管理。整个建模的过程已经标准化,最快只需要一天,就能完成从数据采集、标注、建模到上线的整个流程。ImageDT的研发团队分为四个组,产品组、建模组、数据组和研究组。前三个组,负责实现流水线的搭建和经营,使得每天都能井井有条地建立大量新的商品识别模型,并快速上线,对每天数千万的图片数据进行识别和分析。研究组,则要克服各种疑难杂症,比如容易产生褶皱的软包装、商品侧面和背面的识别、遮挡和反光环境下的识别等等。

    0?wx_fmt=jpeg

    目前,在实际生产环境下,已经达到95%以上的识别准确率。人脸都有眼睛、鼻子、嘴巴等固定的特征,而超市中琳琅满目的商品,则千奇百态。与人脸识别相比,商品识别有更高的工程复杂度。ImageDT正在做的,就是实现这个庞大的AI工程,让机器能够自动地、准确地识别每一件商品。零售智能货架演示

    0?wx_fmt=gif

    备注:

    零售消费行业的AI商业服务商ImageDT(图匠数据)宣布获得由真格基金领投,创新工场及天使轮靖亚资本跟投的数千万PreA轮融资。ImageDT创始于2016年,本轮融资是继ImageDT在2017年获得靖亚资本的数百万天使融资后的第二次融资,不足半年时间接连获得顶级资本垂青。

    创始人及CEO郭怡适(Abe),硕士毕业于中山大学美国印第安纳大学访问学者,是数据及AI领域的连续创业者,曾创立服务逾百家企业客户数据公司,并成功在新三板挂牌上市,2016年二次创业专注投身于AI图像识别在消费品和零售领域应用; 联合创始人及CMO王芹(Cherry),拥有十余年的快消行业渠道管理经验和AI领域市场经验,2016年便涉足国际化图像识别领域市场开拓,也曾就职于联合利华箭牌美赞臣等跨国快消品公司;联合创始人及CTO 黄耀鸿(Evan)硕士毕业于中山大学,是数据人工智能资深开发者,AI工程专家,拥有丰富的企业服务经验

  • 相关阅读:
    SP笔记:交叉实现七行并成一行
    HTML tag 学习
    操作哈希表
    Efficient bipedal robots based on passivedynamic walkers
    Pushing People Around
    ZEROMOMENT PONTTHIRTY FIVE YEARS OF ITS LIFE

    Active Learning for RealTime Motion Controllers
    Accelerometerbased User Interfaces for the Control of a Physically Simulated Character
    Dynamic Response for Motion Capture Animation
  • 原文地址:https://www.cnblogs.com/kelvinRay/p/9039272.html
Copyright © 2011-2022 走看看