数据标注-人工智能高速路上的基石
中国科学技术大学博士袁岚峰在不久前的文章中把中国科技在世界的地位大致分为五类。
我们本文中只引用第四类。
“如今世界科技的第四个格局:双头格局,一般是中美两国远远高于其他国家。典型的例子有两个,互联网和人工智能。这两个都是普遍被认为对于未来非常重要,最有想象空间的,值得我们仔细分析”。前四个格局有兴趣的朋友可以自行搜索全文,这里因为篇幅原因不做更多引用。
在这里我们可以从一个科技工作者口中了解到一个这样的事实:互联网与人工智能在当今世界科技格局中,中国和美国是两国独大。同时,这两个领域又是未来领域。
为什么说是未来领域,互联网的未来趋势已经被时间很好的证明。从1969年美国的阿帕网以来,互联网用了不到50年就彻底颠覆了过去几百年来人们的生活习惯。
在这里我们重要强调的是比互联网年轻许多的人工智能。说到人工智能,首先我们先谈谈什么是人工智能。
百度百科中是这么定义人工智能的:人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
字面的意思有些生涩,那我们通过举例来对AI进行一个简单的解释。
有天,我们开车在路上,突然出现了刮擦的交通事故,用现在的方式,我们需要:
- 发短信
- 打电话
- 报保险
- 定损
如果换做AI来帮我们简化这个流程呢?
在不久的未来,我们手机里可能都会有一款车辆定损APP,当出现交通事故的时候,我们只需要打开APP,扫描一下破损区域,机器就会自动识别出来我们破损区域是属于什么汽车部件,是什么类型的损伤,自动定损,同时将定损结果反馈给相关保险公司,保险公司根据AI上传的定损结果,自动划账到车主相关银行账号,可能整个流程不会超过1分钟。
事实上,简单来说就是我们把我们的理解和判断,教给机器,让机器代替我们进行判断。
但是我们这里要说的是随着深度学习的不断突破,未来的AI一定会越来越聪明。但是它的出现并不是为了取代人类,而是能让人们极大限度的解放生产力。生产力的巨大提升,会改变未来的生产关系,会改变未来时代。
随着一系列技术上的突破,人工智能在世界科技领域已经渐渐的驶进了高速车道。
中国老子有一句名言是:“九层之台,起于累土”。
意思就是再高的楼台都是由一筐一筐土堆积而成的,这就特别的强调了基础的重要性。同样,人工智能的发展离不开数据标注,数据标注在人工智能的高速路上,作为基石,成为了众多重要环节之中的重中之重。
为什么说数据标注是人工智能众多重要环节的重中之重呢?这我们得从上篇中,人工智能的定义开始说起。
要想实现人工智能,我们需要把我们人类的理解和判断教给计算机,让计算机拥有我们人类般的识别能力。但是,让计算机如何能识别人类的语言呢?
数据标注就是这样出现了,数据标注就是我们人类用计算机能识别的方法,把需要计算机识别和分辨的图片打上特征,让计算机不断的识别这些特征图片,从而最终实现计算机能够自主识别。
通俗点来讲,比如我们想让计算机知道什么是汽车,那么我们就得在有汽车的图片中,把汽车用专业的标注工具标注出来。这里的被标注软件处理过的汽车就是图片中的特征,计算机通过不断的识别这些特征图片。最终结果就是,计算机通过大量的特征图片的学习,最终能够自主的识别特征物品。
所以说,如果人工智能是一个天赋异禀的孩子,那么数据标注就是它的启蒙老师,在传授的过程中,老师讲的越细致,越有耐心,那么孩子成长的也就越稳健。同样,换个角度,如果说人工智能是一条高速公路,那么数据标注就是高速公路的基石,基石越稳固,质量越过硬,那么就会使用起来就会越放心,越长久。
像马云先生在2018世界人工智能大会上所说一样:蒸汽机释放了人的体力,但是蒸汽机并不是模仿人的体力,汽车比人跑得快,但是汽车并不是模仿人的双腿。未来的计算会释放人的脑力,但是计算机不是按照人脑一样去思考,计算机机器必须要有自己的方式去思考。
那么如何能让计算机形成一套自主的思考体系呢?这是一个复杂的过程,但是不论是多复杂的架构,数据标注永远是体系中的养分,通过不断的改变标注内容来适应不断强大的计算机。
了解更多内容请进入:http://www.awkvector.com/