上篇博客说到婴儿对爸爸 妈妈这样一个认识的过程是出于出现频率
这一个过程中,我们看到婴儿用到了听觉,视觉,声音。
在我们每个人的眼中,我们的生活的世界都是三维的,但摄像头是看见的东西都是二维的,因为人有两个眼睛,因此大概能够识别出一个物体是否是整体,给予计算机两个有一定距离的摄像头,判断物体之间形状差异大致也能判断一个物体是否属于一个整体。
上帝给人的基因之一是:整体性物体的识别
我在上课的时候思考,究竟是什么,仅仅是一张图片,让我们认为一个物体是一个整体的。一开始我的想法是根据他的轮廓,然而事情并不像想象的那样,一个物体,斜着看和正着看的轮廓是不同的。下课的时候,我走在马路上看到那些树的轮廓又是不规则的但是我还是够知道它是一棵树而不是别的什么东西,经过一段时间的思考我觉得是
上帝给人的基因之二是:概括性记忆描述物体
之所以说是概括性的,是因为像树这种不规则的物体,如果仅仅依靠轮廓的话,识别不出来这个物体是树。因为每棵树,形状都是不同的,那么整体来说,树有他本身的特性,我才能知道它是一棵树,首先树干为棕色有条纹的略微为笔直的柱状物体,这种形状它是树干,其次还有通常来说是绿色叶子的顶部。即使这棵树被砍了,脱离了整体,我们依旧能认识它是树干。树干的表皮被扒了下来,我们仍能知道这是树皮。即记忆这些东西和整体性的识别是可以区别开来的,当然识别树皮这件事是建立在我们已经在整体性的物体有一定了解之上才能做到的事情。假如我们是从来没有树皮的这个概念,但是知道树的的存在,我们看到树皮的时候大概可以推断,这是树的表皮,但是我们不能说出他是树皮,因为我们就没有树皮这个概念,只是从思想上能够知道这是树的表皮。反之,如果一开始已知树皮而不知道树,那么以后见到树的时候很容易就知道之前所见过的树皮是从这整体性的物体(树)上扒下来的。
那么现在我们要模拟这样的一个过程,给予计算机摄像头,麦克风和喇叭
为了简化这个过程,想让计算机拥有和婴儿类似的对应的记忆他们爸爸 妈妈这样称呼的过程,我们假如在一个白色的背景下,训练毫无这些背景知识的计算机识别一个绿色小球,并且拿出绿色小球时,能让计算机能够说出绿色小球的这个过程
因为是单个摄像头 无法识别是否是整体,只能透过算法判断他是否是整体。那么假如这个时候识别一个物体是整体的算法已经实现了,或者安装了两个摄像头实现了,每当白色的背景出现了绿色小球,我们就对他说绿色小球,并且我对他进行了多次训练之后,计算机将绿色小球这个整体性的东西与声音绿色小球就关联起来了。
未完待续