(这是一篇课程小论文:))
上这学期的“心理学与生活”课程之前,我对心理学的印象还仅仅停留在心理咨询和精神分析。学过之后才知道,心理学是一门全面研究人类行为及精神过程的科学,其中的五大领域——脑与神经科学、发展心理学、认知心理学、社会心理学、临床心理学——都有各自的研究内容。除此而外,我还意外地发现了心理学研究与我正在从事的研究领域——模式识别和机器学习的联系与交叉。
回顾过去一学期所学,给我印象最深的是第五讲有关记忆层次结构的内容以及第十四讲学习与社会心理的内容。从这些内容当中,我清楚地看到了领域间的交叉,相信这对我今后的相关学习和研究也会大有裨益。第十讲有关幸福和成功的内容也一样吸引人,Malcolm Gladwell“10,000小时法则”的演讲让人印象非常深刻,也让我又一次确信了自己对于勤奋与努力的信念。不过由于和这里要讨论的主题不那么相关,后文就不对此进行展开了。
首先简单介绍一下模式识别和机器学习。这两者都是计算机科学中的重要研究方向,属于人工智能领域的核心内容。模式识别是智能体对信息进行处理与分析,从中发现、辨识、理解有效信息的过程。人类的认知过程其实都是从模式识别开始的,使用计算机和数学方法对认知过程进行刻画和模拟,是模式识别这个研究方向的主要内容。机器学习则关注于刻画学习过程。在机器学习中,“学习”被定义为随着训练经验的积累,完成某项任务的表现逐步提升的过程。有些观点认为,整个人工智能研究的最终目的也就是让机器能够模拟人的智能。模式识别和机器学习分别解决机器的识别和学习两个重要方面的问题,也就成为了近十多年来人工智能的核心。而这两个领域所用的思想与方法也多有互相借鉴与融合,从而也常常被人并称。
课上所讲有关记忆的层次结构的内容,让我马上想到了人工神经网络的层次结构。人工神经网络是一种模拟人脑的机器学习与识别结构。该网络模拟人的神经网络,由一个个“神经元”互联而组成,每一个神经元是一个简单计算单元,接收输入信号、计算然后输出信号到下一层的各神经元。整个网络的输入数据到达最底层计算单元后逐层向上输出,可以得到最终的高层输出。人工神经网络的典型应用包括手写字符识别、人脸识别等等,图像信号输入最终可以转变为字符输出或者人脸朝向、或人名等的输出。该网络从而模拟了人对这些视觉信号的识别与处理过程。对于人工神经网络的训练过程,实际上也就是不同神经元之间互联的强弱权重调整的过程,这与人的学习又是十分相似的。在之前的相关研究中,普遍采用较少层次(例如3层)的神经网络,近年来相关领域又开始了有关“深度学习”的研究。学者们认为,数据本身的结构复杂,用深层网络能够更好地对其进行描述,另一方面,多层神经网络在每一层上学到的内容也可以映射到人的模式识别过程中各个阶段所学到的内容。记忆的层次结构让人立即联想到多层神经网络在各个层次上的输出内容。底层总是会做一些初步的信息处理和过滤,越到高层处理的信息就越抽象和概括,同时其泛化能力也就越强。
第十四讲“Classic Psychology Icons and Their Stories”涉及到很多和机器学习领域相关的内容。其中对学习的定义“Learning is a relatively permanent change in an organism’s behavior”同样适用于机器学习。任何学习过程,如果没有引起智能体内部机制的某些改变,则未来出现同样问题的时候,智能体所作出的反应仍将是不确定的,这样这个过程就不能称为学习。在机器学习中,我们通常对一个学习模型或算法进行训练,训练的过程中模型的结构或参数设定产生了变化,从而未来在面对一个新任务的时候,该模型或算法就能给出相应变化后的输出,这其中可以反映出学习的成效。
这一讲中提到的learning by association在机器学习中也有对应。在其领用领域数据挖掘中,关联规则挖掘(association rule mining)是非常经典的研究问题。该问题中,给定的输入是很多组数据,每组数据是一个物品项的列表,任务是从这些数据中挖掘出关联规则——哪些物品项频繁地同时出现,哪些物品项的出现会导致另一些物品项的出现等等。作为学习的最初级形式,关联规则挖掘已经被研究的比较透彻,而且也已经有了一些实际应用。对超市购买物品清单进行挖掘,得到的关联规则就可以被用来进行自动推荐,例如发现买了面包的客户常常也会购买牛奶,则对于那些买了面包而没有购买牛奶的客户,系统就可以自动向其推荐牛奶。
后面提到的操作性条件反射(operant conditioning)则与机器学习中的另一重要研究领域增强学习(reinforcement learning)相对应。在增强学习中,智能体与环境进行交互,每一个动作都直接或间接(通过观察环境的变化而推断得到)地与一个收益相关联。增强学习的任务就是找到一个动作策略,使得智能体能够最大化累积收益。找到的这个动作策略在这项任务中就反映了智能体学习到的智能。相应的,在操作性条件反射中的行为塑造过程中,通过直接或间接地奖励或惩罚对个体进行训练,可以达到强化行为的效果。
对比心理学与模式识别及机器学习的研究,可以发现一个有趣的区别,那就是心理学研究中认知或学习到的东西如果不进行持续强化就会衰减,而由于计算机强大的存储能力,在模式识别和机器学习中通常并没有考虑这个问题。但在对存储资源要求苛刻的应用场景里,考虑这一衰减过程也会是一种新的思路。
总的来说,模式识别和机器学习通过模拟人的识别和学习过程同时借助于计算机的计算力,将智能技术得以推广到人们生活的方方面面,造福社会。这也正是我有志于这项研究的原因所在。在今后,继续关注相关心理学、认知科学的发展,从中汲取养分,对我自己的学习和研究也将有莫大的帮助。