机器学习课程包括四个部分:
第一:监督式学习(supervised learning),有两种类型:回归和分类。采集了某地区的房屋价格和面积的一组数据,然后推测此地区面积为100平的房子个价格应该是多少?这就属于回归型监督式学习算法。然后另外一个根据肿块的大小,预测肿瘤是良性还是恶性,0表示恶性,1表示良性,这种问题就属于分类型监督式学习算法。分类(classification),对于一个classifier来说,就是告诉它”这个数据属于XX类“,然后classifier会在提供的训练集中"学习",然后具有对某个未知数据分类的能力,这种提供提供训练数据的过程称为监督式学习。监督式学习是已有正确答案。
第二:学习理论(learning theory)
第三:无监督学习(unsupervised learning)。聚类(clustering),就是把相似的东西集中到一起,聚类的时候,我们不关心某一类是什么,我们的目标是将相似的类聚在一起,因此一个聚类算法只需要知道如何计算相似度就可以开始了,并不提供训练数据,我们称这种为无监督学习。无监督式学习适合不知道正确答案的情况下,发现数据集的结构性。例如录音机录制了两个人一起说话的声音,无监督学习可以将两个声音分别提取出来。无监督学习还可以用于文本处理。
第四:强化学习(reinforcement learning):被用在不必进行一次决策的情形之中,强化学习通常是在一段时间之内作出一系列的决策。在强化学习中有一个回报函数的概念。然后需要定义好的行为和坏的行为,肯定好的行为,程序会不断学习实现好的行为,以此获得好的回报。
就像你说蹲下,旺财立即蹲下的时候你会说,”good dog“,否则,”bad dog“。旺财想听到夸奖,所以它会学习在你说出蹲下的时候立马蹲下。同样的对于采用了强化学习的直升机来说,当其摔下时,触发的坏的行为,它就会学习下次不再摔下,以此获得好的回报。
强化学习经常用在机器人领域。