该博文系列是Andrew NG教授的课程笔记,有兴趣的朋友可以在Coursera或者网易公开课上找到该课程.
Supervised Learning
下图是一个监督学习回归分析的例子。该图旨在预测房价。
对于该场景,训练集都是有标签属性的。以上图为例,图中的每个点,都对应了房子的价格,监督学习就是要在这些已知的训练集中寻找规律来预测房价。
Unsupervised Learning
下图是无监督学习的几个场景。
相对监督学习,无监督学习即训练集的元素没有标签属性,无监督学习要从这些训练集中挖掘出有价值的分类。比如上图的组织计算机集群,通过每台机器的一些属性,训练出哪些机器相互协调工作,并把他们化为一类,分类的这个结果是训练之后才知道的。再比如,给定大量图片,从中找出一类图片和其它所有图片不同的过程,也是无监督学习。
至于分类和回归问题,分类问题可以理解为训练的结果有限,比如是否患病问题,要么患病,要么健康。而回归问题则是训练结果在某一个范围内,比如上文说的房价估计问题,房价是在一个范围内的。