内容源于Andrew Ng视频与自己的理解
机器学习?
机器学习(Machine Learning)的定义大体上有两种,第一种是亚瑟·塞缪尔(Arthur Samuel)提出的:机器学习是通过给予电脑在为做特定编写程序的前提下具备学习得能力。Arthur本人亦是人工智能(AI)的先驱。现代机器学习教父Tom Mitchell先生对于机器学习给出了第二种较为现代的定义:通过从相关的任务T下的经验E中学习,其行为的表现用P来测量,计算机程序在不断的学习下,它对于任务T下的表现通过P测量,P随着经验E不断增长。
这里按照Ng视频下的观点,对机器学习进行一般分类:无监督学习和有监督学习。
有监督学习-supervised learning
在有监督的学习模型下,给定的数据集具有事先定义好的标签-label,即已知正确的输出结果,去学习输入和输出之间关系。如下图,输入的数据使用红色X与蓝色O区分:
![](http://wx2.sinaimg.cn/mw690/7b8d2108gy1fgb8vl3wj6j20f60bj0st.jpg)
分类问题&回归问题
给出实际市场上房屋的尺寸数据集,试图预测这些房子的价格。价格作为尺寸的函数关系是连续的输出,因此,这是一个回归问题,这里我的理解是用一个函数曲线学习房屋尺寸与价格的关系。
![](http://wx3.sinaimg.cn/mw690/7b8d2108gy1fgb8vjvz70j20iv08hjrw.jpg)
![](http://wx2.sinaimg.cn/mw690/7b8d2108gy1fgb8vkceo2j20is0akgm3.jpg)
无监督学习--unsupervised learning
无监督学习下,我们在对应该的输出结果并不知道或知道很少下解决问题的方式。我们可以从并不必要知道变量作用下从数据中划分结构。总之,在无监督下,没有基于预测结果的反馈。
![](http://wx1.sinaimg.cn/mw690/7b8d2108gy1fgb8vkpmydj20f90bfaab.jpg)
簇:收集了100万的基因组,将这些基因组自动划分为多个小组,分类依据按照不同基因变量中相同的成分,如位置,角色,寿命等。
非-簇:鸡尾酒舞会算法,使你在吵杂的环境下寻找结构(如:在鸡尾酒舞会中将个人的交谈声和音乐声做分离)。