http://hi.baidu.com/group609/item/00e99d1597f986e49d778a69
1.什么是机器学习?
从一些经验(E)中学习,来完成某种任务(T),通过某种评价方式(P)判断,发现perform得更好了,就算是学习了。因此对于机器学习,需要三方面的内容,一些经验+一个任务+一个评价方式。它能够教会计算机去做一些事情,但是!但是!这些事情却不是 hard code的,不需要显示地编程实现其中所有的逻辑,而是通过数据来建模。
PS:对应到我们的实验中就是E就是训练数据,T就是任务,可以是预测,可以是分类,可以是聚类,可以是关联规则挖掘。P一般采用precision,recall,f-measure三个数值来表征,分别代表准确度,查全率,以及两者的调和平均值。
2.我们为什么需要机器学习?
第一个例子,一个房地产公司根据以往的销售数据,和新房子的大小来预测一个新房子的价格,那么它可以生成一个房子大小和房子价格的函数。也就是说,x是房子大小,y是房价。普通的函数啊,拟合啊都可以很好的完成这个任务。但是,如果需要根据一个房子的大小,装修,地段,开发商,地理位置等一系列的数据来预测房子的价格的话,我们已经不能在3维以下的空间解决这个问题了,这个时候,函数和拟合就显得无能为力了,而机器学习却可以完成这些任务。
第二个例子,一个狗狗跳舞,我们评价跳得好不好。那么函数x是一个一个的狗狗,y是好,或者不好。由于函数值过于离散,我们不能用拟合来预测中间值。那通过什么来判断狗狗跳舞跳得好不好呢?用机器学习
第三个例子,一个机器人,我们希望它和我们一样一样说话,学习,生活。但是生活中的场景千千万万,如果hard code编程实现实在是一件非常非常困难的事情。那么,机器人就不能做了么?可以的,通过机器学习
PS:高维属性之间的关系特别适合用机器学期完成;函数值离散的情况特别适合机器学习;实例特别多的任务
3.什么是监督学习?什么是无监督学习?
上文中提到的经验(E),也就是训练数据,如果数据本身能够知道什么是正确的答案,那么用这些数据学习就叫做监督学习。比如:一筐苹果,每个苹果都有标签,标的好苹果,烂苹果,我们对着标签找好苹果的共同特征,这个就是监督学习。同样是这篮子苹果,把标签撕了,尽管我们能够通过苹果的长相判断大致是个好苹果还是烂苹果,但是苹果本身没有标注自己是好是烂,我们只能大致归类,这种就是无监督学习。
4.强化学习reinforcement learning?
强化学习(reinforcement learning,又称再励学习,评价学习)是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。但在传统的机器学习分类中没有提到过强化学习,而在连接主义学习中,把学习算法分为三种类型,即非监督学习(unsupervised learning)、监督学习(supervised leaning)和强化学习。
如果表现好,就评价为“good dog”,否则为“bad dog”,重要的是如何找到这个评价标准。
总结:
1、机器学习中有很多方法,关键是如何用好这些方法。就像给一个工匠很多工具,关键是要教会他使用这些工匠。