What is machine learning(什么是机器学习)
Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.(机器学习:使计算机在不显式编程的情况下自主学习的能力的研究领域。)
Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learnfrom experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. (一个计算机程序据从一些任务T和一些性能度量p中学到经验E,如果它在T上的性能,用P来衡量,则其将不断吸取经验E来改进其程序。)
机器学习的算法的类型:
Supervised learning(监督学习)
通过生成一个函数将输入映射为一个合适的输出(通常也称为标记,多数情况下训练集都是有人工专家标注生成的)。训练集是标记的 。
Unsupervised learning(非监督学习)
与有监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法有聚类。训练集是未标记的 。
Supervised learning(监督学习)
监督学习主要会提供一些标注样本,分为两大问题:回归和分类
教学案例1:房屋价格预测-回归(Regression): 预测连续的输出值(价格)
教学案例2 :乳腺癌(良性,恶性)预测问题-分类(Classification): 预测离散的输出值(0, 1)
Unsupervised learning(非监督学习)
常见的无监督学习算法有聚类。
监督学习和无监督学习的对比,看图更形象: