机器学习由对于人工智能的研究而来,是一个综合性和应用性学科,可以用来解决计算机视觉/生物学/机器人和日常语言等各个领域的问题,机器学习的目的是让计算机具有像人类的学习能力,这样做是因为我们发现,计算机要完成有的功能,是无法通过固定的程序实现的,例如让计算机识别手写的字迹,让计算机从不同的图片中识别出猫和人。
这门课程主要学习机器学习的算法,也需要用程序来实现这些算法,建议用Matlab或者Octave来进行编程。此外,学习本课程需要具有数理统计/线性代数和数据结构等方面的知识。
机器学习可以用如下定义:
- 不用显式的程序而使计算机具有学习能力的研究领域。(Arithur Samuel ,1959)
- 对于给定的任务T,计算机程序从经验E来学习,通过经验E来提高完成任务T的性能P。(Tom Mitchell,1998)
机器学习大概可以分为四个主要部分:
- 监督学习
给算法提供了一组标准答案,来监督算法对于特定输入的输出,是不是我们给的标准答案。
回归问题和分类问题都可以归到监督学习里面。 - 学习理论
学习理论是理论上来研究怎样保证学习算法的性能,例如如何保证算法的精度/需要多少样本等 - 无监督学习
无监督学习与监督学习相对,只给出数据集合,没有给出标准答案,通常用于发现数据集合中的结构特性。例如对数据进行聚类分析,但是事先不知道这些数据属于哪些类,也就是说发现其中的未知特性。 - 强化学习
强化学习用于你不需要进行一次决策的情况。例如,在诊断良性还是恶性肿瘤的例子中(这是个监督学习问题),你的一次决策给出一个结论,而这个结论决定了一个病人的生死。但是,实际你可能需要在一段时间内进行连续多个决策。例如无人直升机的自动飞行,你做出一个错误决策,他可能不会马上坠机,后面只要做出正确决策,还是可以补救的,只有当你一直做出错误决策,才会使其坠机。强化学习可以应用于机器人领域