机器学习笔记1
1.监督学习必须要考虑的问题:偏差方差困境(bias-variance dilemma):使用不同的训练集,机器学习模型的执行精度如何
高偏差模型只在低噪声的训练集上适用,而高方差模型常常依赖增加模型的复杂度来解决训练数据的噪声问题,最好的办法是对这两类模型折中。
因此关键问题是如何选择这个折中,以及何时应用这种模型。
2.对比:聚类(无监督学习)----人工神经网络(监督学习)
3.机器学习的准备阶段注意要清洗数据,保证数据质量
4.决策树
5.贝叶斯网络
基础:图论,概率论,贝叶斯定理
6.人工神经网络:感知机,激活函数,多层感知机,后向传播函数
7.支持向量机:实际上是感知机概念中使用几何间隔最大化的进一步延伸
线性分类器
非线性分类:核函数代替了点积
8.聚类:组织一组具备相似特征的对象,目的是把数据分成特定的群组,许多不同的聚类算法都有一个共同的特征:找出对象所属的类别
k-均值算法:
参考:
1.《机器学习 实用技术指南》Jason Bell