模式识别的基本概念
- 模式识别:根据已有知识的表达,针对待识别模式,判别决策其所属的类别或者预测其对应的回归值。模式识别本质上是推理的过程。
- 数学表达:模式识别可以看做一种函数映射f(x),将待识别模式x从输入空间映射到输出空间。函数F(x)是关于已有知识的表达。
- 模型:已有知识的表达式y=f(x)。
- 模型的组成:特征提取+回归器
- 特征: 用于区分不同类别的、可观测的量,具有辨别能力和鲁棒性。
机器学习的基本概念
机器学习使用训练样本学习模型的参数和结构。模型结构分为线性结构和非线性结构。机器学习分为,无监督、半监督、监督式学习三种。
模型泛化能力
- 泛化能力指的是器学习方法训练出来一个模型,对于已知的数据(训练集)性能表现良好,对于未知的数据(测试集)也应该表现良好的机器能力。泛化能力低会导致过拟合,即在训练阶段表现良好在测试阶段表现很差。因此不要过度训练,或者引入正则项。
评估方法与性能指标
- 评估方法:留出法,K折交叉验证,留一验证。
- 性能指标:准确度:将阳性和阴性综合起来度量识别正确的程度。精度:预测为阳性样本的准确程度。召回率:全部阳性样本中被预测为阳性的比例。