名词解释
监督学习:supervised learning:
监督学习:贝叶斯,决策树,神经网络,SVM
非监督学习:unupervised learning:
非监督学习:分级聚类/K mean 聚类;
置信风险/期望风险: 分类器对 未知样本进行分类,得到的误差。也叫期望风险。
松弛变量:解决近似可分的问题。
经验风险: 训练好的分类器,对训练样本重新分类得到的误差。即样本误差
结构风险:[置信风险, 经验风险], 如(置信风险 + 经验风险) / 2
经验风险最小化
有序风险最小化
标称型:有限目标集中取值,如真假 ,主要用于分类
精度
Accuracy
错误率
Error rate
误差
Error
精度
Accuracy
错误率
Error rate
误差
Error
训练误差、经验误差
Training error, empirical error
测试误差
Testing error
假设检验:
正态分布:
T检验
机器学习
Machine learning
数据集
Data set
示例、样本
Instance,sample
属性、特征
Attribute , feature
维数
Dimension
学习器
Learner
分类
Classification
Multi-classification
Binary classification
回归
Regression
VC维:研究学习过程一致收敛的速度和推广性;VC维反映了函数集的学习能力,VC维越大则学习机器越复杂(容量越大)
泛化能力:Generalization ,模型适用于新样本的能力
分布
Distribution
归纳
Induction
演绎
Deduction
过拟合:建模过于具体化,特别特征过多的纳入模型
Over fitting
欠拟合:缺少通性
Under fitting
聚类
Clustering
簇
Cluster