zoukankan html css js c++ java

2-常见机器学习模型总结

一、机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。

　　1-监督学习主要包括用于分类和用于回归的模型：

　　　　1）分类：线性分类器（如LR)、支持向量机（SVM）、朴素贝叶斯（NB）、K近邻（KNN）、决策树（DT）、集成模型（RF/GDBT等）

　　　　2）回归：线性回归、支持向量机（SVM）、K近邻（KNN）、回归树（DT）、集成模型（ExtraTrees/RF/GDBT）

　　2-无监督学习主要包括：数据聚类（K-means）/ 数据降维（PCA）等等.

二、根据模型特性而言：

　　1-各个模型分别基于哪些数学假设、适合处理什么样的数据、优缺点、评测指标及其计算方法

模型名称	数学假设	模型优缺点	评测指标及其计算方法
LR	假设特征与分类结果存在线性关系使用sigmoid函数映射到0-1	与随机梯度上升算法相比，预测精度准确，但是耗费时间长	准确性（Accuracy）召回率（Recall）精确率（Precision）以及F1
NB	各个维度上的特征被分类的条件概率之间是相互独立的、贝叶斯公式	广泛用于文本分类优点：速度快，参数估计的个数锐减缺点：在特征关联性较强的任务性能差	同上
集成模型	训练多个模型 RF---bagging GDBT----boosting 模型融合相关内容	优点：性能高、稳定性强、广泛应用于工业界缺点：训练时间长，调参是体力活 xgb、lightGBM是比较快的	同上
回归相关的模型	SVM有三种核函数（linear/poly/rbf）		R^2/MAE/MSE/RMSE

查看全文

相关阅读:
机器学习笔记5：决策树
 假设检验、T检验
 机器学习中的生成模式和判别模式
 机器学习笔记3:朴素贝叶斯
 机器学习笔记2:线性回归、逻辑回归
 机器学习之逻辑回归详解
 机器学习笔记1:机器学习中的一些基本概念
 标准化和归一化和独热编码
 正十二面体万花筒
 李代数E8 的根系 python绘图