zoukankan html css js c++ java

常见机器学习模型总结

一、机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。

　　　　1）分类：线性分类器（如LR)、支持向量机（SVM）、朴素贝叶斯（NB）、K近邻（KNN）、决策树（DT）、集成模型（RF/GDBT等）

　　　　2）回归：线性回归、支持向量机（SVM）、K近邻（KNN）、回归树（DT）、集成模型（ExtraTrees/RF/GDBT）

数据聚类（K-means）/ 数据降维（PCA）等等.

　　1-各个模型分别基于哪些数学假设、适合处理什么样的数据、优缺点、评测指标及其计算方法

模型名称	数学假设	模型优缺点	评测指标及其计算方法
LR	假设特征与分类结果存在线性关系使用sigmoid函数映射到0-1	与随机梯度上升算法相比，预测精度准确，但是耗费时间长	准确性（Accuracy）召回率（Recall）精确率（Precision）以及F1
NB	各个维度上的特征被分类的条件概率之间是相互独立的、贝叶斯公式	广泛用于文本分类优点：速度快，参数估计的个数锐减缺点：在特征关联性较强的任务性能差	同上
集成模型	训练多个模型 RF---bagging GDBT----boosting 模型融合相关内容	优点：性能高、稳定性强、广泛应用于工业界缺点：训练时间长，调参是体力活 xgb、lightGBM是比较快的	同上
回归相关的模型	SVM有三种核函数（linear/poly/rbf）		R^2/MAE/MSE/RMSE

查看全文

相关阅读:
Springboot 基于的SAP项目环境配置
 Impala 技术点梳理
 Elasticsearch 使用技巧笔记
 ELK 6.x 部署
 eclipse安装lombok
IIS服务器管理学习
 Springboot依赖注入笔记
 Eclipse解决乱码问题
 Springboot依赖注入 Service类中使用静态变量
 javascript 操作符类型隐性转换