zoukankan      html  css  js  c++  java
  • 常见机器学习模型总结

    一、机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。

    1-监督学习主要包括用于分类和用于回归的模型:

        1)分类:线性分类器(如LR)、支持向量机(SVM)、朴素贝叶斯(NB)、K近邻(KNN)、决策树(DT)、集成模型(RF/GDBT等)

        2)回归:线性回归、支持向量机(SVM)、K近邻(KNN)、回归树(DT)、集成模型(ExtraTrees/RF/GDBT)

    2-无监督学习主要包括:

    数据聚类(K-means)/ 数据降维(PCA)等等.

    二、根据模型特性而言:

      1-各个模型分别基于哪些数学假设、适合处理什么样的数据、优缺点、评测指标及其计算方法

    模型名称 数学假设 模型优缺点 评测指标及其计算方法
    LR

    假设特征与分类结果存在线性关系

    使用sigmoid函数映射到0-1

    与随机梯度上升算法相比,预测精度准确,

    但是耗费时间长

    准确性(Accuracy)

    召回率(Recall)

    精确率(Precision)以及F1

    NB

    各个维度上的特征被分类的条件概

    率之间是相互独立的、贝叶斯公式

    广泛用于文本分类

    优点:速度快,参数估计的个数锐减

    缺点:在特征关联性较强的任务性能差

    同上
    集成模型

    训练多个模型

    RF---bagging

    GDBT----boosting

    模型融合相关内容

    优点:性能高、稳定性强、广泛应用于工业界

    缺点:训练时间长,调参是体力活

    xgb、lightGBM是比较快的

    同上
    回归相关的模型 SVM有三种核函数(linear/poly/rbf)   R^2/MAE/MSE/RMSE
  • 相关阅读:
    [原创] 如何在ietester下使用firebug
    Undeclared identifier: 'XXXX'
    图解SQL多表关联查询
    如何去掉Delphi自动生成的~.pas等临时文件
    DataSetProvider的Option属性
    DELPHI DATASNAP 2010 入门操作(2)不写一行代码,绿色三层我也行
    Windows下搭建Android开发环境
    Delphi快捷键大全
    DevExpress的TcxDBLookupComboBox使用方法及问题
    SQL的重复记录处理大全
  • 原文地址:https://www.cnblogs.com/xiaofengzai/p/14529748.html
Copyright © 2011-2022 走看看