zoukankan      html  css  js  c++  java
  • 关于sklearn,监督学习几种模型的对比

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    # K近邻,适用于小型数据集,是很好的基准模型,容易解释
    from sklearn.neighbors import KNeighborsClassifier
     
    # 线性模型,非常可靠的首选算法,适用于很大的数据集,也适用于高维数据
    from sklearn.linear_model import LinearRegression
     
    # 朴素贝叶斯,只适用于分类问题,比线性模型速度还快,适用于非常大的数据集和高维数据,但精度通常低于线性模型
    from sklearn.linear_model import BayesianRidge
     
    # 决策树,速度很快,不需要数据缩放,可以可视化,很容易解释
    from sklearn.tree import DecisionTreeClassifier
     
    # 随机森林,几乎总是比单个决策树的表现要好,鲁棒性很好,非常强大。不需要数据缩放,不适用于高维稀疏矩阵
    from sklearn.ensemble import RandomForestClassifier
     
    # 梯度提升决策树,精度通常比随机森林略高,与随机森林相比,训练速度更慢,但是预测速度更快,需要的内存也少,比随机森林需要更多的参数调节
    from sklearn.ensemble import GradientBoostingClassifier
     
    # 支持向量机,对于特征含义相似的中等大小的数据集很强大,需要数据缩放,对参数敏感
    from sklearn.svm import SVC
     
    # 神经网络,可以构建非常复杂的模型,特别是对于大型数据而言。对数据缩放敏感,对参数选取敏感,大型网络需要很长的训练时间
    from sklearn.neural_network import MLPClassifier

      

  • 相关阅读:
    CentOS7中使用yum安装Nginx的方法
    vsftp上传文件权限
    java传入ftp 0k
    centos 7.0 查看selinux状态|关闭|开启
    NamingException
    fastdfs服务器搭建
    安装gnome图形界面程序
    MAVEN插件-tomcat插件,java编译插件,资源文件拷贝插件
    spring ioc
    jsp全路径
  • 原文地址:https://www.cnblogs.com/valorchang/p/11397922.html
Copyright © 2011-2022 走看看