zoukankan      html  css  js  c++  java
  • scikit-learn内置数据集

    scikit-learn 现在最新稳定版本为0.20.0

    提供了以下几个数据集

    其中数据路径都在sklearn包下的datasets/data目录下

    下面我分别介绍每个数据集

    iris

    iris是个多类别数据集,每个类别下有50个样本,特征4维,且都是实数类型, 适用于分类模型

    boston

    预测boston房价, 都是实数特征,总共13维, 适用于回归模型

    digits

    数据由8*8的图片组成,共64维特征,0-9共10个类别,适用于分类模型

    toy

    toy数据6*2, 共2维特征, 两类, 适用于简单的二分类

    clf_small

    clf共14维特征,0,1两类别,适用于简单二分类模型

    reg_small

    共14维特征, 适用于简单回归模型

    multilabel

    人工制造的30*10维的多标签数据

    sparse-pos

    sparse-neg

    sparse-mix

    zeros

  • 相关阅读:
    2-3-4 tree留坑
    CCPC final Cockroaches
    对拍模板
    使用cronolog按日期分割日志
    linux git 命了
    变量加减乘除运算
    根据pom标签修改
    根据符号获取字符
    shell循环字符串数组
    git ssh key配置
  • 原文地址:https://www.cnblogs.com/energy1010/p/9932420.html
Copyright © 2011-2022 走看看