zoukankan      html  css  js  c++  java
  • sklearn数据集的导入及划分

    鸢尾花数据集的导入及查看:

    ①鸢尾花数据集的导入:

    from sklearn.datasets import load_iris

    ②查看鸢尾花数据集:

    iris=load_iris()
    print("鸢尾花数据集:\n",iris)
    print("查看数据集描述:\n", iris.DESCR)
    print("查看特征值的名字:\n",iris.feature_names)
    print("查看特征数据:\n",iris.data,iris.data.shape)
    print("查看目标值名字:\n",iris.target_names)
    print("查看目标数据:\n",iris.target)

    划分数据集:

    ①导入train_test_split包:

    from sklearn.model_selection import train_test_split

    ②划分数据集:数据集划分为训练集和测试集

    x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)

    注:iris.data为数据集的特征值,iris.target为数据集的目标值,test_size为测试值的划分比例(可省,默认为0.25),

      x_train:训练集的特征值

      x_test:测试集的特征值

      y_train:训练集的目标值

      y_test:测试集的特征值

    完整代码:

    from sklearn.datasets import load_iris     #导入数据集
    from sklearn.model_selection import train_test_split
    
    def datatest():
        # 获取数据集
        iris=load_iris()
        print("鸢尾花数据集:\n",iris)
        print("查看数据集描述:\n", iris.DESCR)
        print("查看特征值的名字:\n",iris.feature_names)
        print("查看特征数据:\n",iris.data,iris.data.shape)
        print("查看目标值名字:\n",iris.target_names)
        print("查看目标数据:\n",iris.target)
    
        # 划分数据集
        x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)
        print(x_train,x_train.shape)
        print(x_test,x_test.shape)
        print(y_train,y_train.shape)
        print(y_test,y_test.shape)
    if __name__ == '__main__':
        datatest()
  • 相关阅读:
    Notepad++使用-如何导出/导入配置文件
    浏览器清除页面JS文件缓存的方法
    如何搭建一个简易的Web框架
    Visual Studio Code插件Code Runner中文乱码问题
    【笔记】做一个winform时遇到的坑
    【笔记】使用腾讯地图坐标转换
    使用js检测用户是否在用微信浏览器浏览网站
    phonegap+百度地图导航(JS版)
    浮躁的人
    【笔记】自动生成一个不重复的字符串
  • 原文地址:https://www.cnblogs.com/zyj3955/p/15414382.html
Copyright © 2011-2022 走看看