zoukankan html css js c++ java

sklearn数据集的导入及划分

鸢尾花数据集的导入及查看：

①鸢尾花数据集的导入：

from sklearn.datasets import load_iris

②查看鸢尾花数据集：

iris=load_iris()
print("鸢尾花数据集：\n",iris)
print("查看数据集描述：\n", iris.DESCR)
print("查看特征值的名字：\n",iris.feature_names)
print("查看特征数据：\n",iris.data,iris.data.shape)
print("查看目标值名字：\n",iris.target_names)
print("查看目标数据：\n",iris.target)

划分数据集：

①导入train_test_split包：

from sklearn.model_selection import train_test_split

②划分数据集：数据集划分为训练集和测试集

x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)

注：iris.data为数据集的特征值，iris.target为数据集的目标值，test_size为测试值的划分比例（可省，默认为0.25），

　　x_train:训练集的特征值

　　x_test:测试集的特征值

　　y_train:训练集的目标值

　　y_test:测试集的特征值

完整代码：

from sklearn.datasets import load_iris     #导入数据集
from sklearn.model_selection import train_test_split

def datatest():
    # 获取数据集
    iris=load_iris()
    print("鸢尾花数据集：\n",iris)
    print("查看数据集描述：\n", iris.DESCR)
    print("查看特征值的名字：\n",iris.feature_names)
    print("查看特征数据：\n",iris.data,iris.data.shape)
    print("查看目标值名字：\n",iris.target_names)
    print("查看目标数据：\n",iris.target)

    # 划分数据集
    x_train,x_test,y_train,y_test=train_test_split(iris.data,iris.target,test_size=0.2)
    print(x_train,x_train.shape)
    print(x_test,x_test.shape)
    print(y_train,y_train.shape)
    print(y_test,y_test.shape)
if __name__ == '__main__':
    datatest()

查看全文

相关阅读:
Windows 之间用rsync同步数据(cwRsyncServer配置)
学习blus老师js(5)--DOM操作应用高级
 学习blus老师js(4)--DOM
scrollWidth,clientWidth,offsetWidth的区别 ---转载的
 学习blus老师js(3)--定时器的使用
 学习blus老师js(2)--深入JavaScript
学习blus老师js(1)--基础
 转转转---ROWNUMBER() OVER( PARTITION BY COL1 ORDER BY COL2)用法
 转转转--oracle 去重并按时间排序取第一条
 java正则表达式实战例子，持续更新，记下来后面就不用重新写了。。。

原文地址：https://www.cnblogs.com/zyj3955/p/15414382.html