(1)安装scipy,numpy,sklearn包
(2)从sklearn包自带的数据集中读出鸢尾花数据集data
(3)查看data类型,包含哪些数据
#加载numpy包 import numpy #加载sklearn包 from sklearn.datasets import load_iris #读出鸢尾花数据集data data=load_iris() #查看data类型 print(type(data)) #查看数据内容 print(data.keys())
运行结果:
(4)取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型
#鸢尾花的四个特征# data_feature= data.feature_names iris_data=data.data print(data_feature) print(iris_data) #鸢尾花的三个类别# data_target =data.target_names print(data_target) iris_data=data.target print(iris_data) #数据类型# type(iris_data)
运行结果:
(5)取出所有花的花萼长度(cm)的数据
#鸢尾花花萼长度的数据# sepal_length=numpy.array(list(len[0] for len in data['data'])) print(sepal_length)
运行结果:
(6)取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据
#所有花花瓣的长度# data_petal_l=[x[2] for x in data['data']] #所有花花瓣的宽度# data_petal_w=[x[3] for x in data['data']] #所有花花瓣的长度和宽度 data_petal_l_w=np.array([data_petal_l,data_petal_w])
运行结果:
(7)取出某朵花的四个特征和类别
(8)将所有花分成三个组,每组50个
(9)生成新的元祖,每组包括特征和类别
#(7)某朵花的四个特征和类别# data_flower=(data['data'][0],data['target_names'][0]) data_flower #(8)定义三个列表来存放不同类型花朵的类别# data_setosa=[] #存放类为0的花朵 data_versicolor=[] #存放类为1的花朵 data_virginica=[] #存放类为2的花朵 len(data['data']) for i in range(0,150): if data['target'][i]==0:#类别为setosa datas=data['data'][i].tolist() datas.append('setosa') print(data_setosa.append(datas)) elif data['target'][i]==1:#类别为versicolor datas=data['data'][i].tolist() datas.append('versicolor') data_versicolor.append(datas) else: datas=data['data'][i].tolist()#类别为virginica datas.append('virginica') data_virginica.append(datas) #(9)形成新的数组来存放三个类别的花朵# new_data=(np.array([data_setosa,data_versicolor,data_virginica])) print(new_data)
运行结果: