# 1. 安装scipy,numpy,sklearn包 import numpy from sklearn.datasets import load_iris # 2. 从sklearn包自带的数据集中读出鸢尾花数据集data print(data.data)
# 3.查看data类型,包含哪些数据 data = load_iris() print(data.keys())
# 4.取出鸢尾花特征和鸢尾花类别数据,查看其形状及数据类型 print(data.target_names) print(data.target) type(data.target)
# 5.取出所有花的花萼长度(cm)的数据 print(numpy.array(list(len[0] for len in data['data'])))
# 6.取出所有花的花瓣长度(cm)+花瓣宽度(cm)的数据 print(numpy.array(list(len[2] for len in data['data'])) ) print(numpy.array(list(len[3] for len in data['data'])))
# 7.取出某朵花的四个特征及其类别。 print(data.data[0]) print(data.target_names[0])
# 8.将所有花的特征和类别分成三组,每组50个 setosa_data = [] versicolor_data = [] virginica_data = []
# 9.生成新的数组,每个元素包含四个特征+类别 for i in range(0,150): #生成为setosa类的鸢尾花花数据 if data.target[i] == 0: data1 = data.data[i].tolist() data1.append('setosa') setosa_data.append(data1) #生成为versicolor类的鸢尾花数据 elif data.target[i] == 1: data1 = data.data[i].tolist() data1.append('versicolor') versicolor_data.append(data1) #剩下的为virginica类的鸢尾花数据 else: data1 = data.data[i].tolist() data1.append('virginica') virginica_data.append(data1) #生成新的数组,每个元素包含四个特征+类别 newdata=(setosa_data ,versicolor_data,virginica_data) print(newdata)