一:读取数据
import numpy as np import matplotlib.pyplot as plt from sklearn import datasets iris = datasets.load_iris() print(type(iris)) #<class 'sklearn.utils.Bunch'> 和字典类型一样 print(iris.keys()) #包括5个key,dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names']) #分别打印下 print(iris.data)#打印数据 print(iris.target)#打印最后的标记,包括0,1,2 print(iris.target_names)#打印最后的特征值的名称 print(iris.DESCR)#打印描述信息 print(iris.feature_names)#打印样本的特征名称
二:数据探索
data = iris.data x = data[:,:2] #取前两列 plt.scatter(x[:,0],x[:,1]) plt.show()
#查看下每种花鄂片的分布情况 target = iris.target plt.scatter(x[target==0,0],x[target==0,1]) plt.scatter(x[target==1,0],x[target==1,1]) plt.scatter(x[target==2,0],x[target==2,1]) plt.show()
#查看下每种花的花瓣分布情况 x = data[:,2:] plt.scatter(x[target==0,0],x[target==0,1]) plt.scatter(x[target==1,0],x[target==1,1]) plt.scatter(x[target==2,0],x[target==2,1]) plt.show()