zoukankan      html  css  js  c++  java
  • scikit-learn笔记之初次接触

    一.加载数据:

    然后看一下有多少个特征和类别以及它们的名字:

    二.数据可视化::

    由于该套数据集有4个特征,所以只能选取2个特征进行显示。

    可见红色和绿色的点混在一起,所以再选择其他特征作为坐标轴:

    这样就可以区别这三种类别了。

    补充:还可以用三维视图:

    from sklearn import datasets
    import numpy as np
    import matplotlib.pyplot as plt
    from mpl_toolkits.mplot3d import Axes3D
    iris = datasets.load_iris()
    X = iris.data
    Y = iris.target
    x0 = X[:,0]; x1 = X[:,1]; x2 = X[:,2]
    ax = plt.subplot(111, projection='3d')
    color = np.array(['r', 'g', 'b'])
    Color = np.array(color[Y])
    ax.scatter(x0,x1,x2, c=Color)
    plt.show()

    三.训练分类器:

    四.进行预测:

    五.规范化过程:

    import numpy as np
    from sklearn import datasets
    import matplotlib.pyplot as plt
    from sklearn import metrics
    from sklearn.naive_bayes import GaussianNB
    from sklearn.model_selection import train_test_split
    from sklearn.preprocessing import StandardScaler
    
    iris = datasets.load_iris()    #加载数据
    X = iris.data
    Y = iris.target
    
    scaler = StandardScaler()    #特征归一化
    X = scaler.fit_transform(X)
    
    train_X,test_X, train_y, test_y = train_test_split(X, Y, test_size=0.2)    #划分训练集、测试集
    model = GaussianNB()                               #创建贝叶斯分类器
    model.fit(train_X, train_y)  
    
    expected = test_y            #实际值
    predicted = model.predict(test_X)     #预测值
    print metrics.classification_report(expected, predicted)    #输出分类效果
  • 相关阅读:
    机器学习-TensorFlow2.0安装简易教程
    14 深度学习-卷积
    用python画出你的童年回忆
    13-垃圾邮件分类2
    事后诸葛亮分析
    团队项目四:项目冲刺之日志集合贴
    第 1 篇 Scrum 冲刺博客
    团队作业1——团队展示&选题
    结对作业:四则运算(Java+JavaFX)
    JavaGUI之Swing简单入门示例
  • 原文地址:https://www.cnblogs.com/DOLFAMINGO/p/9580567.html
Copyright © 2011-2022 走看看