zoukankan      html  css  js  c++  java
  • 机器学习第二次作业

    机器学习第二次作业

    1.Iris数据集已与常见的机器学习工具集成,请查阅资料找出MATLAB平台或Python平台加载内置Iris数据集方法,并简要描述该数据集结构。
    from sklearn import datasets
    iris = datasets.load_iris()
    

    Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种。


    2.Iris数据集中有一个种类与另外两个类是线性可分的,其余两个类是线性不可分的。请你通过数据可视化的方法找出该线性可分类并给出判断依据。
    from sklearn import datasets
    import matplotlib
    import matplotlib.pyplot as plt
    import pandas
    from pylab import *
    mpl.rcParams['font.sans-serif'] = ['SimHei'] #显示中文
    
    iris = datasets.load_iris()
    #print(iris.data) # 数据集中的数据
    #print(iris.target) #  iris的种类
    #print(iris.target_names)
    
    x=iris.data[:,2]
    y=iris.data[:,1]
    
    x_min, x_max = x.min() - 0.5, x.max() + 0.5
    y_min, y_max = y.min() - 0.5, x.max() + 0.5
    
    # Scatterplot
    plt.figure()
    plt.title('鸢尾花花瓣的长度和宽度')
    plt.scatter(x, y, c=iris.target)
    plt.xlabel('花瓣的长度(cm)')
    plt.ylabel('花瓣的宽度(cm)')
    #c指定点的颜色,当c赋值为数值时,会根据值的不同自动着色
    
    plt.xlim(x_min, x_max)
    plt.ylim(y_min, y_max)
    plt.xticks()
    plt.yticks()
    plt.show()
    

    对于三个种类,任选两个进行绘图,共6张图:


    3.去除Iris数据集中线性不可分的类中最后一个,余下的两个线性可分的类构成的数据集命令为Iris_linear,请使用留出法将Iris_linear数据集按7:3分为训练集与测试集,并使用训练集训练一个MED分类器,在测试集上测试训练好的分类器的性能,给出《模式识别与机器学习-评估方法与性能指标》中所有量化指标并可视化分类结果。

    4.将Iris数据集白化,可视化白化结果并于原始可视化结果比较,讨论白化的作用。

    5.去除Iris数据集中线性可分的类,余下的两个线性不可分的类构成的数据集命令为Iris_nonlinear,请使用留出法将Iris_nonlinear数据集按7:3分为训练集与测试集,并使用训练集训练一个MED分类器,在测试集上测试训练好的分类器的性能,给出《模式识别与机器学习-评估方法与性能指标》中所有量化指标并可视化分类结果。讨论本题结果与3题结果的差异。

    6.请使用5折交叉验证为Iris数据集训练一个多分类的贝叶斯分类器。给出平均Accuracy,并可视化实验结果。与第3题和第5题结果做比较,讨论贝叶斯分类器的优劣。
  • 相关阅读:
    [转] 64位Oracle 11g R2的客户端连接时报ORA-01019错误
    [转]Oracle11g链接提示未“在本地计算机注册“OraOLEDB.Oracle”解决方法
    [转]通过Net Manager 配置Oracle 11g本地监听服务(listener service)
    [转]jQuery Mobile动态刷新页面样式
    [转]SSIS
    [转]在SSIS中,使用“包配置”时的常见错误与解析
    使用JMH做Java微基准测试
    秒杀系统解决方案
    cookie机制和session机制
    app如何节省流量
  • 原文地址:https://www.cnblogs.com/qq291713624/p/12650296.html
Copyright © 2011-2022 走看看