zoukankan      html  css  js  c++  java
  • python机器学习-数据集的使用

    使用Scikit-learn

    安装

    pip3 install Scikit-learn==0.19.1
    

    安装好之后可以通过以下命令查看是否安装成功

    import sklearn
    
    • 注:安装scikit-learn需要Numpy, Scipy等

    1 scikit-learn数据集API介绍

    • sklearn.datasets
      • 加载获取流行数据集
      • datasets.load_*()
        • 获取小规模数据集,数据包含在datasets里
      • datasets.fetch_*(data_home=None)
        • 获取大规模数据集,需要从网络上下载,函数的第一个参数是data_home,表示数据集下载的目录,默认是 ~/scikit_learn_data/

    2 sklearn小数据集

    • sklearn.datasets.load_iris()  加载并返回鸢尾花数据集

    • sklearn.datasets.load_boston()  加载并返回波士顿房价数据集
    #数据集的使用
    def decision_iris_test():
        # 数据集sklearn的使用
        iris=load_iris()
        print("鸢尾花数据集的返回值:
    ",iris)
        print("鸢尾花的特征值:
    ",iris["data"])
        print("鸢尾花的目标值:
    ",iris.target)
        print("鸢尾花特征值的名字:
    ",iris.feature_names)
        print("鸢尾花目标值的名字:
    ", iris.target_names)
        print("鸢尾花的描述:
    ", iris.DESCR)
        #数据集的划分,训练集,测试集
        #x_train训练集特征值,x_test测试集特征值,y_train训练集目标值,y_test测试机目标值
        x_train,x_test,y_tarin,y_test=train_test_split(iris.data,iris.target,test_size=0.2,random_state=22)
        print("训练集的特征值:
    ",x_train,x_train.shape)
  • 相关阅读:
    哈希表
    java读写xml文件
    Java学习之Hessian通信基础
    DevExpress 中 gridView编辑单元格,失去焦点后,内容继而消失
    DevExpress控件的GridControl控件小结
    Spring 架构图
    WebLogic和Tomcat的区别
    EJB到底是什么,真的那么神秘吗??
    C# 枚举类型
    关于C#的Main(String[] args)参数输入问题
  • 原文地址:https://www.cnblogs.com/fengchuiguobanxia/p/15432458.html
Copyright © 2011-2022 走看看