zoukankan      html  css  js  c++  java
  • Python机器学习4

    数据集构成:特征值+目标值

    Scikit-learn包含的内容:

    1. classification分类

    2. regression回归

    3. clustering聚类

    4. dimensionality reduction降维

    5. preprocessing特征工程

    6. 模型选择、调优

    如何在sklearn中实现数据集的划分:

    from sklearn.model_selection import train_test_split
    
    train_test_split(iris.data,iris.target)
    

    具体使用代码见:

    from sklearn.datasets import load_boston, load_iris
    from sklearn.model_selection import train_test_split  # 用于划分数据集
    
    
    # print(__doc__)  # None ?
    
    
    def demo():
        iris_datasets = load_iris()
        print("Show Datasets:
    ", iris_datasets)
        print("Show Description:
    ", iris_datasets["DESCR"])  # 打印数据集的信息
        print("Show Eigenvalue's Name:
    ", iris_datasets.feature_names)  # 查看特征值的名字
        print("Show Eigenvalue:
    ", iris_datasets.data.shape)  # 查看特征值的形状 (150, 4):150个样本 4个特征
    
    
        # 数据集的划分
        # 传入特征值和目标值,后面部分选填(测试集的范围(默认是0.25)、随机数种子)
        x_train, x_test, y_train, y_test = train_test_split(iris_datasets.data, iris_datasets.target,
                                                            test_size=0.2,
                                                            random_state=22)
        print("训练集的特征值:
    ", x_train, x_train.shape)  # 特征值和x_train有多少行多少列
    
    
        return None  #
    
    
    if __name__ == '__main__':
        demo()  # 使用sklearn数据集
    
  • 相关阅读:
    BZOJ 1024: [SCOI2009]生日快乐
    BZOJ 3038: 上帝造题的七分钟2
    BZOJ 2005: [Noi2010]能量采集
    费用流&网络流模版
    BZOJ 1070: [SCOI2007]修车
    BZOJ 3039: 玉蟾宫
    BZOJ 1022: [SHOI2008]小约翰的游戏John
    BZOJ 2456: mode
    BZOJ 1015: [JSOI2008]星球大战starwar
    Unity实现IOS原生分享
  • 原文地址:https://www.cnblogs.com/OFSHK/p/15031977.html
Copyright © 2011-2022 走看看