zoukankan      html  css  js  c++  java
  • rapidminer 数据导入及几个算子简单应用

    rapidminer 数据导入及几个算子简单应用

    一、 数据集选择

    本次实验选择的数据集为: bank-data.csv 其中有600条数据 结构如下图:

    二、数据集文件格式转换

    Rapidminer 支持的导入数据格式有如下图所示:

    所以我们需要把下载的数据集文件格式进行转换,由于本次实验下载的文件本身已是csv格式,此处不做任何操作。

    三、数据集的导入保存

    1:选择 import csv file

    2:选择 Next

    3:选择 Next

    4:选择 Next

    5:选择 Next

     

    6:选择 Finish, 完成导入数据

    7:查看目录中生成的导入数据

     

    四、流程创建及简单算子测试

    1:选择 FileàNew Process 即可创建一个空白流程:

    2:将上述中导入的数据拖放到流程中并链接:

    运行查看结果:

    2:sample算子 使用

    在Data Transformation 中选择 sample 算子 拖到 流程中:此处设置选择100条数据

    运行,查看结果:

     

    3: 在Data Transformation 中选择 sort 算子拖到 流程中:此处设置 以income属性进行升序排序:

    运行查看结果:

    4: 在Data Transformation 中选择 selection 算子拖到 流程中:此处选择4个属性:

     

    运行查看结果:

     

    5: 在Data Transformation 中选择 filterexample 算子 拖到 流程中:此处过滤掉年龄小于30岁的数据:

     

    运行查看结果:

  • 相关阅读:
    接口(interface)的使用于注意事项
    构造方法
    MySQL数据库软件
    final与static的作用
    区分like和in
    list,set,map各有什么异同?
    简述 Overload 与 Override
    标识符的基础知识
    类的继承关系
    MySQL常见索引失效
  • 原文地址:https://www.cnblogs.com/wt869054461/p/5051337.html
Copyright © 2011-2022 走看看