zoukankan      html  css  js  c++  java
  • rapidminer 数据导入及几个算子简单应用

    rapidminer 数据导入及几个算子简单应用

    一、 数据集选择

    本次实验选择的数据集为: bank-data.csv 其中有600条数据 结构如下图:

    二、数据集文件格式转换

    Rapidminer 支持的导入数据格式有如下图所示:

    所以我们需要把下载的数据集文件格式进行转换,由于本次实验下载的文件本身已是csv格式,此处不做任何操作。

    三、数据集的导入保存

    1:选择 import csv file

    2:选择 Next

    3:选择 Next

    4:选择 Next

    5:选择 Next

     

    6:选择 Finish, 完成导入数据

    7:查看目录中生成的导入数据

     

    四、流程创建及简单算子测试

    1:选择 FileàNew Process 即可创建一个空白流程:

    2:将上述中导入的数据拖放到流程中并链接:

    运行查看结果:

    2:sample算子 使用

    在Data Transformation 中选择 sample 算子 拖到 流程中:此处设置选择100条数据

    运行,查看结果:

     

    3: 在Data Transformation 中选择 sort 算子拖到 流程中:此处设置 以income属性进行升序排序:

    运行查看结果:

    4: 在Data Transformation 中选择 selection 算子拖到 流程中:此处选择4个属性:

     

    运行查看结果:

     

    5: 在Data Transformation 中选择 filterexample 算子 拖到 流程中:此处过滤掉年龄小于30岁的数据:

     

    运行查看结果:

  • 相关阅读:
    集合的笼统介绍之Collection
    集合的笼统介绍之ArrayList
    final关键字+static关键字+匿名对象
    多态
    练习018:搜索插入位置
    练习017:实现strStr()
    练习016:移除元素
    练习015:删除排序数组中的重复项
    练习014:合并两个有序链表
    用JS实现链表
  • 原文地址:https://www.cnblogs.com/wt869054461/p/5051337.html
Copyright © 2011-2022 走看看