zoukankan      html  css  js  c++  java
  • rapidminer 数据导入及几个算子简单应用

    rapidminer 数据导入及几个算子简单应用

    一、 数据集选择

    本次实验选择的数据集为: bank-data.csv 其中有600条数据 结构如下图:

    二、数据集文件格式转换

    Rapidminer 支持的导入数据格式有如下图所示:

    所以我们需要把下载的数据集文件格式进行转换,由于本次实验下载的文件本身已是csv格式,此处不做任何操作。

    三、数据集的导入保存

    1:选择 import csv file

    2:选择 Next

    3:选择 Next

    4:选择 Next

    5:选择 Next

     

    6:选择 Finish, 完成导入数据

    7:查看目录中生成的导入数据

     

    四、流程创建及简单算子测试

    1:选择 FileàNew Process 即可创建一个空白流程:

    2:将上述中导入的数据拖放到流程中并链接:

    运行查看结果:

    2:sample算子 使用

    在Data Transformation 中选择 sample 算子 拖到 流程中:此处设置选择100条数据

    运行,查看结果:

     

    3: 在Data Transformation 中选择 sort 算子拖到 流程中:此处设置 以income属性进行升序排序:

    运行查看结果:

    4: 在Data Transformation 中选择 selection 算子拖到 流程中:此处选择4个属性:

     

    运行查看结果:

     

    5: 在Data Transformation 中选择 filterexample 算子 拖到 流程中:此处过滤掉年龄小于30岁的数据:

     

    运行查看结果:

  • 相关阅读:
    联赛模拟测试22 D. 简单计算
    联赛模拟测试22 B. 分组配对 倍增+二分
    斜率优化DP总结
    洛谷 P5490 【模板】扫描线
    容斥原理学习笔记
    联赛模拟测试20 C. Weed 线段树
    联赛模拟测试20 B. Walk (建图)
    联赛模拟测试20 A. Simple (数学)
    洛谷 P2617 Dynamic Rankings 树套树
    社区团购模式
  • 原文地址:https://www.cnblogs.com/wt869054461/p/5051337.html
Copyright © 2011-2022 走看看