zoukankan      html  css  js  c++  java
  • rapidminer 数据导入及几个算子简单应用

    rapidminer 数据导入及几个算子简单应用

    一、 数据集选择

    本次实验选择的数据集为: bank-data.csv 其中有600条数据 结构如下图:

    二、数据集文件格式转换

    Rapidminer 支持的导入数据格式有如下图所示:

    所以我们需要把下载的数据集文件格式进行转换,由于本次实验下载的文件本身已是csv格式,此处不做任何操作。

    三、数据集的导入保存

    1:选择 import csv file

    2:选择 Next

    3:选择 Next

    4:选择 Next

    5:选择 Next

     

    6:选择 Finish, 完成导入数据

    7:查看目录中生成的导入数据

     

    四、流程创建及简单算子测试

    1:选择 FileàNew Process 即可创建一个空白流程:

    2:将上述中导入的数据拖放到流程中并链接:

    运行查看结果:

    2:sample算子 使用

    在Data Transformation 中选择 sample 算子 拖到 流程中:此处设置选择100条数据

    运行,查看结果:

     

    3: 在Data Transformation 中选择 sort 算子拖到 流程中:此处设置 以income属性进行升序排序:

    运行查看结果:

    4: 在Data Transformation 中选择 selection 算子拖到 流程中:此处选择4个属性:

     

    运行查看结果:

     

    5: 在Data Transformation 中选择 filterexample 算子 拖到 流程中:此处过滤掉年龄小于30岁的数据:

     

    运行查看结果:

  • 相关阅读:
    IBM Minus One(water)
    约瑟夫问题的循环链表实现
    双向链表(差不多)
    单向链表的建立,插入,删除(复习一下)
    找新朋友(欧拉函数)
    验证角谷猜想(hd1279)
    Wolf and Rabbit(gcd)
    Big Number(大数)
    字串数(高精度组合数)
    寻找素数对(hd1262)
  • 原文地址:https://www.cnblogs.com/wt869054461/p/5051337.html
Copyright © 2011-2022 走看看