zoukankan      html  css  js  c++  java
  • Mahout 的安装

    Mahout 的安装

     

    Mahout是Hadoop的一种高级应用。运行Mahout需要提前安装好Hadoop,Mahout只在Hadoop集群的NameNode节点上安装一个即可,其他数据节点上不需要安装

    1.下载

    2.配置环境变量

    3.mahout --help

    检查Mahout是否安装完好,看是否列出了一些算法

          当然,这种方法并不准确,可以通过接下来的步骤进行验证。

    4.mahout使用准备

    a.下载一个文件synthetic_control.data,下载地址http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data,并把这个文件放在$MAHOUT_HOME目录下。

    b. 查看hadoop 状态,要启动hadoop  

    c.

    c.创建测试目录testdata,并把数据导入到这个tastdata目录中(这里的目录的名字只能是testdata)

    hadoop@ubuntu:~/$ hadoop fs -mkdir testdata #

    hadoop@ubuntu:~/$ hadoop fs -put /home/hadoop/mahout-distribution-0.7/synthetic_control.data testdata

    d.使用kmeans算法(这会运行几分钟左右)

    hadoop@ubuntu:~/$ hadoop jar /home/hadoop/mahout-distribution-0.7/mahout-examples-0.7-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

    e.查看结果

    hadoop@ubuntu:~/$ hadoop fs -lsr output

    如果看到以下结果那么算法运行成功,你的安装也就成功了。

    clusteredPoints  clusters-0  clusters-1  clusters-10  clusters-2  clusters-3  clusters-4 clusters-5  clusters-6  clusters-7  clusters-8  clusters-9  data

  • 相关阅读:
    git的版本回退
    elementui的表格有多选框时翻页记住之前选择的数据
    git操作总结
    POJ 3107 Godfather
    HDU 4405 Aeroplane chess
    ZOJ 3626 Treasure Hunt I
    UVA 10537 Toll! Revisited
    POJ 3093 Margaritas on the River Walk
    POJ 1655 Balancing Act
    POJ 2342 Anniversary party
  • 原文地址:https://www.cnblogs.com/chaoren399/p/4847088.html
Copyright © 2011-2022 走看看