zoukankan      html  css  js  c++  java
  • Mahout 0.10.1安装(Hadoop2.6.0)及Kmeans测试

    1.版本和安装路径

    Ubuntu 14.04

    Mahout_Home=/opt/mahout-0.10.1

    Hadoop_Home=/usr/local/hadoop

    Mavent_Home=/opt/apache-mavent-3.3.3

    Hadoop version=2.6.0

    Mahout version=0.10.1

    Mavent version=3.3.3

    2.Mahout重新编译

    Mahout下载:http://archive.apache.org/dist/mahout/

    在2.0版本以上的hadoop上使用时, 需要重新编译

    $ git clone https://github.com/apache/mahout.git
    $ mvn clean package -Dhadoop2 -Dhadoop2.version=2.6.0 -DskipTests=true
     
    编译完成后将编译出来的
    mahoutexamples argetmahout-examples-SNAPSHOT-0.10.1.jar
    mahoutexamples argetmahout-examples-SNAPSHOT-0.10.1-job.jar
    替换mahout目录中的mahout-examples-0.10.1.jar, mahout-examples-0.10.1-job.jar两个文件

    3.环境变量

    sudo gedit ~/.bashrc
    

      

    #Mahout
    HADOOP_HOME=/usr/local/hadoop
    HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
    
    MAHOUT_HOME=/opt/mahout-0.10.1
    MAHOUT_CONF_DIR=$MAHOUT_HOME/conf
    
    PATH=$PATH:$HADOOP_HOME/bin:$MAHOUT_HOME/bin
    
    #Maven
    MAVEN_HOME=/opt/apache-maven-3.3.3
    export MAVEN_HOME
    export PATH=${PATH}:${MAVEN_HOME}/bin
    

    安装路径要跟自己的要一致

    环境变量更改立即生效:

    source ~/.bashrc

    在Mahout安装路径下运行命令:mahout,安装成功。

    4.kmeans简单运行

    下载测试数据集synthetic_control.data

    http://archive.ics.uci.edu/ml/databases/synthetic_control/

    在HDFS中创建testdata目录,必须是testdata目录!并且每次运行hadoop都要删掉原来的output目录!

    bin/hadoop fs -mkdir -p testdata

    上传到HDFS中testdata目录中

    hadoop fs -copyFromLocal /home/hadoop/桌面/synthetic_control.data testdata
    

    在Mahout安装目录下启动kmeans

    mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
    

    结果:

    查看output目录:

    eclipse下

      

  • 相关阅读:
    Advanced Sort Algorithms
    Bash Excercises
    分布式Java应用与实践 (一)
    Configure HttpClient correctly
    Automated Front End Test
    linux 判断一个用户是否存在 _fei
    linux 系统扩容 VMware Centos---VMware ESXi
    ESX 基本使用 _fei
    centos jira wiki 开机自启
    svn 添加子目录后检出失败 _fei
  • 原文地址:https://www.cnblogs.com/zhangduo/p/4679907.html
Copyright © 2011-2022 走看看