zoukankan      html  css  js  c++  java
  • hadoop伪分布式之配置yarn并运行MR程序(WordCount)

    1、配置集群

    (1)在yarn-env.sh中配置JAVA_HOME

    export JAVA_HOME=/opt/module/jdk1.8.0_11

    (2)在yarn-site.xml中配置

    <!--Reducer获取数据的方式-->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <!--指定yarn的ResourceManager的地址-->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hadoop01</value>
    </property>

    (3)配置mapred-env.sh

    export JAVA_HOME=/opt/module/jdk1.8.0_11

    (4)将mapred-site.xml.template重命名为mapred-site.xml

    mv mapred-site.xml.template mapred-site.xml

    并配置:

    <!--指定MR运行在yarn上-->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

    二、启动集群

    确保NameNode和DataNode已经启动,用jps查看,若没启动,则进行启动(在hadoop-2.9.2目录下)

    sbin/hadoop-daemon.sh start namenode

    sbin/hadoop-daemon.sh start datanode

    (1) 启动ResourceManager

    sbin/yarn-daemon.sh start resourcemanager

    (2)启动NodeManager

    sbin/yarn-daemon.sh start nodemanager

    systemctl status firewalld.service查看防火墙状态

    systemctl stop firewalld.service 关闭运行的防火墙

    (3) 查看集群

    (4)执行WordCount

    之前操作参考:https://www.cnblogs.com/xiximayou/p/12389363.html

    bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar wordcount /user/gong/input /user/gong/output

    然后就可以看到:

     

    在控制台:

    在50070端口:

    删除应用:sh yarn application -kill jobId 

  • 相关阅读:
    java线程池
    缓存命中
    dubbo面向服务使用
    ActiveMQ
    创建证书
    struts2的运行原理以及底层的工作机制
    jdbc,mybatis,hibernate各自优缺点及区别
    struts2与springmvc的区别
    linux vi 命令编辑操作
    Linux FTP基本操作命令 ( 序列二 ftp)
  • 原文地址:https://www.cnblogs.com/xiximayou/p/12395035.html
Copyright © 2011-2022 走看看