zoukankan      html  css  js  c++  java
  • Yarn集群的搭建、Yarn的架构和WordCount程序在集群提交方式

    一、Yarn集群概述及搭建

      1.Mapreduce程序运行在多台机器的集群上,而且在运行是要使用很多maptask和reducertask,这个过程中需要一个自动化任务调度平台来调度任务,分配资源,这个平台就是Yarn!

      2.Yarn提交任务的流程:

        当我们向Yarn集群提交任务后,Yarn通过Resourcemanager给任务分配资源,然后由NodeManager开辟运算空间来执行任务,在这个运算空间中开辟maptask和reducetask来运行任务。

      3.Yarn集群的搭建

      修改配置文件yarn.site.xml,添加配置信息

    <property>
    	<name>yarn.resourcemanager.hostname</name>
    	<value>hd1-1</value>
    </property> 
    <property>
    	<name>yarn.nodemanager.aux-services</name>
    	<value>mapreduce_shuffle</value>
    </property>
    

      将配置好的文件传输到集群其他机器,修改slaves文件(hdfs集群配置比较麻烦,本人没有总结,请见谅)

      启动yarn集群  start-yarn.sh

      关闭yarn集群  stop-yarn.sh

      可以访问yarn的网页客户端,resourcemanager的ip加端口号8088,如:

      192.168.50.183:8088

    二、Yarn集群的架构

      Yarn集群中包含的组件:

      1.ResourceManager,功能:

        1)处理客户端提交的任务;

        2)监控NodeManager;

        3)自动和监控程序的运行;

        4)资源的分配和调度。

      2.NodeManager,功能:

        1)管理单个节点的资源;

        2)处理来自ResourceManager‘的命令;

        3)处理程序的命令;

        4)它包含两个小的组件:container、Appmaster

        container:一种抽象的表示,包含了许多资源如内存、磁盘、网络信息等;

        Appmaster:它主要负责数据切片、申请资源、任务的监控和容错。

    三、WordCount程序提交到集群运行

      1.修改配置文件mapred-site.xml,添加配置:

    <property>
    	<name>mapreduce.framework.name</name>
    	<value>yarn</value>
    </property>

      2.将修改好的配置文件发送到集群其他机器

      3.启动hdfs、yarn集群,将wordCount程序打包上传到集群

      4.运行命令:

        hadoop jar WordCount.jar com.wyh.mr.WordCountDriver

     

  • 相关阅读:
    洛谷 P4114 Qtree1
    洛谷 P2486 [SDOI2011]染色
    洛谷 P1505 [国家集训队]旅游
    洛谷 P4281 [AHOI2008]紧急集合 / 聚会
    C++中main函数的返回值一定要是int
    局部变量作为函数返回值
    sizeof和strlen在string类中的使用
    strlen 和 sizeof 的区别
    数据结构中的堆栈和内存中的堆栈问题
    数据类型的字长,字节问题
  • 原文地址:https://www.cnblogs.com/HelloBigTable/p/10586695.html
Copyright © 2011-2022 走看看