zoukankan      html  css  js  c++  java
  • Yarn集群的搭建、Yarn的架构和WordCount程序在集群提交方式

    一、Yarn集群概述及搭建

      1.Mapreduce程序运行在多台机器的集群上,而且在运行是要使用很多maptask和reducertask,这个过程中需要一个自动化任务调度平台来调度任务,分配资源,这个平台就是Yarn!

      2.Yarn提交任务的流程:

        当我们向Yarn集群提交任务后,Yarn通过Resourcemanager给任务分配资源,然后由NodeManager开辟运算空间来执行任务,在这个运算空间中开辟maptask和reducetask来运行任务。

      3.Yarn集群的搭建

      修改配置文件yarn.site.xml,添加配置信息

    <property>
    	<name>yarn.resourcemanager.hostname</name>
    	<value>hd1-1</value>
    </property> 
    <property>
    	<name>yarn.nodemanager.aux-services</name>
    	<value>mapreduce_shuffle</value>
    </property>
    

      将配置好的文件传输到集群其他机器,修改slaves文件(hdfs集群配置比较麻烦,本人没有总结,请见谅)

      启动yarn集群  start-yarn.sh

      关闭yarn集群  stop-yarn.sh

      可以访问yarn的网页客户端,resourcemanager的ip加端口号8088,如:

      192.168.50.183:8088

    二、Yarn集群的架构

      Yarn集群中包含的组件:

      1.ResourceManager,功能:

        1)处理客户端提交的任务;

        2)监控NodeManager;

        3)自动和监控程序的运行;

        4)资源的分配和调度。

      2.NodeManager,功能:

        1)管理单个节点的资源;

        2)处理来自ResourceManager‘的命令;

        3)处理程序的命令;

        4)它包含两个小的组件:container、Appmaster

        container:一种抽象的表示,包含了许多资源如内存、磁盘、网络信息等;

        Appmaster:它主要负责数据切片、申请资源、任务的监控和容错。

    三、WordCount程序提交到集群运行

      1.修改配置文件mapred-site.xml,添加配置:

    <property>
    	<name>mapreduce.framework.name</name>
    	<value>yarn</value>
    </property>

      2.将修改好的配置文件发送到集群其他机器

      3.启动hdfs、yarn集群,将wordCount程序打包上传到集群

      4.运行命令:

        hadoop jar WordCount.jar com.wyh.mr.WordCountDriver

     

  • 相关阅读:
    CSS 仿 iOS 系统通知数字样式
    Asp.Net Grieview Eval 绑定数据 调用JS事件
    C#:decimal的去0显示
    WebService 错误:无法加载协定为xxx的终结点配置部分,因为找到了该协定的多个终结点配置
    C#:调用webservice时提示对操作的回复消息正文进行反序列化时出错
    C#:生成短网址
    C#:优惠券代码
    C# 调用webservice 几种办法(转载)
    ASP.NET: 正在中止线程 错误原及解决方法
    IOS:Safari不兼容Javascript中的Date问题
  • 原文地址:https://www.cnblogs.com/HelloBigTable/p/10586695.html
Copyright © 2011-2022 走看看