zoukankan      html  css  js  c++  java
  • MapReduce程序运行模式

    本地运行模式:

     

    1. mapreduce程序是被提交给LocalJobRunner在本地以单进程的形式运行
    2. 而处理的数据及输出结果可以在本地文件系统,也可以在hdfs上
    3. 怎样实现本地运行?写一个程序,不要带集群的配置文件
    4. 本质是程序的conf中是否有mapreduce.framework.name=local以及yarn.resourcemanager.hostname参数
    5. 本地模式非常便于进行业务逻辑的debug,只要在eclipse中打断点即可

    集群运行模式:

     

    1. 将mapreduce程序提交给yarn集群,分发到很多的节点上并发执行
    2. 处理的数据和输出结果应该位于hdfs文件系统
    3. 提交集群的实现步骤:
      1. 将程序打成JAR包,然后在集群的任意一个节点上用hadoop命令启动
      2. hadoop jar wordcount.jar cn.itcast.bigdata.mrsimple.WordCountDriver args

    总结:

    mapreduce的运行模式

    • 概念:所谓的运行模式指的是由谁给mr程序提供运算时候所需要的硬件资源
    • 两种模式:
      • 集群模式:程序计算的资源由yarn分配 分布式计算的效果 生产环境线上环境的模型
      • 本地模式:程序计算的资源由程序所在的机器本地系统模拟出 单机计算的效果 开发测试环境
      • 
        
      • 决定什么模式运行
        
        
      •  
         
         
        2
        2
         
         
         
         
        1
        mapreduce.framework.name  = local  本地模式
        2
        mapreduce.framework.name  = yarn   集群模式
         
         


        如果不配置 默认是local模式 但是要注意该集群的环境中是否配置了hadoop 如果有覆盖默认的
        识别出mared-site.xml中配置
      • 注意事项

        要想本地运行mr程序 需要解决hadoop native library问题 winutils.exe 程序

     



  • 相关阅读:
    ZeroMQ接口函数之 :zmq_msg_move
    ZeroMQ接口函数之 :zmq_msg_init_size
    Missing artifact org.hibernate:hibernate-core:jar:4.3.0.Final
    ezmorph将一种对象转换成另外一种对象
    Avalon Framework
    easymock单元测试跟踪工具
    pngencoder图像转换jar
    Lucene全文检索引擎
    cxf怎样提高webservice性能,及访问速度调优
    待整理-20180625
  • 原文地址:https://www.cnblogs.com/TiePiHeTao/p/d755b31c288ab18e07ac963b0cec87eb.html
Copyright © 2011-2022 走看看