MapReduce程序运行模式

zoukankan html css js c++ java

MapReduce程序运行模式
本地运行模式：
1. mapreduce程序是被提交给LocalJobRunner在本地以单进程的形式运行
2. 而处理的数据及输出结果可以在本地文件系统，也可以在hdfs上
3. 怎样实现本地运行？写一个程序，不要带集群的配置文件
4. 本质是程序的conf中是否有mapreduce.framework.name=local以及yarn.resourcemanager.hostname参数
5. 本地模式非常便于进行业务逻辑的debug，只要在eclipse中打断点即可
集群运行模式：
1. 将mapreduce程序提交给yarn集群，分发到很多的节点上并发执行
2. 处理的数据和输出结果应该位于hdfs文件系统
3. 提交集群的实现步骤：
总结：
mapreduce的运行模式

概念：所谓的运行模式指的是由谁给mr程序提供运算时候所需要的硬件资源

两种模式：

集群模式：程序计算的资源由yarn分配分布式计算的效果生产环境线上环境的模型

本地模式：程序计算的资源由程序所在的机器本地系统模拟出单机计算的效果开发测试环境

决定什么模式运行

mapreduce.framework.name = local 本地模式 mapreduce.framework.name = yarn 集群模式

2

2

1

mapreduce.framework.name = local 本地模式

2

mapreduce.framework.name = yarn 集群模式

如果不配置默认是local模式但是要注意该集群的环境中是否配置了hadoop 如果有覆盖默认的
识别出mared-site.xml中配置

注意事项

要想本地运行mr程序需要解决hadoop native library问题 winutils.exe 程序
查看全文

相关阅读:
ZeroMQ接口函数之：zmq_msg_move
ZeroMQ接口函数之：zmq_msg_init_size
Missing artifact org.hibernate:hibernate-core:jar:4.3.0.Final
ezmorph将一种对象转换成另外一种对象
 Avalon Framework
easymock单元测试跟踪工具
 pngencoder图像转换jar
Lucene全文检索引擎
 cxf怎样提高webservice性能，及访问速度调优
 待整理-20180625

原文地址：https://www.cnblogs.com/TiePiHeTao/p/d755b31c288ab18e07ac963b0cec87eb.html

MapReduce程序运行模式

本地运行模式：

集群运行模式：

总结：

mapreduce的运行模式