zoukankan
html css js c++ java
常见分布式计算框架特点
Hadoop
:
Hadoop
在使用原理上基本上遵照了
Map
、
Reduce
这种一种模式进行项目的实际开发与交互。将一个个任务分解成映射与合并两种方式。然而通过映射进行分类与简化,从而产生部分归并结果,然后对同类结果进行归并计算;
因为
Hadoop
的中间结果须要依托于
hdfs
,从而须要经历硬盘及网络
io
的过程所以在实时性方面表现稍差;
Hadoop
主要处理
hdfs
上的文本文件。而文本文件内容本身也是半结构化的。
之前的资源调度就是靠当中的
master
,之后
hadoop2.0
之后引入
yarn
进行资源的统一管理。
Spark
:
Spark
的原理是将任务进行分解。而且在每一步任务上进行对应的操作处理,同一时候依据操作处理顺序构建
DAG
图,从而应用
DAG
引擎进行相关操作。
因为
Spark
在进行处理时主要使用内存所以基本能够做到实时性。同一时候,在进行
DAG
引擎优化方面对速度也有一定程度提升;
Spark
本身是通过
DAGScheduler
与
TaskScheduler
实现任务调度以及计算节点切换,如今
mesos
及
yarn
都对
spark
进行了一定程度的支持;
Spark
的数据模型使用
RDD
这样的弹性的存储,而且基于该数据模型构建了对应的数据依赖,从而实现一定的容错机制。
Spark
基本上都执行在内存中,能够使用
yarn
或者
mesos
进行资源的统一管理。然后在上面进行
spark
的相关任务调度;
Storm
:
Storm
是基于消息源(
spout
)获取数据发送信息,而且将信息发送到
bolt
形成对应的
tuple
,之后在此基础上继续构建数据的处理规则。处理规则须要觉得变成实现。
Storm
本身是流式数据处理,所以在实现实时性方面有一定的优势;
Storm
的数据模型没有体现依赖关系。没有进行特别的存储结构设计,同一时候在数据模型处理方面只进行结构设计而没有进行优化。
资源调度以及使用方面直接依照用户的
i
自己定义方式进行,须要用户编写大量的流程控制问题,同一时候没有在资源啊隔离放
main
做些谢智导致可能出现局部任务影响全局的问题。
LinkedIn Samza
:
领英出品,主要结合
kafka
的设计思想将数据进行分块,同一时候保证数据的局部有序性,而任务调度方面进行简单操作后进行输入与输出。
进行实时数据流处理。而且综合了
Kafka
这种消息队列;
通过类似于
Kafka
的数据结构。实现消息的分区、局部有序以及消息的重读机制,同一时候配合持久化方法可实现滑动窗体;
资源的管理主要借助于
Yarn
,利用消息队列的方式显现消息处理,同一时候通过备份方式显示数据局部容错;
Yahoo Apache S4
:
Yahoo
出品。与
Storm
比較类似,基于每一个节点处理不同的功能,相同是组成了一个
DAG
图去描写叙述数据处理工作。
在雅虎内部使用。完毕每秒数以千计的搜索查询。
以事件没基础进行设计,将每一次数据当成是一个事件来处理
使用
ZooKeeper
进行分布式数据的管理。在内部实现了负载均衡、容错、分发、路由等功能;
查看全文
相关阅读:
java9新特性-9-语法改进:try语句
10.04 FZSZ模拟Day1 总结
10.03模拟总结
HNOI2012 永无乡
ZJOI2007 报表统计
HNOI2004 宠物收养场
HNOI2002 营业额统计
Splay 区间反转
Splay基本操作
HEOI2016 树
原文地址:https://www.cnblogs.com/zfyouxi/p/5116388.html
最新文章
bzoj 1002 [FJOI2007]轮状病毒——打表找规律
bzoj 3924 [Zjoi2015]幻想乡战略游戏——动态点分治(暴力移动找重心)
bzoj 1127 KUP —— 最大子矩形+答案构造
bzoj 4711 小奇挖矿 —— 树形DP
bzoj 3481 DZY loves math —— 反演+Pollard_rho分解质因数
bzoj 4668 冷战 —— 并查集按秩合并
洛谷 P1311 选择客栈 —— 水题
洛谷 P1313 计算系数 —— 水题
bzoj 1086 王室联邦 —— 思路题
bzoj 3809 Gty的二逼妹子序列 —— 莫队+分块
热门文章
bzoj 3781 小B的询问 —— 莫队
java9新特性-18-统一的JVM日志系统
java9新特性-17-智能Java编译工具
java9新特性-16-Deprecated的相关API
java9新特性-15-全新的HTTP 客户端API
java9新特性-13-增强的 Stream API
java9新特性-14-多分辨率图像 API
java9新特性-12-集合工厂方法:快速创建只读集合
java9新特性-11-String存储结构变更
java9新特性-10-语法改进:UnderScore(下划线)使用的限制
Copyright © 2011-2022 走看看