Apache Beam的目标

zoukankan html css js c++ java

Apache Beam的目标
　　不多说，直接上干货！

Apache Beam的目标
- 统一（UNIFIED）
　　基于单一的编程模型，能够实现批处理（Batch processing）、流处理（Streaming Processing），通常的做法是把待处理的数据集（Dataset）统一，一般会把有界（Bound）数据集作为无界（Unbound）数据集的一种特殊情况来看待，比如Apache Flink便是按照这种方式处理，在差异化的API层之上构建一个统一的API层。
- 可移植（PORTABLE）
　　在多个不同的计算环境下，都能够执行已经定义好的数据处理Pipeline。也就是说，对数据集处理的定义（即构建的Data Pipeline），与最终所要Deploy的执行环境完全无关。这对实现数据处理的企业是非常友好的，当下数据处理新技术不断涌现，企业数据处理平台也为了能够与时俱进并提高处理效率，当然希望在底层计算平台升级的过程中无需重写上层已定义的Data Pipeline。
　　目前，Apache Beam项目开发整体来看还处在初期，初步决定底层执行环境支持主流的计算平台：Apache Apex、Apache Flink、Apache Spark、Google Cloud Dataflow。实际上，Apache Beam的这种统一编程模型，可以支持任意的计算引擎，通过Data Pipeline层与执行引擎层之间开发一个类似Driver的连接器即可实现。
- 可扩展（EXTENSIBLE）
　　实现任意可以共享的Beam SDK、IO connector、Transform库。
查看全文

相关阅读:
Dynamics CRM
Cordova
《linux就该这么学》第二节课，安装红帽7，基础命令至2.3小节的笔记
 《linux就该这么学》开课，linux之路新开始
 《linux就该这么学》找到一本不错的Linux电子书，《Linux就该这么学》。
mongodb3.4.5用http访问28017端口
 mongodb安装步骤
 linux安装docker
centos 遇到/dev/mapper/cl-root 100% 解决方法
 本机ping不通虚拟机，但虚拟机可以ping通本机

原文地址：https://www.cnblogs.com/zlslch/p/7609602.html