Flume是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
收集、聚合事件流数据的分布式框架通常用于log数据 采用ad-hoc方案,明显优点如下: 可靠的、可伸缩、可管理、可定制、高性能 声明式配置,可以动态更新配置 提供上下文路由功能 支持负载均衡和故障转移 功能丰富 完全的可扩展
数据收集的框架