【Flink】一. 什么是Flink？

zoukankan html css js c++ java

【Flink】一. 什么是Flink？
概念

Apache Flink 是一个框架和分布式处理引擎，用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行，并能以内存速度和任意规模进行计算。

特点

处理无界和有界数据

数据可以作为有界或者无界流来处理。
1. 无界流：定义了流的开始，没有定义结束，数据输入需要立即处理。
2. 有界流（批处理）：定义了流的开始和结束。可以在获取所有数据之后再计算，所有数据可被排序并不需要有序获取。
- 本质：无界流的截取。
部署应用到任意地方

Flink 集成了所有常见的集群资源管理器，例如 Hadoop YARN、 Apache Mesos 和 Kubernetes，但同时也可以作为独立集群运行。

运行任意规模应用

并行化的数千个任务可以分布在集群中并发执行，应用可以充分利用硬件资源。

可以处理的规模：
- 处理每天处理数万亿的事件。
- 应用维护几TB大小的状态。
- 应用在数千个内核上运行。
利用内存性能

任务状态始终保留在内存中，如果状态大小超过可用内存，则会保存在能高效访问的磁盘数据结构中。

任务通过访问内存状态进行所有的计算，延迟非常低。
- 如何保证故障发生时的状态一致性？
  
  通过定期和异步对本地（内存）状态持久化存储。
流处理应用的基本组件
1. 流
  
  分类：有界与无界；实时与非实时。
2. 状态
  
  保存状态（中间处理结果），为后续操作准备。
  
  Flink对状态的支持：
  
  多种状态基础类型，如原子值（atomic value），列表（list），映射（map）。
  
  插件化的State Backend：负责管理应用程序状态，并在需要的时候进行 checkpoint。支持多种State Backend，可以将状态存在内存或者RocksDB。（RocksDB 是一种高效的嵌入式、持久化键值存储引擎）
  
  精确一次语义：Flink 的 checkpoint 和故障恢复算法保证了故障发生后应用状态的一致性。
  
  超大数据量状态：Flink 能够利用其异步以及增量式的 checkpoint 算法，存储数 TB 级别的应用状态。
  
  可弹性伸缩的应用：Flink 能够通过在更多或更少的工作节点上对状态进行重新分布，支持有状态应用的分布式的横向伸缩。
3. 时间
  
  事件总是在特定时间点发生，例如窗口聚合、会话计算、模式检测和基于时间的 join。流处理的一个重要方面是应用程序如何衡量时间，即区分事件时间（event-time）和处理时间（processing-time）。
  
  Flink对时间语义的支持：
  
  事件时间模式：使用事件时间语义的流处理应用根据事件本身自带的时间戳进行结果的计算。
  
  Watermark支持：Flink引入了watermark 的概念，用以衡量事件时间进展。Watermark也是一种平衡处理延时和完整性的灵活机制。
  
  迟到数据处理：当以带有 watermark 的事件时间模式处理数据流时，在计算完成之后仍会有相关数据到达。这样的事件被称为迟到事件。Flink 提供了多种处理迟到数据的选项，例如将这些数据重定向到旁路输出（side output）或者更新之前完成计算的结果。
  
  处理时间模式：除了事件时间模式，Flink还支持处理时间语义。处理时间模式根据处理引擎的机器时钟触发计算，一般适用于有着严格的低延迟需求，并且能够容忍近似结果的流处理应用。
分层API

Flink根据抽象程度分层，提供了三种不同的 API。每一种 API 在简洁性和表达力上有着不同的侧重，并且针对不同的应用场景。

库

Flink 具有数个适用于常见数据处理应用场景的扩展库。这些库通常嵌入在 API 中，且并不完全独立于其它 API。它们也因此可以受益于 API 的所有特性，并与其他库集成。
- 复杂事件处理(CEP)：模式检测是事件流处理中的一个非常常见的用例。Flink 的 CEP 库提供了 API，使用户能够以例如正则表达式或状态机的方式指定事件模式。CEP 库与 Flink 的 DataStream API 集成，以便在 DataStream 上评估模式。CEP 库的应用包括网络入侵检测，业务流程监控和欺诈检测。
- DataSet API：DataSet API 是 Flink 用于批处理应用程序的核心 API。DataSet API 所提供的基础算子包括map、reduce、(outer) join、co-group、iterate等。所有算子都有相应的算法和数据结构支持，对内存中的序列化数据进行操作。如果数据大小超过预留内存，则过量数据将存储到磁盘。Flink 的 DataSet API 的数据处理算法借鉴了传统数据库算法的实现，例如混合散列连接（hybrid hash-join）和外部归并排序（external merge-sort）。
- Gelly: Gelly 是一个可扩展的图形处理和分析库。Gelly 是在 DataSet API 之上实现的，并与 DataSet API 集成。因此，它能够受益于其可扩展且健壮的操作符。Gelly 提供了内置算法，如 label propagation、triangle enumeration 和 page rank 算法，也提供了一个简化自定义图算法实现的 Graph API。
故障恢复机制

7 * 24小时稳定运行

Flink通过几下多种机制维护应用可持续运行及其一致性：
- 检查点的一致性: Flink的故障恢复机制是通过建立分布式应用服务状态一致性检查点实现的，当有故障产生时，应用服务会重启后，再重新加载上一次成功备份的状态检查点信息。结合可重放的数据源，该特性可保证精确一次（exactly-once）的状态一致性。
- 高效的检查点: 如果一个应用要维护一个TB级的状态信息，对此应用的状态建立检查点服务的资源开销是很高的，为了减小因检查点服务对应用的延迟性（SLAs服务等级协议）的影响，Flink采用异步及增量的方式构建检查点服务。
- 端到端的精确一次: Flink 为某些特定的存储支持了事务型输出的功能，及时在发生故障的情况下，也能够保证精确一次的输出。
- 集成多种集群管理服务: Flink已与多种集群管理服务紧密集成，如 Hadoop YARN, Mesos, 以及 Kubernetes。当集群中某个流程任务失败后，一个新的流程服务会自动启动并替代它继续执行。
- 内置高可用服务: Flink内置了为解决单点故障问题的高可用性服务模块，此模块是基于Apache ZooKeeper 技术实现的，Apache ZooKeeper是一种可靠的、交互式的、分布式协调服务组件。
Flink能够更方便地升级、迁移、暂停、恢复应用服务

Flink的 Savepoint 服务就是为解决升级服务过程中记录流应用状态信息及其相关难题而产生的一种唯一的、强大的组件。

savepoint是一个应用服务状态的一致性快照，需要手动触发启动，当流应用服务停止时，它并不会自动删除。

saveponit特点：
- 便于升级应用服务版本: Savepoint 常在应用版本升级时使用，当前应用的新版本更新升级时，可以根据上一个版本程序记录的 Savepoint 内的服务状态信息来重启服务。它也可能会使用更早的 Savepoint 还原点来重启服务，以便于修复由于有缺陷的程序版本导致的不正确的程序运行结果。
- 方便集群服务移植: 通过使用 Savepoint，流服务应用可以自由的在不同集群中迁移部署。
- 方便Flink版本升级: 通过使用 Savepoint，可以使应用服务在升级Flink时，更加安全便捷。
- 增加应用并行服务的扩展性: Savepoint 也常在增加或减少应用服务集群的并行度时使用。
- 便于A/B测试及假设分析场景对比结果: 通过把同一应用在使用不同版本的应用程序，基于同一个 Savepoint 还原点启动服务时，可以测试对比2个或多个版本程序的性能及服务质量。
- 暂停和恢复服务: 一个应用服务可以在新建一个 Savepoint 后再停止服务，以便于后面任何时间点再根据这个实时刷新的 Savepoint 还原点进行恢复服务。
- 归档服务: Savepoint 还提供还原点的归档服务，以便于用户能够指定时间点的 Savepoint 的服务数据进行重置应用服务的状态，进行恢复服务。
监控和控制应用服务

Flink与许多常见的日志记录和监视服务集成得很好，并提供了一个REST API来控制应用服务和查询应用信息:
- Web UI方式: Flink提供了一个web UI来观察、监视和调试正在运行的应用服务。并且还可以执行或取消组件或任务的执行。
- 日志集成服务:Flink实现了流行的slf4j日志接口，并与日志框架log4j或logback集成。
- 指标服务: Flink提供了一个复杂的度量系统来收集和报告系统和用户定义的度量指标信息。度量信息可以导出到多个报表组件服务，包括 JMX, Ganglia, Graphite, Prometheus, StatsD, Datadog, 和 Slf4j.
- 标准的WEB REST API接口服务: Flink提供多种REST API接口，有提交新应用程序、获取正在运行的应用程序的Savepoint服务信息、取消应用服务等接口。REST API还提供元数据信息和已采集的运行中或完成后的应用服务的指标信息。
查看全文

相关阅读:
17. Java学习之枚举
 【myBatis】It's likely that neither a Result Type nor a Result Map was specified.
【java】ORA-12505, TNS:listener does not currently know of SID given in connect descriptor
【java】字符串截取
 【oracle】decode函数
 【myBatis】Mapped Statements collection already contains value for xxx
【java异常】expected at least 1 bean which qualifies as autowire candidate for this depende
【电脑】E470C如何关闭触摸板
 【java】spring中实例化bean的三种方法区别，使用场景
 【Excel】IF函数

原文地址：https://www.cnblogs.com/stxyg/p/12990286.html

【Flink】一. 什么是Flink？

概念

特点

处理无界和有界数据

部署应用到任意地方

运行任意规模应用

利用内存性能

流处理应用的基本组件

分层API

库

故障恢复机制

7 * 24小时稳定运行

Flink能够更方便地升级、迁移、暂停、恢复应用服务

监控和控制应用服务