zoukankan      html  css  js  c++  java
  • Flink从入门到精通(一)

    1. 什么是Flink?

    官网的定义如下:

    Apache Flink is a framework and distributed processing engine for stateful computations over unbounded and bounded data streams.

    Flink has been designed to run in all common cluster environments, perform computations at in-memory speed and at any scale.

    从官网的定义我们可以看出

    1. 首先,它是一个分布式处理引擎和框架

    2. 其次,它进行有状态的计算,针对有界和无界的数据流式计算

      这里有几点我想详细解释一下:

      2-1) 什么叫有界和无界数据?

       有界数据集:有限不会改变的数据集合

       无界数据(无穷数据集): 无穷的持续集成的数据集合

         那么那些常见的无穷数据集有哪些呢?

           用户与客户端的实时交互数据(用户行为)
          应用实时产生的日志
         金融市场的实时交易记录

      2-2) 什么是流式计算?

        说到流式计算我们就不得不提一下批处理计算,因为它们是不同的东西。

          批处理:在预先定义的时间内运行计算,当完成时释放计算机资源

          流式:只要数据一直在产生,计算就持续地进行

    3. Flink提供内存级的计算速度和高可扩展性

    2. Flink图解重点

  • 相关阅读:
    .net core
    web api对接小程序基本签名认证
    微信小程序主要开发语言
    C# 用Singleton类构建多线程单例模式
    web api与mvc的区别
    sql 简单分页查询(ror_number() over)
    sql查询当前数据库的所有表名
    C# 身份证号码15位和18位验证
    C# 人民币大写金额转换
    编写类-用户类
  • 原文地址:https://www.cnblogs.com/davidgu/p/12661922.html
Copyright © 2011-2022 走看看