zoukankan      html  css  js  c++  java
  • spark streaming --1. 概念

    spark streaming是基于Apache spark核心API构建的一套并发流处理库,其对实时流数据的处理具备可扩展性、高吞吐量和可容错性等特点。

    spark streaming输入数据的来源既可以是kafka、flume、Twitter、zeroMQ、Kinesis等消息队列系统,也可以是传统的TCP套接字传输的原生数据。

    工作机制:spark streaming接受实时的输入数据流,并将数据分割成批数据batches供spark核心系统处理,经spark系统处理数据后,得到最终的结果批数据。

    spark streaming提供了一个名为离散流(Discretized Stream,简称DStream)的高级系统抽象,用于表示连续的数据流。在系统内部,DStream由一系列的RDD构成。

  • 相关阅读:
    IDEA快捷键
    nginx之epoll模型的详细介绍
    Liunx权限修改命令
    小技巧3
    小技巧2
    小技巧1
    Ajax的简单使用
    dubbo
    快速创建虚拟机
    登录和注册功能的实现
  • 原文地址:https://www.cnblogs.com/xl717/p/11969345.html
Copyright © 2011-2022 走看看