zoukankan      html  css  js  c++  java
  • Kafka总结

    什么是Kafka

    由LinkedIn在11年开源,还有例如:分布式数据同步系统Databus、高性能计算引擎Cubert、Java异步处理框架ParSeq。

    * streaming platform has three key capabilities:* Publish and subscribe to streams of records, similar to a message queue or enterprise messaging system.* Store streams of records in a fault-tolerant durable way.* Process streams of records as they occur.
    在这里插入图片描述

    Kafka基本概念

    • Producer:消息和数据的生产者,向Kafka的一个topic发布消息的进程/代码/服务
    • Consumer:消息和数据的消费者,订阅数据(Topic)并且处理其发布的消息的进程/代码/服务。
    • Consumer Group:逻辑概念,对于同一个topic,会广播给不同的group,一个group中,只有一个consumer可以消费该消息。
    • Broker:物理概念,Kafka集群中的每个Kafka节点。
    • Topic:逻辑概念,Kafka消息的类别,对数据进行区分、隔离。
    • Partition:物理概念,Kafka下数据存储的基本单元。一个Topic数据会被分散存储到多个Partition,每个Partition是有序的。
    • Replication:同一个Partition可能会有多个Replica,多个Replica之间数据是一样的。
    • Replication Leader:一个Partition的多个Replica上,需要个Leader负责该Partition上与Producer和Consumer交互,Leader有且只有一个。
    • ReplicaManager:负责管理当前broker所有分区和副本的信息,处理KafkaController发起的一些请求,副本状态的切换、添加/读取消息等。

    Kafka基本结构


    在这里插入图片描述

    Kafka消息结构

    在这里插入图片描述

    Kafka的特点

    分布式

    • 多分区
    • 多副本
    • 多订阅者
    • 基于Zookeeper消息调度

    高性能

    • 高吞吐量
    • 低延迟
    • 高并发
    • 时间复杂度为O(1)

    持久性与扩展性

    • 数据可持久化
    • 容错性
    • 支持在线水平扩展
    • 消息自动平衡

    Kafka应用场景

    • 消息队列
    • 行为跟踪
    • 元信息监控
    • 日志收集
    • 流处理
    • 事件源
    • 持久性日志(commit log)

    Kafka应用案例

    Kafka代码案例

    Kafka高级特性之消息事务

    Kafka高级特性之零拷贝

    有梦为马,游历天涯!
  • 相关阅读:
    最大回文子串
    找出不含重复字符的最长子串的长度
    链表表示的2个数相加
    如何胜任一个小型公司的技术总监?我的感想
    React 的坑
    MobX 学习
    摘要
    AI 帮助涂鸦
    计算机的前世今生
    常用编辑器实用技巧(pycharm、sublimeText、vim、vscode、Jupyter)
  • 原文地址:https://www.cnblogs.com/qijianguo/p/10686336.html
Copyright © 2011-2022 走看看