zoukankan      html  css  js  c++  java
  • kafka简介

      kafka是用于构建实时数据管道和流应用程序。具有横向扩展,容错,wicked fast(变态快)等优点,并已在成千上万家公司运行。

    简单说明什么是kafka  

      Apache kafka是消息中间件的一种,我发现很多人不知道消息中间件是什么,在开始学习之前,我这边就先简单的解释一下什么是消息中间件,只是粗略的讲解,目前kafka已经可以做更多的事情。

      举个例子,生产者消费者,生产者生产鸡蛋,消费者消费鸡蛋,生产者生产一个鸡蛋,消费者就消费一个鸡蛋,假设消费者消费鸡蛋的时候噎住了(系统宕机了),生产者还在生产鸡蛋,那新生产的鸡蛋就丢失了。再比如生产者很强劲(大交易量的情况),生产者1秒钟生产100个鸡蛋,消费者1秒钟只能吃50个鸡蛋,那要不了一会,消费者就吃不消了(消息堵塞,最终导致系统超时),消费者拒绝再吃了,”鸡蛋“又丢失了,这个时候我们放个篮子在它们中间,生产出来的鸡蛋都放到篮子里,消费者去篮子里拿鸡蛋,这样鸡蛋就不会丢失了,都在篮子里,而这个篮子就是”kafka“。
    鸡蛋其实就是“数据流”,系统之间的交互都是通过“数据流”来传输的(就是tcp、http什么的),也称为报文,也叫“消息”。
    消息队列满了,其实就是篮子满了,”鸡蛋“ 放不下了,那赶紧多放几个篮子,其实就是kafka的扩容。
    各位现在知道kafka是干什么的了吧,它就是那个"篮子"。

    kafka名词解释

    后面大家会看到一些关于kafka的名词,比如topic、producer、consumer、broker,我这边来简单说明一下。

    • producer:生产者,就是它来生产“鸡蛋”的。
    • consumer:消费者,生出的“鸡蛋”它来消费。
    • topic:你把它理解为标签,生产者每生产出来一个鸡蛋就贴上一个标签(topic),消费者可不是谁生产的“鸡蛋”都吃的,这样不同的生产者生产出来的“鸡蛋”,消费者就可以选择性的“吃”了。
    • broker:就是篮子了。

    大家一定要学会抽象的去思考,上面只是属于业务的角度,如果从技术角度,topic标签实际就是队列,生产者把所有“鸡蛋(消息)”都放到对应的队列里了,消费者到指定的队列里取。

     

    Kafka作为一个分布式的流平台,这到底意味着什么

    我们认为,一个流处理平台具有三个关键能力:

    1. 发布和订阅消息(流),在这方面,它类似于一个消息队列或企业消息系统。
    2. 容错的方式存储消息(流)。
    3. 在消息流发生时处理它们。

    什么是kakfa的优势?

    它应用于2大类应用:

    1. 构建实时的流数据管道,可靠地获取系统和应用程序之间的数据。
    2. 构建实时流的应用程序,对数据流进行转换或反应。

    要了解kafka是如何做这些事情的,让我们从下到上深入探讨kafka的能力。

    首先几个概念:

    1. kafka作为一个集群运行在一个或多个服务器上。
    2. kafka集群存储的消息是以topic为类别记录的。
    3. 每个消息(也叫记录record,我习惯叫消息)是由一个key,一个value和时间戳构成。

    kafka有四个核心API:

    • 应用程序使用 Producer API 发布消息到1个或多个topic(主题)。
    • 应用程序使用 Consumer API 来订阅一个或多个topic,并处理产生的消息。
    • 应用程序使用 Streams API 充当一个流处理器,从1个或多个topic消费输入流,并生产一个输出流到1个或多个输出topic,有效地将输入流转换到输出流。
    • Connector API允许构建或运行可重复使用的生产者或消费者,将topic连接到现有的应用程序或数据系统。例如,一个关系数据库的连接器可捕获每一个变化。
     
      
     
    Client和Server之间的通讯,是通过一条简单、高性能并且和开发语言无关的TCP协议。并且该协议保持与老版本的兼容。Kafka提供了Java Client(客户端)。除了Java Client外,还有非常多的其它编程语言的Client

     

    首先来了解一下Kafka所使用的基本术语:

    Topic

    Kafka将消息种子(Feed)分门别类,每一类的消息称之为一个主题(Topic).

    Producer

    发布消息的对象称之为主题生产者(Kafka topic producer)

    Consumer

    订阅消息并处理发布的消息的种子的对象称之为主题消费者(consumers)

    Broker

    已发布的消息保存在一组服务器中,称之为Kafka集群。集群中的每一个服务器都是一个代理(Broker). 消费者可以订阅一个或多个主题(topic),并从Broker拉数据,从而消费这些已发布的消息


     
     
     
     注: 本文转自http://orchome.com/kafka/index
  • 相关阅读:
    编译linux内核问题
    linux驱动路径
    plateform_driver_register和plateform_device_register区别
    linux总线、设备和设备驱动的关系
    linux设备驱动模型
    一堆Offer怎么选?这样做就不纠结了
    解决问题最简单的方法
    Android ScrollView嵌套GridView导致GridView只显示一行item
    84. Spring Boot集成MongoDB【从零开始学Spring Boot】
    接手别人的代码,死的心有吗?
  • 原文地址:https://www.cnblogs.com/zhuzhenwei918/p/9187109.html
Copyright © 2011-2022 走看看