zoukankan      html  css  js  c++  java
  • 【原创】消息队列的消费语义和投递语义

    引言

    所谓的消费语义,指的就是如下三种情况

    • 如何保证消息最多消费一次
    • 如何保证消息至少消费一次
    • 如何保证消息恰好消费一次

    其实类似还有一个投递语义

    • 如何保证消息最多投递一次
    • 如何保证消息至少投递一次
    • 如何保证消息恰好投递一次

    说句实在话,其实还是老问题,只是换了一种问法!
    OK,开始我们的正文

    正文

    我们先做如下约定

    • Producer代表生产者
    • Consumer代表消费者
    • Message Queue代表消息队列

    投递语义

    我们先从投递语义开始讲起,因为要先把这个概念讲明白了,才能讲消费语义。恰巧,kafka实现了这三种语义,我们以kafka来说明。

    如何保证消息最多投递一次?
    简单,就是我已经投出去了,收没收到不管了,会存在消息丢失。
    我们在初始化Producer时可以通过配置request.required.acks不同的值,来实现不同的发送模式。
    这里将request.required.acks设为0,意思就是Producer不等待Leader确认,只管发出即可;最可能丢失消息。如果丢了消息,就是投递0次。如果没丢,就是投递1次。符合最多投递一次的含义。

    如何保证消息至少投递一次?
    这里将request.required.acks设为-1。ProducerkafkaLeader(主)节点发送消息后,会等follower(从)节点同步完数据以后,再给Producer返回ACK确认消息。
    但是这里是有几率出现重复消费的问题的。
    例如,kafka保存消息后,发送ACK前宕机,Producer认为消息未发送成功并重试,造成数据重复!
    那么,在这种情况下,就会出现大于1次的投递情况,符合至少投递一次的含义。

    如何保证消息恰好投递一次?
    kafka在0.11.0.0版本之后支持恰好投递一次的语义。
    我们将enable.idempotence设置为ture,此时就会默认把request.required.acks设为-1,可以达到恰好投递一次的语义。
    如何做到的?
    为了实现Producer的幂等语义,Kafka引入了Producer ID(即PID)和Sequence Number。
    kafka为每个Producer分配一个pid,作为该Producer的唯一标识。
    Producer会为每一个<topic,partition>维护一个单调递增的seq。
    类似的,Message Queue也会为每个<pid,topic,partition>记录下最新的seq。
    当req_seq == message_seq+1时,Message Queue才会接受该消息。因为:

    • (1)消息的seq比Message Queue的seq大一以上,说明中间有数据还没写入,即乱序了。
    • (2)消息的seq比Message Queue的seq小,那么说明该消息已被保存。

    消费语义

    这里我们还是做一个定义如下所示

    • consumer.poll()表示消费者获取消息内容
    • processMsg(message)表示下游系统进行消费消息
    • consumer.commit()表示消费者往消息队列提交确认信息,消息队列接到确认消息,删除该消息。

    注意了,我是以processMsg函数,即处理消息的过程,定义为消费消息。
    如何保证消息最多消费一次?
    Producer:满足最多投递一次的语义即可,即只管发消息,不需要等待消息队列返回确认消息。
    Message Queue:接到消息后往内存中一放就行,不用持久化存储。
    Consumer:拉取到消息以后,直接给消息队列返回确认消息即可。至于后续消费消息成功与否,无所谓的。即按照以下顺序执行

    consumer.poll();
    consumer.commit();
    processMsg(message);
    

    如何保证消息至少消费一次?
    Producer:满足至少投递一次语义即可,即发送消息后,需要等待消息队列返回确认消息。如果超时没收到确认消息,则重发。
    Message Queue:接到消息后,进行持久化存储,而后返回生产者确认消息。
    Consumer:拉取到消息后,进行消费,消费成功后,再返回确认消息。即按照如下顺序执行

    consumer.poll();
    processMsg(message);
    consumer.commit();
    

    由于这里Producer满足的是至少投递一次语义,因此消息队列中是有重复消息的。所以我们的Consumer会出现重复消费的情形!

    如何保证消息恰好消费一次?
    在保证至少消费一次的基础上,processMsg满足幂等性操作即可。
    如何保证幂等性操作?
    老问题了,比如有状态的消息啊。比如唯一表啊。大家搜一搜,一大堆答案,不想重复说了。

    总结

    本文讲的是消息队列的消费语义和投递语义的含义,希望大家有所收获。

  • 相关阅读:
    开源大数据周刊-第29期
    rsync
    Tomcat基础教程(四)
    xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
    xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
    xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
    xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
    python 取前10位
    python 字典统计次数
    阿里开源分布式事务Fescar demo示例
  • 原文地址:https://www.cnblogs.com/rjzheng/p/11050673.html
Copyright © 2011-2022 走看看