zoukankan      html  css  js  c++  java
  • Kafka使用中的两个问题总结

    kafka


    Kafka用了挺长时间了,最早时官方文档也看得挺细的,但结果大半年没用,最近在做一些部署调整的时候有些细节居然遗忘了,摆了个乌龙。在这里总结一下,以免再忘。


    1. 给Kafka加负载均衡的问题

    Kafka producer上传数据的工作原理:

    1. producer先通过配置的broker列表中的其中一台,获取到整个Kafka集群的metadata,其中包含brokers,topics,partitions包括ISR的信息。定期update。
    2. 根据以上的metadata,以及由配置的message_key决定的partitioner策略(默认不配message_key的话就是简单的round robin),producer决定将数据分批发送到某个broker的partition中。
    3. producer直接发送数据,不再经过producer配置中的broker转发。

    因此,加负载均衡是对获取metadata的请求提供了高可用,但不是对实际数据发送做负载均衡。所以流量很小,不需要考虑负载均衡服务器的带宽。


    2. host.name与advertised.host.name的设置

    host.name:按配置文件说明,是Kafka绑定的interface。其实这个说明有点误导,下面会见到。

    advertised.host.name:是注册到zookeeper,client要访问的broker地址。(可能producer也是拿这个值,没有验证)

    如果advertised.host.name没有设,会用host.name的值注册到zookeeper,如果host.name也没有设,则会使用JVM拿到的本机hostname注册到zk。

    这里有两个坑要注意:

    1. 如果advertised.host.name没有设,host.name不能设为0.0.0.0,否则client通过zk拿到的broker地址就是0.0.0.0。
      如果指定要bind到所有interface,host.name不设就可以。

    2. 如果host.name和advertised.host.name都不设,client通过zk拿到的就是JVM返回的本机hostname,如果这个hostname是client无法访问到的,client就会连不上broker
      所以如果要bind到所有interface,client又能访问,解决的办法是host.name不设或设置0.0.0.0,advertised.host.name一定要设置为一个client可以访问的地址,如直接设IP地址。
      如果不需要bind到所有interface,也可以只在host.name设置IP地址。

    简单的检查broker是否可以被client访问到的办法,就是在zookeeper中看broker信息,上面显示的hostname是否是client可以访问到的地址。
    在zkCli中执行get /brokers/<id>


    【扩展】为何producer是配置broker地址而consumer中是配置zookeeper地址

    区别的原因是consumer要把consumer group和consumer的信息(主要是分配了哪些topic/partition)注册到zookeeper中,被各个consumer watch,以实现consumer之间的自动均衡。

    至于consumer的offset虽然也可能保存在zookeeper上,但不是区别的原因。因为在0.9版本以上,offset也是可以保存到Kafka本身的。


  • 相关阅读:
    面向对象(Object Oriented)
    文件操作
    函数
    dict--字典
    list--列表
    Ubuntu_18.04安装网易云音乐
    初识数据类型
    css控制内容显示,自动加"..."
    css固定元素位置(fixed)
    解决IE下iframe默认有白色背景的bug
  • 原文地址:https://www.cnblogs.com/petergz/p/6660327.html
Copyright © 2011-2022 走看看