zoukankan      html  css  js  c++  java
  • RabbitMQ上手记录–part 5节点集群高可用(多服务器)

    上一part《RabbitMQ上手记录–part 4-节点集群(单机多节点)》中介绍了RabbitMQ集群的一些概念以及实现了在单机上运行多个节点,并且将多个节点组成一个集群。

    通常情况下的集群节点是不会都放在一个服务器上的,实际情况是分布在不同的服务器上,所以这里我们将会把集群节点部署在多个服务器上。同时基于集群节点我们会接着实现负载均衡,并且通过代码来演示在某个节点宕机之后,能自动连接到集群里的另外一个节点。

    这部分演练将会用到负载均衡技术,具体就不详细说了,这个技术是分布式系统中非常基础的一项技术。这里我使用的软件负载均衡,使用的是HAProxy(同样不详细介绍,很容易找到资料)。

    以下演练基于CentOS7操作系统

    第一步搭建多服务器的节点集群

    a.准备好三个CentOS服务器

    这里准备三个虚拟机,分别安装好了RabbitMQ,IP地址如下

    加点               主机名     IP

    节点1(主节点)   bogon      192.168.115.136

    节点2                worker1   192.168.115.138

    节点3                worker2    192.168.115.139

    为了便于使用主机名通讯,需要在各个节点设置host文件的对应的IP地址

    sudo vim /etc/hosts

    加入如下内容

    192.168.115.136 bogon
    192.168.115.138 worker1
    192.168.115.139 worker2

    b.构建集群

    步骤类似于《RabbitMQ上手记录–part 4-节点集群(单机多节点)》的方法,但是是在不同的服务器上执行,最重要的是确保各个RabbitMQ服务使用的相同的.erlang.cookie。

    同步.erlang.cookie

    .erlang.cookie

    该文件位于/var/lib/rabbitmq/.erlang.cookie

    这个文件的作用类似于一种身份验证信息,可以称为token,不同的RabbitMQ服务之间需要使用相同的token才能正常通讯。如果都在单机上实现多节点,用的是本机同一个文件,所以不需要设置。

    好了,简单介绍.erlang.cookie文件之后,那么我们需要将节点1的.erlang.cookie的内容复制到节点2、节点3的.erlang.cookie中。

    输出文件内容,然后手动拷贝到其他服务器上

    sudo cat /var/lib/rabbitmq/.erlang.cookie

    在主节点打开防火墙端口

    sudo firewall-cmd --add-port=25672/tcp --permanent

    sudo firewall-cmd --add-port=5672/tcp --permanent

    sudo firewall-cmd --add-port=4369/tcp --permanent

    将从节点加入集群

    在节点2执行如下命令

    sudo rabbitmqctl stop_app

    sudo rabbitmqctl reset

    sudo rabbitmqctl join_cluster rabbit@bogon

    启动节点并查看集群状态

    sudo rabbitmqctl start_app

    sudo rabbitmqctl cluster_status

    应该能看到类似如下输出

    [{nodes,[{disc,[rabbit@bogon,rabbit@worker1]}]},
      {running_nodes,[rabbit@bogon,rabbit@worker1]},

    然后依次在节点3执行重复执行上述命令,完成集群节点添加

    注意:这里执行命令的时候都不需要指定哪个节点,因为我们这里默认是一个服务器一个节点

    第二步使用HAProxy

    接下来利用刚配好的集群,我们来设置HAProxy的配置。

    安装HAProxy

    话说HAProxy的网站已经打不开了,但是找个安装包还是很容易的。

    在主节点下载并安装HAProxy

    下载

    http://www.rpmfind.net/linux/centos/7.4.1708/os/x86_64/Packages/haproxy-1.5.18-6.el7.x86_64.rpm

    然后

    yum -y install haproxy-1.5.18-6.el7.x86_64.rpm

    HAProxy配置

    新建文件haproxy_rabbitmq.cfg,内容如下

    复制代码
    global
         log 127.0.0.1    local0 info
         maxconn 4096
         stats socket /tmp/haproxy.socket uid haproxy mode 770 level admin
         daemon
    
    defaults
         log    global
         mode    tcp
         option    tcplog
         option    dontlognull
         retries    3
         option    redispatch
         maxconn    2000
         timeout connect    5s
         timeout    client    120s
         timeout    server    120s
    
    listen    rabbitmq_local_cluster 192.168.115.136:5670
         mode tcp
         balance roundrobin
         server rabbit_1 192.168.115.136:5672 check inter 5000 rise 2 fall 3
         server rabbit_2 192.168.115.138:5672 check inter 5000 rise 2 fall 3
         server rabbit_3 192.168.115.139:5672 check inter 5000 rise 2 fall 3
    
    listen    private_monitoring :8100
         mode http
         option httplog
         stats enable
         stats uri    /stats
         stats refresh    5s
    复制代码

    大概描述一下上述配置

    1.配置了站点集群配置rabbitmq_local_cluster,监听的端口号是5670

    2.这个集群后面有三个服务器,分别对应的是我们集群的三个RabbitMQ服务节点

    3.check inter 5000 rise 2 fall 3

       check inter 5000 检查后端服务是否可用的时间间隔为5秒

       rise 2                   一个失败节点如果有2次检查到是可用的,则重新标记为可用

       fall  3                   如果节点有3次不可用,那么会被标记为失败节点

    4.listen    private_monitoring :8100

        通过浏览器访问8100端口可以查看HAProxy的状态信息

      

    具体去查看HAProxy的文档。

    然后开启8100端口

    sudo firewall-cmd --add-port=8100/tcp –permanent

    启动HAProxy

    sudo haproxy -f haproxy_rabbitmq.cfg

    打开浏览器访问http://192.168.115.136:8100/stats

    能看到如下节点统计信息,可以看到目前三个节点都是在运行状态的

    image

    第三步使用节点集群

    前面两步分别搭建了RabbitMQ的节点集群和利用HAproxy实现负载均衡,现在来看看如何在代码中使用节点集群。

    在介绍程序之前,先明确节点失效重连的问题。节点集群主要的功能就是要实现高可用,在某个节点失效的情况下,还能继续提供服务。当客户端正在使用的节点失效时,对应的连接会失效,然后重新连接集群后会连接到另外一个可用的节点。所以之前定义的exchange,queue都不能确保还能重用,因此在失效转移之后,我们可以认为是重新连接到了一个全新的节点,涉及的exchange,queue和bindings都需要重新定义。

    a.创建RabbitMQ用户

    创建一个用于在客户端连接RabbitMQ集群的用户,之前默认的guest用户只能在服务器本机使用。

    在主节点执行如下命令,创建用户admin,密码为123456,设置为管理员并且设置对默认的vhost有所有访问权(这里只是演示,通常情况下不会给这么广的权限)

    sudo rabbitmqctl add_user admin 123456

    sudo rabbitmqctl set_user_tags admin administrator

    sudo rabbitmqctl set_permissions -p / admin ".*" ".*" ".*"

    b.消费者代码

    这里还是使用Python的实现,新建cluster_node_consumer.py,代码如下

    复制代码
    import sys, json, pika, time, traceback
    
    
    def msg_rcvd(channel, method, header, body):
         message = json.loads(body)
         print "Received: %(content)s/%(time)d" % message
         channel.basic_ack(delivery_tag=method.delivery_tag)
    
    
    if __name__ == "__main__":
         AMQP_SERVER = sys.argv[1]
         AMQP_PORT = int(sys.argv[2])
         AMQP_USER = sys.argv[3]
         AMQP_PWD = sys.argv[4]
    
        creds_broker = pika.PlainCredentials(AMQP_USER, AMQP_PWD)
         conn_params = pika.ConnectionParameters(
             AMQP_SERVER,
             port=AMQP_PORT,
             virtual_host="/",
             credentials=creds_broker)
    
        while True:
             try:
                 conn_broker = pika.BlockingConnection(conn_params)
                 channel = conn_broker.channel()
                 channel.exchange_declare(
                     exchange="cluster_test", exchange_type="direct", auto_delete=False)
                 channel.queue_declare(queue="cluster_test", auto_delete=False)
                 channel.queue_bind(
                     queue="cluster_test",
                     exchange="cluster_test",
                     routing_key="cluster_test")
    
                print "Ready for testing!"
                 channel.basic_consume(msg_rcvd, queue="cluster_test", no_ack=False, consumer_tag="cluster_test")
                 channel.start_consuming()
             except Exception, e:
                 traceback.print_exc()
    复制代码

    上述代码从命令行读取服务器的地址,端口,用户名和密码,然后创建连接。

    最关键的是while True部分,这里使用了try catch捕获所有异常,确保在出现异常之后能重新创建连接。

    重新连接之后,会重新执行创建queue,exchange和binding。

    执行如下命令运行消费者程序

    python cluster_node_consumer.py 192.168.115.136 5670 admin 123456

    192.168.115.136 是HAproxy配置的对外地址

    5670 是HAproxy配置的访问端口

    admin 123456 分别是在主节点创建的RabbitMQ用户名和密码

    输出

    Ready for testing!

    看到这输出并且没有其他异常信息时,说明已经连接上了集群。

    这时候我们可以在HAproxy的状态统计站点http://192.168.115.136:8100/stats查看当前连接的是哪个节点。

    查看Cur这一列,这里显示的节点当前的连接数,可以看到rabbit_3有一个连接,那么就是刚刚消费者程序创建的,并且目前正在使用。

    image

    这时候将rabbit_3停止,登录节点3,执行如下命令

    sudo rabbitmqctl stop_app

    那么在运行消费者程序的控制台就会看到如下输出

    Traceback (most recent call last):
       File "cluster_node_consumer.py", line 37, in <module>
         channel.start_consuming()
       File "/home/junwen/anaconda2/lib/python2.7/site-packages/pika/adapters/blocking_connection.py", line 1780, in start_consuming
         self.connection.process_data_events(time_limit=None)
       File "/home/junwen/anaconda2/lib/python2.7/site-packages/pika/adapters/blocking_connection.py", line 707, in process_data_events
         self._flush_output(common_terminator)
       File "/home/junwen/anaconda2/lib/python2.7/site-packages/pika/adapters/blocking_connection.py", line 474, in _flush_output
         result.reason_text)
    ConnectionClosed: (320, "CONNECTION_FORCED - broker forced connection closure with reason 'shutdown'")
    Ready for testing!

    可以看到一连串的异常信息输出,最后是Ready for testing!说明客户端连接被断开了,抛出了异常信息,然后又重新连接了。

    我们再看看目前HAProxy的状态信息

    image

    可以看到rabbit_3目前是不可用状态。rabbit_1有一个连接,就是刚才程序连接失效之后重新创建的连接。

    c.生产者代码

    生产者的这端的代码比较简单,跟普通的调用没有区别,只是链接的地址是HAProxy的服务地址。

    新建cluster_node_producer.py,代码如下

    复制代码
    import sys, time, json, pika
    
    AMQP_SERVER = sys.argv[1]
    AMQP_PORT = int(sys.argv[2])
    AMQP_USER = sys.argv[3]
    AMQP_PWD = sys.argv[4]
    
    creds_broker = pika.PlainCredentials(AMQP_USER, AMQP_PWD)
    conn_params = pika.ConnectionParameters(
         AMQP_SERVER, port=AMQP_PORT, virtual_host="/", credentials=creds_broker)
    
    conn_broker = pika.BlockingConnection(conn_params)
    
    channel = conn_broker.channel()
    
    msg = json.dumps({"content": "Cluster Test!", "time": time.time()})
    
    msg_props = pika.BasicProperties(content_type="application/json")
    
    channel.basic_publish(
         body=msg,
         exchange="cluster_test",
         properties=msg_props,
         routing_key="cluster_test")
    
    print "Sent cluster test message."
    复制代码

    上述代码中链接服务器部分跟消费者的代码一致,都是从命令行读取参数,然后创建连接。

    创建连接之后,立即发布一个消息,消息内容也是写死的。

    新开一个终端,运行生产者代码

    python cluster_node_producer.py 192.168.115.136 5670 admin 123456

    在消费者代码运行的那个终端可以看到如下输出

    Received: Cluster Test!/1524405533

    这里生产者的代码实际上只是演示可以连接到HAProxy服务,所以消息发送之后就会关闭连接。

    完整的代码文件请参考https://github.com/shenba2014/RabbitMQ/tree/master/cluster

    OK,到此跨服务器的节点集群演示完毕,后续研究一下如何解决多数据中心高可用的问题。

  • 相关阅读:
    ubuntu下使用ppa安装codeblocks集成开发环境
    CentOS g++ 安装
    CentOS 7.1云服务器 配置FTP服务器vsftpd
    div高度自适应浏览器高度
    HTML中的head结构
    javascript高级进阶系列
    javascript集中跨域方法
    canvas标签的width和height以及style.width和style.height的区别
    html5学习笔记之入新特性
    ie下a标签里的图片会有边框
  • 原文地址:https://www.cnblogs.com/lzjsky/p/15769671.html
Copyright © 2011-2022 走看看