负载均衡群集是目前企业用得最多的群集类型,通过主节点负载调度器(Director),使用特定的分流算法,将来自客户机的访问请求分担给多个服务器节点共同处理,从而缓解整个系统的负载压力,响应更多请求;群集的负载调度技术,可以基于IP、端口、内容等进行分发,其中基于IP的负载调度是效率最高的。基于IP的负载均衡模式中,常见的有地址转换、IP隧道和直接路由三种工作模式。
三种工作模式中,NAT方式只需要一个公网IP地址,从而成为最易用的一种负载均衡模式,安全性也比较好,许多硬件负载均衡设备就是采用这种方式;相比较而言,DR模式和TUN模式的负载能力更加强大、适用范围更广,但节点的安全性要差一些,因为这两种模式是节点直接回应客户端,会暴露IP,而NAT模式节点回应客户端要走Director。TUN和DR的区别在于,DR模式的负载调度器和节点放在同一个网络里,而TUN模式的节点可以位于不同地域,实现异地容灾。
一、负载均衡群集工作模式
(1)地址转换,简称NAT模式;类似于防火墙的私有网络结构,Director作为所有服务器节点的网关,即作为客户机的访问入口,也是各节点回应客户机的访问出口。服务器节点使用私有IP地址,与Director位于同一个物理网络,安全性要优于其他两种方式。
(2)IP隧道,简称TUN模式;采用开放式的网络结构,Director仅作为客户机的访问入口,各节点通过各自的Internet连接直接回应客户机,而不再经过Director。服务器节点分散在互联网中的不同位置,具有独立的公网IP地址,通过专用IP隧道与Director相互通信。
(3)直接路由,简称DR模式;采用半开放式的网络结构,与YUN模式的结构类似,但各节点并不是分散在各地,而是与Director位于同一个物理网络。Director与各节点服务器通过本地网络连接,不需要建立专用的IP隧道。
二、负载均衡群集基本架构
负载均衡群集中,包括三个基本层次的组件:
(1)前端只有有一个负载调度器(load Balancer,或称为Director)负责响应并按照某种算法来分发来自客户机的访问请求
(2)后端由大量真实服务器(Real Server)构成服务器池(Server Pool),提供实际的应用服务,整个群集的伸缩性通过增加、删除服务器节点来完成,而这些过程对客户机是透明的
(3)为了保持服务的一致性,所有节点使用共享存储设备
三个层次组件功能阐述:
(1)负载调度器
这是访问整个群集系统的唯一入口,对外使用所有服务器共有的VIP(Virtual IP,虚拟IP)地址,也称为群集IP地址,对内与服务器池连接的IP地址叫做DIP;通常会配置主、备两台调度器实现热备份,当主调度器失效以后平滑替换至备用调度器,确保高可用性。
(2)服务器池
群集所提供的应用服务(如HTTP、FTP)由服务器池承担,其中的每个节点具有独立RIP(Real IP, 真实IP)地址,只处理调度器分发过来的客户机请求,当某个节点暂时失效时,负载调度器的容错机制会将其隔离,等待错误排除以后再重新纳入服务器池。
(3)共享存储
为服务器中的所有节点提供稳定、一致的文件存取服务,确保整个群集的统一性。在LInux/UNIX环境中,共享存储可以使用NAS设备,或者提供NFS(网络文件系统)共享服务的专用服务器。
三、负载均衡群集调度算法
我们以LVS(Linux Virtual Server)为例,来研究一下负载均衡群集的几种常见调度算法
(1)轮询(Round Robin):将受到的访问请求按照顺序轮流分配给群集中的各节点(真实服务器),均等地对待每一台服务器,而不管服务器实际的连接数和系统负载
(2)加权轮询(Weighted Round Robin):根据真实服务器的处理能力轮流分配受收到的访问请求,调度器可以自动查询各节点的负载情况,并动态调整其权重。这样可以保证处理能力强的服务器承担更多的访问流量。
(3)最少连接(Least Connections):根据真实服务器已建立的连接数进行分配,将收到的访问请求优先分配给连接数最少的节点。如果所有服务器节点性能相近,采用这种方式可以更好地均衡负载。
(4)加权最少连接(Weidghted Least Connections):还是以连接数为准,意思就是在连接数相同的情况下,并且在服务器节点的性能差异较大的情况下,可以为真实服务器自动调整权重,权重较高的节点将承担更大比例的活动连接负载