Java连接Hive的方式就是通过JDBC的方式来连接,URL为jdbc:hive2://host:port/db;principal=X@BIGDATA.COM等,这种方式是直接连接HiveServer2服务的,但是在现实中,还有一种以Zookeeper的方式去连接,例如:
jdbc:hive2://zk01:2181,zk02:2181,zk03:2181/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2
那么,这种方式的原理是什么?
在实际生产中,可能会存在多个HiveServer2服务,他们同时来提供服务,如果其中的一个挂掉,其他的就可以继续工作。那么,为了实现这种HA的特性,HiveServer2提供了一种基于Zookeeper部署的HA解决方案,即多个HiveServer2服务向Zookeeper的某一个目录下注册,Java JDBC通过读取Zookeeper中这个目录下面注册的HiveServer2的实例,来选取其中的一个进行连接和访问。具体部署请查阅资料,这里不再描述。
另外一种实现HA的方式就是通过HAProxy或Ngix等软件进行负载均衡,也可以使用F5硬件。
特此记录。