一.简介
Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。基于Hive使用内存计算,兼顾数据仓库,具有实时、批处理、多并发的优点。是CDH平台首选的PB级大数据实时查询分析引擎。
二.优点
1.基于内存计算,能够对PB级别数据进行交互式实时查询、分析
2.无需转化MR,直接读取HDFS数据
3.C++编写,LLVM统一编译运行
4.兼容HiveSQL
5.具有数据仓库的特点,可直接对hive数据进行分析
6.支持数据本地化
7.支持列式存储
8.支持JDBC/ODBC远程连接
二.缺点
1.对内存需求大
2.C++编写,不开源
3.完全依赖hive
4.实践表明,当分区超过1W时性能严重下降
5.稳定性不如hive