简介:
- Apache Drill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎。分布式、无模式(schema-free)
- 是Google Dremel的开源实现,本质是一个分布式的mpp(大规模并行处理)查询层,支持SQL及一些用于NoSQL和Hadoop数据存储系统上的语言
- 更快查询海量数据,通过对PB字节(2的50次方字节)数据的快速扫描完成相关分析
- Drill 提供即插即用,在现有的 Hive,Mongo,HBase中可以随时整合部署。
- 是MR交互式查询能力不足的补充
- 数据模型,嵌套
- 列式存储
- 结合了web搜索和并行DBMS技术
当安装好Drill,在drill-override.conf配置clusterid和zookeeper集群,然后启动集群:
配置Storage:
通过页面查询:
通过console查询:
JDBC查询: