Hadoop生态圈-CDH与HUE使用案例
作者:尹正杰
版权声明:原创作品,谢绝转载!否则将追究法律责任。
一.HUE的介绍
1>.HUE的由来
HUE全称是HadoopUser Experience,看这名字就知道怎么回事了吧。没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用HUE我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。
2>.HUE的好处
通过使用HUE我们可以在浏览器端的Web控制太上与Hadoop集群进行交互来分析处理数据。例如操作Hdfs上的数据,运行Hive脚本,管理Oozie或Azkaban任务调度等等。由于HUE是一个开源的Apache Hadoop UI系统。因此它支持任何版本Hadoop。
3>.HUE的功能
3.1>.基于文件浏览器(File Browser)访问HDFS;
3.2>.基于WEB编辑器来开发和运行Hive查询;
3.3>.支持基于Solr进行搜索的应用,并提供可视化的数据视图,报表生成;
3.4>.通过web调试和开发impala交互式查询;
3.5>.spark调试和开发;
3.6>.Pig开发和调试;
3.7>.oozie任务的开发,监控,和工作协调调度;
3.8>.HBase数据查询和修改,数据展示;
3.9>.MapReduce任务进度查看,日志追踪;
3.10>.创建和提交MapReduce,Streaming,Java job任务;
3.11>.Sqoop2的开发和调试;
3.12>.Zookeeper的浏览和编辑;
3.13>.数据库(MySQL,PostGres,SQlite,Oracle);
4>.官网地址
HUE官网地址可参考:http://gethue.com/overview/。
二.在CDH中添加HUE服务(HUE对Hive和Oozie有依赖,因此在安装它之前需要安装这两个服务)
1>.安装hive和oozie
2>.
3>.
4>.
5>.