Hadoop生态圈-Azkaban实现hive脚本执行 - 走看看

zoukankan html css js c++ java

Hadoop生态圈-Azkaban实现hive脚本执行
　　　　　　　　　　　　　　　　Hadoop生态圈-Azkaban实现hive脚本执行

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　作者：尹正杰

版权声明：原创作品，谢绝转载！否则将追究法律责任。

　　本篇博客中在HDFS分布式系统取的数据，而这个数据的是有之前我通过MapReduce生产的数据，详情请参考：https://www.cnblogs.com/yinzhengjie/p/9233393.html

1>.创建job文件
use yinzhengjie; create table if not exists az_wc(word string, count int) row format delimited fields terminated by ' '; load data inpath '/azkaban_out/part-r-00000' into table az_wc; create table if not exists az_top3 like az_wc; insert overwrite table az_top3 select * from az_wc order by count desc limit 3;

创建SQL文件（hive.sql）
type=command command=hive -f hive.sql

创建hive的job文件用来调用SQL文件（hive.job）
2>.压缩配置文件

3>.将压缩后的job文件上传到azkaban的WEB界面中

4>.执行hive任务

5>.点击Execute

6>.点击继续

7>.等待执行结束

8>.查看执行状态

9>. 任务执行成功

10>.登录到hive服务器中，查看是否成功将数据导入到hive中
查看全文

相关阅读:
vue-element 时间选择器datepicker 第二次展示change无效，数据刷新页面不刷新
 uniapp
mysql
python
pycharm
从maven的debug compile到java的编译时注解(与springboot项目整合)
关于H5+实现APP检查自动更新与调用 plus.runtime.install 弹出不了安装界面问题
 Linux常用命令
 mybatis中sql语句必须用${}而不能不用#{}的情况
 Mybatis映射文件中的参数传递

原文地址：https://www.cnblogs.com/yinzhengjie/p/9233852.html

Copyright © 2011-2022 走看看