zoukankan html css js c++ java

Hive get table rows count batch

项目中需要比对两种方法计算生成的数据情况，需要做两件事情，比对生成的中间表的行数是否相同，比对最后一张表的数据是否一致。

在获取表的数据量是一条一条地使用select count(*) from table来获取等待结果比较烦人，所以就写了一个bash shell来做这件事。

但一开始是这样的：

for line in $(cat tables.txt)
do
	echo "tablename :$line";
	value=$(hive --database databasename --hiveconf v=v1 -S -e "select count(*) from $line;")
	echo "rows count:$value"
done;

这样只要准备好tables.txt即可。

使用时./count_tables.sh >counter.txt

但后来发现表一多，这样等待还是很漫长。

后来想到可以使用并发进和查询。遂改成如下：

myorder=1
while read line;
do
eval "hive --database databasename -S -e 'select "$myorder" as myorder, "$line" as tablename ,count(*) as rowcount from $line;' &"
myorder=$(($myorder+1));

done;
wait #wait all process to finish calculater

使用时

hive -e 'show tables'>tables.txt
./count_tables.sh <tables.txt >counter.txt

cat counter.txt | sort -n | awk '{print $3;}'

即可按照原始的顺序显示出表的行数

查看全文

相关阅读:
8.SpringMVC参数传递
 9.SpringMVC和json结合传递参数
 20160815命令行进入其他盘
 5.SpringMVC静态文件的访问
 6.SpringMVC注解启用
 7.SpringMVC注解优化
 3.SpringMVC修改配置文件路径和给界面传递数据
 rails
SVN Merge合并 Patch打补丁
 Windows环境下怎么在文件夹下打开cmd命令行

原文地址：https://www.cnblogs.com/huaxiaoyao/p/4443273.html