Hadoop的Archive归档命令使用指南 - 走看看

zoukankan html css js c++ java

Hadoop的Archive归档命令使用指南

hadoop不适合小文件的存储，小文件本省就占用了很多的metadata，就会造成namenode越来越大。Hadoop Archives的出现视为了缓解大量小文件消耗namenode内存的问题。

采用ARCHIVE 不会减少文件存储大小，只会压缩NAMENODE 的空间使用

1.单文件打包

hadoop archive -archiveName weibotest2014.har -p /crawler/weibo/2014-06-26 /crawler/weibo/

2.多文件夹打包

hadoop archive -archiveName weibotest2014.har -p /crawler/weibo/ 2014-06-26 2014-06-27 /crawler/weibo/

3.匹配打包

hadoop archive -archiveName weibotest2014.har -p /crawler/weibo/ 2014-06* /crawler/weibo/

4.解压

hadoop distcp har:////crawler/weibo/weibotest2014.har /crawler/weibo/

5.查看文件夹大小

hadoop fs -du -s /crawler/weibo/2014-06-28

6.删除文件夹

hadoop fs -rm -r /crawler/weibo/2014-06-28

查看全文

相关阅读:
在Magento中添加一个自己的支付模块----第一部分
 留言互相关注哟
 【Java】final修饰符的使用
 【java】关于Cannot refer to the non-final local variable list defined in an enclosing scope解决方法
 【Java】遍历List/Set/Map集合的一些常用方法
 Java Socket编程，小案例（有注释）
xml解析
 阿九说：Dom4j解析XML
神秘的Java注解
 反射是框架设计的灵魂

原文地址：https://www.cnblogs.com/lingwang3/p/10254913.html

Copyright © 2011-2022 走看看