hadoop集群之间有时候需要将数据进行迁移,如将一些保存的过期文档放置在一个小集群中进行保存。
使用的是社区提供的功能,distcp。用法非常简单:
hadoop distcp hdfs://nn1:8020/foo/bar hdfs://nn2:8020/bar/foo
加上参数 -i 表示不用去管failure -m 设置map数