1、数据迁移过程中,验证数据拷贝后大小是否一致;
shell命令:
hadoop fs -count -q 目录 ps: 查看目录下总的大小
dfs -count -q 目录 ps:一样的
hadoop fs -du 目录 ps:查看目录下每个子目录的大小
2、随机森林和GBDT的区别
https://blog.csdn.net/calm___down/article/details/89389745
https://zhuanlan.zhihu.com/p/148050748