Hadoop概念学习系列之为什么hadoop/spark执行作业时，输出路径必须要不存在？（三十九） - 走看看

zoukankan html css js c++ java

Hadoop概念学习系列之为什么hadoop/spark执行作业时，输出路径必须要不存在？（三十九）

　　很多人只会，但没深入体会和想为什么要这样？

　　拿Hadoop来说，当然，spark也一样的道理。

　　输出路径由Hadoop自己创建，实际的结果文件遵守part-nnnn的约定。

　　如何指定一个已有目录作为Hadoop作业的输出路径，作业将无法进行，并会抛出异常抗议一个已经存在的目录。如果想让Hadoop将输出存储到一个目录，它必须是不存的目录。其实，我们可以把这个特点当做Hadoop的一种安全机制，它可以防止Hadoop重写有用的文件以及用户总是忘记弄清的事。

查看全文

相关阅读:
MyBatis:2
MyBatis:1
synchronized锁普通方法和锁静态方法
 打印倒直角三角形
 迭代器模拟for循环
 Python迭代对象与迭代器
 ffmpeg用法（心得体会还有你见过的用法）
ffmpeg命令选项解释
 ffmpeg一些filter用法、以及一些功能命令
 FFMPEG 实现 YUV，RGB各种图像原始数据之间的转换（swscale）

原文地址：https://www.cnblogs.com/zlslch/p/6092396.html

Copyright © 2011-2022 走看看