分布式缓存用于将使用的小文件首先分发到各个datanode节点上,然后利用map/reduce阶段的setup()方法将文件内容读入内存,加快程序执行。具体实现方法如下:
http://demievil.github.io/2014/10/29/Hadoop-DistributedCache/