在此之前的基础Hadoop在官方文件HDFS、MapReduce架构、配置管理是学习,但是,一些地方的官方文件相当含糊的解释。
我们没有发挥人可以体验,某种官方文件似业务规则或要求,但是,真正的细节还需要进一步研究源。,决定深入学习Hadoop的源码。尽管如今已经出现Hadoop-2.x的文档版本号,但还是决定学习Hadoop-1.x的源码,而要想研究源码最好的方法还是先构建Hadoop项目,然后依据代码的运行进行跟踪调试。
所以这篇文章主要介绍了怎样在Eclipse下构建Hadoop项目。
首先在Eclipse下新建Hadoop项目。详细步骤为在File菜单下选择New子菜单。然后选择Project菜单,出现下图所看到的的提示框,在该提示框中选择Java Project并点击Nextbutton进行下一步。
在接下来的对话框中输入项目的名字,比如hadoop-1.2.1。并选择要使用的JRE。其余的能够保持默认,点击Nextbutton进入下一个对话框。
在弹出的对话框中不做不论什么改动。点击Finishbutton完毕新项目的建立。
至此,已经完毕了Java项目的建立。但该项目下临时没有不论什么代码文件。第二步就是要拷贝Hadoop的源文件到该项目中。将Hadoop部署文件夹下src文件夹中的core、hdfs、mapred、tools文件复制到上述新建项目中的src下,然后在上述项目上右键单击。在弹出的菜单中选择Build Path。再选择Configure Build Path,弹出下图所看到的的对话框。
在该对话框中点击Add Folderbutton,出现下图的对话框,在下图中选择core、hdfs、mapred和tools,然后点击OKbutton,会返回到上图的对话框,此时会报错,须要在上图中选择src。然后点击右側的Removebutton。
做完上述的操作后的对话框例如以下所看到的,如今完毕了加入源文件的工作。第三步则是加入Hadoop须要的jar文件。
在上述项目上右键单击。在弹出的菜单中选择Build Path,再选择Configure Build Path,在弹出的对话框中点击Libraries标签,例如以下图所看到的:
点击上图右側的Add External JARsbutton。会弹出选择JAR文件的文件选择框,这时能够选择Hadoop部署根文件夹及lib文件夹中JAR文件,完毕该操作后的对话框例如以下。点击OKbutton完毕加入JAR文件到项目路径的工作。
这时RccTask.java会提示下图的错误信息,这是因为项目路径中缺少ant.jar文件所致,怎样加入能够參考上面讲述的加入jar文件的步骤。将ant.jar文件加入到路径中后。错误信息消失,Hadoop项目已经成功构建完成。
版权声明:本文博主原创文章。博客,未经同意不得转载。