我修从网上找了份java代码
我为了让它在hadoop下跑起来居然花了两个多小时...
首先最好不要在java代码中设置package...使用default package即可...
然后在java代码所在的文件夹下运行
javac -classpath /home/hadoop/hadoop-2.5.1/hadoop-0.20.1/hadoop-0.20.1-core.jar:
/home/hadoop/hadoop-2.5.1/hadoop-0.20.1/lib/commons-cli-1.2.jar Dedup.java
如果配置好classhpath其实用不着这么多参数...不过我的classpath配置错了...写这篇文章的时候才发现...
/home/hadoop/hadoop-2.5.1/
为hadoop安装路径
然后将编译出来的class打包
jar -cvf xyz1.jar ./Dedup*.class
这里编译出来的class文件都是Dedup开头的
然后运行
hadoop jar xyz1.jar Dedup
即可
参考Blog:
http://wrox.cn/article/100079790/