zoukankan      html  css  js  c++  java
  • hadoop的wordcount程序

    首先需要配置上面画红框的几个文件

    1、core-site.xml文件

     1 <configuration>
     2 <property>
     3 <name>fs.defaultFS</name>
     4 <value>hdfs://localhost:9000</value>
     5 </property>
     6 
     7 <property>
     8 <name>hadoop.tmp.dir</name>
     9 <value>/soft/hadoop-3.1.1/data</value>
    10 </property>
    11 
    12 </configuration>

    2、hdfs-site.xml文件

     1 <configuration>
     2 <property>
     3 <name>dfs.namenode.http-address</name>
     4 <value>localhost:50070</value>
     5 </property>
     6 
     7 
     8 <property>
     9 <name>dfs.replication</name>
    10 <value>1</value>
    11 </property>
    12 </configuration>

    3、yarn-stie.xml文件

     1 <property>
     2 <name>yarn.resourcemanager.hostname</name>
     3 <value>localhost</value>
     4 </property>
     5 
     6 <property>
     7 <name>yarn.nodemanager.aux-services</name>
     8 <value>mapreduce_shuffle</value>
     9 </property>
    10 
    11 <property>
    12 <name>mapreduce.framework.name</name>
    13 <value>local</value>
    14 </property>
    15 </configuration>

    4、mapred-site.xml文件

    1 <configuration>
    2 <property>
    3 <name>mapreduce.framework.name</name>
    4 <value>yarn</value>
    5 </property>

    5、hadoop-env.sh文件

    1 # 这个地方设置为你java的安装目录
    2 JAVA_HOME=/soft/jdk1.8.0_191

    二、启动hadoop运行环境

    2.1 首先初始化一下hadoop文件系统

    1 hadoop namenode format

    2.2 运行hadoop

    1 start-all.sh

    我们这里需要确认一下是否运行成功,使用下面的命令

    jps

     

    这里尤其要注意一下这个DataNode是否运行

    成功运行以后,应该可以在浏览器输入下面两个网址

    3 测试wordcount程序

    3.1 首先在本地随便新建一个input.txt文件,input.txt文件中随便输入一些单词

    hello world
    hello world
    hello boy
    hello gril
    hello
    hello
    hello
    hello
    hello

    3.2 在hadoop根文件系统中,新建一个文件夹

    1 hadoop fs -mkdir /wordcount

    3.3 将本地的input.txt文件上传到hadoop文件中

    1 hadoop fs -put input.txt /wordcount/input

    3.4 运行hadoop提供wordcount程序

    hadoop提供许多测试程序,具体在hadoop安装目录的share目录下

    hadoop jar /soft/hadoop-3.1.1/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.1.jar wordcount /wordcount/input /output/wordcount

    上面的/out/wordcount表示输出文件的位置

    3.5 查看运行的结果

    1 hadoop fs -cat /wordcount/part-r-00000
    1 boy    2
    2 girl    2
    3 hello    10
    4 world    1
  • 相关阅读:
    细说google,baidu引擎收录习惯
    考研机试 11.二叉树遍历
    考研机试 18.特殊乘法
    考研机试 19.今年的第几天
    考研机试 20.完数VS盈数
    考研机试 12.玛雅人的密码
    考研机试 10.球的半径和体积
    考研机试 17.n的阶乘
    考研机试 15.abc
    考研机试 9.成绩排序
  • 原文地址:https://www.cnblogs.com/wylwyl/p/10242566.html
Copyright © 2011-2022 走看看