zoukankan      html  css  js  c++  java
  • hadoop伪分布式之启动HDFS并运行MR程序(WordCount)

    一、配置相关文件

    在hadoop-2.9.2下etc/hadoop/core-site.xml中配置:

    <configuration>
        <!--指定HDFS中NameNode的地址-->
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://hadoop01:9000</value>
        </property>
        <!--指定hadoop运行时产生文件的存储目录-->
        <property>
            <name>hadoop.tmp.dir</name>
            <value>/opt/module/hadoop-2.9.2/data/tmp</value>
        </property>
    </configuration>

    hadoop01是当前主机名。

    在hdfs-site.xml中配置

    <!--指定HDFS副本的数量-->
    <configuration>
        <name>dfs.replication</name>
        <value>1<value>
    </configuration>

    配置hadoop-env.sh:

    export JAVA_HOME=/opt/module/jdk1.8.0_11

    二、启动集群

    在hadoop-2.9.2目录下

    (1)格式化NaneNode(第一次启动时要格式化,以后就不要总格式化)

    bin/hdfs namenode -format

    (2) 启动NameNode

    sbin/hadoop-daemon.sh start namenode

    之后使用jps查看:

    (3) 启动DataNode

    sbin/hadoop-daemon.sh start datanode

     (3)关闭防火墙

    systemctl status firewalld.service查看防火墙状态

    systemctl stop firewalld.service 关闭运行的防火墙

    然后在windows中就可以访问了:

    进入到以下目录中:

    在hadoop-2.9.2目录下输入:

    bin/hdfs dfs -mkdir -p /user/gong/input 

    刷新浏览器中刚才的目录,就会出现:

    我们上传一个数据上去:

    bin/hdfs dfs -put wcinput/wc.input /user/gong/input 

    (4) 执行一个实例WordCount

    在hadoop-2.9.2目录下输入:

    bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar wordcount /user/gong/input /user/gong/output

    然后在浏览器中就可以看到结果啦:

    可以在Linux中运行bin/hdfs dfs -cat /user/gong/output/p* 查看

  • 相关阅读:
    【JZOJ4616】二进制的世界
    【JZOJ4665】数列
    【JZOJ4811】排队
    2017.08.19【NOIP提高组】模拟赛B组 经济编码
    浅谈匈牙利算法
    2017.08.18【NOIP提高组】模拟赛B组 恭介的法则(rule)
    2017.08.18【NOIP提高组】模拟赛B组 沙耶的玩偶(doll)
    2017.08.15【NOIP提高组】模拟赛B组 单足跳
    2017.08.15【NOIP提高组】模拟赛B组 生日聚餐
    2017.08.12【NOIP提高组】模拟赛B组 巴比伦
  • 原文地址:https://www.cnblogs.com/xiximayou/p/12389363.html
Copyright © 2011-2022 走看看