zoukankan      html  css  js  c++  java
  • Hadoop伪分布式集群搭建

    声明:作者原创,转载注明出处。

    作者:帅气陈吃苹果

    1、下载Hadoop压缩包

    wget http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.6.5/hadoop-2.6.5.tar.gz
    

    2、解压Hadoop压缩包

    mkdir /bigdata
    tar -zxvf hadoop-2.6.5.tar.gz -C /bigdata
    

    3、配置Hadoop(伪分布式)

    cd /bigdata/hadoop-2.6.5/etc/hadoop
    
    1)vim hadoop-env.xml
    export JAVA_HOME=/usr/lib/jvm/java
    
    2)vim core-site.xml
     <configuration>
       <!-- 配置hdfs的namenode的地址-->
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://master</value>
        <property>
        <!-- 配置Hadoop运行时产生数据的存储目录,注意:不是临时数据 -->
        <property>
            <name>hadoop.tmp.dir</name>
            <value>/home/hadoop/local/var/hadoop/tmp/hadoop~${user.name}</value>
        </property>
    </configuration>
    
    3)vim hdfs-site.xml
     <configuration>
       <!-- 指定HDFS存储数据的副本数据量-->
        <property>
            <name>dfs.replication</name>
            <value>1</value>
        <property>
    </configuration>
    
    4)vim mapred-site.xml
     <configuration>
       <!-- 指定MapReduce编程模型运行在YARN上-->
        <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
        <property>
    </configuration>
    
    5)vim yarn-site.xml
    <configuration>
        <!-- 指定YARN的resourcemanager的地址(伪分布式时就是主机名,localhost或IP地址都行) -->
        <property>
            <name>yarn.resourcemanager.hostname</name>
            <value>master</value>
        <property>
    
        <!--  MapReduce执行shuffle时获取数据的方式 -->
        <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
        <property>
    </configuration>
    
    6)vim /etc/hosts

    添加主机ip与主机名的映射:

    192.168.29.188 master
    

    4、HDFS初始化

    即格式化HDFS(的namenode),

    cd hadoop/hadoop-2.6.5/bin
    
    hadoop namenode -format
    

    5、启动Hadoop集群

    cd hadoop/hadoop-2.6.5/sbin
    
    //在hadoop-2.x中,推荐使用start-dfs.sh和start-yarn.sh来分别启动
    start-all.sh
    

    6、使用jps命令查看进程是否存在

    8707 	DataNode
    8580 	NameNode
    9013 	ResourceManager
    8873 	SecondaryNameNode
    18057 	Application
    9308 	NodeManager
    17644 	Jps
    

    7、查看WEB界面

    访问HDFS的管理界面:ip:50070

    访问YARN的管理界面:ip:8088

    最后,欢迎指正。喜欢的话,点个赞呗,请你吃苹果。

  • 相关阅读:
    原型模式&原型链
    [四种方法]检测数据类型
    JSON
    PHP基础 mysqli的事务处理
    PHP的扩展类 mysqli_stmt:预处理类
    PHP的 Mysqli扩展库的多语句执行
    PHP基础文件下载类的简单封装
    PHP基础封装简单的MysqliHelper类
    Spring深入浅出(四)AOP面向切面
    Spring深入浅出(二)IOC的单例 ,继承,依赖,JDBC,工厂模式以及自动装载
  • 原文地址:https://www.cnblogs.com/sqchen/p/8080883.html
Copyright © 2011-2022 走看看