zoukankan      html  css  js  c++  java
  • Hadoop完全分布式搭建 --- XML配置文件

    <!-- 指定namenode的所在主机 -->
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://linux.centos.two:8020</value>
        </property>
    
        <!-- 指定Hadoop临时目录 -->
        <property>
            <name>hadoop.tmp.dir</name>
            <value>/opt/modules/hadoop-2.5.0/data</value>
        </property>
    core-site.xml
    <!-- 分布式副本数设置为3 -->
        <property>
            <name>dfs.replication</name>
            <value>4</value>
        </property>
        
        <!-- secondarynamenode所在主机名 -->
        <property>
            <name>dfs.namenode.secondary.http-address</name>
            <value>linux.centos.three:50090</value>
        </property>
        
        <!-- namenode的web访问主机名:端口号,这个地方的主机必须是和namenode是同一台机器 -->
        <property>
            <name>dfs.namenode.http-address</name>
            <value>linux.centos.two:50070</value>
        </property>
        
        <!-- 关闭权限检查用户或用户组 -->
        <property>
            <name>dfs.permissions.enabled</name>
            <value>false</value>
        </property>
    hdfs-site.xml
    <!-- 指定MapReduce基于yarn来运行 -->
        <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
        </property>
        
        <!-- mapreduce 的 jobhistoryserver 主机地址及端口号 这是Hadoop之间的联系使用 -->
        <property>
            <name>mapreduce.jobhistory.address</name>
            <value>linux.centos.two:10020</value>
        </property>
        
        <!--指定 jobhistory 服务的web访问的主机及RPC端口号 这个是WEB访问的端口服务-->
        <property>
            <name>mapreduce.jobhistory.webapp.address</name>
            <value>linux.centos.two:19888</value>
        </property>
    mapred-site.xml
    <!--指定哪个节点作为resourcemanager-->
        <property>
            <name>yarn.resourcemanager.hostname</name>
            <value>linux.centos.four</value>
        </property>
        
        <!--在mapreducer过程中启用shuffle-->
        <!-- 
            NodeManager上运行的附属服务。需配置成mapreduce_shuffle,才可运行MapReduce程序
            指明在执行MapReduce的时候使用shuffle
        -->
        <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
        </property>
        
        <!--启用日志聚合-->
        <property>
            <name>yarn.log-aggregation-enable</name>
            <value>true</value>
        </property>
        
        <!-- 设置日志的保存时间,按照秒来计算 -->
        <property>
            <name>yarn.log-aggregation.retain-seconds</name>
            <value>86400</value>
        </property>
    yarn-site.xml
  • 相关阅读:
    ASP.NET Core 中的路由约束
    专治拖延症,好方法
    虚拟机hadoop集群搭建
    python爬虫+词云图,爬取网易云音乐评论
    gp数据库运维
    kafka和springboot整合应用
    kafka配置监控和消费者测试
    集群运维ansible
    SpringBoot和微服务
    python每天定时发送短信脚本
  • 原文地址:https://www.cnblogs.com/name-hanlin/p/7811769.html
Copyright © 2011-2022 走看看