zoukankan      html  css  js  c++  java
  • hadoop之二hadoop系统调优以及mapreduce文件测试

    2020.7.17      hadoop文件目录创建,文件上传以及性能调优

    一.工作内容

    1.创建用户目录,创建文件上传目录

    2.统计特定字符串出现次数,查看结果

    3.性能调优

    二.具体内容

    1.创建用户目录

    Hadoop fs -mkdir xxxx

     

    1. 创建上传目录input,并且上传文件

    Hadoop fs -put dat0102.dat /input

     

    1. 查询字符串出现次数,并查询结果

     

     

    1. hadoop性能调优

    <property>

            <name>yarn.scheduler.maximun.alLoction-mb</name>

            <value>1024<alue>

            </property>

            </configuration>

            <configuration>

            <property>

            <name>mapreduce.map.memory.mb</name>

            <value>1024<value>

            </property>

            <property>

            <name>mapreduce.reduce.memory.mb</name>

            <value>2048<value>

            </property>

            <property>

            <nane>mapreduce.map.java.opts</nane>

            <value>-Xmx768m<value>

            </property>

            <property>

            <name>mapreduce.reduce.java.opts</name>

            <value>-Xmx1536m<value>

    </property>

     

    三.遇到的问题

    1. Mapreduce实例jar包运行的问题
    2. 配置文件编写的问题

    四,解决方式

    1. mapreduce运行时,1没有运行输入文件,2没有提交文件路径,在运行时发现命令不对,根据命令提示,输入wordcount,然后就提示输入文件路径,因此输入 dat0102.dat 文件路径
    2. 配置文件多是标签不对应的问题,和html文件一样要前后标签一一对应
  • 相关阅读:
    20191017-1 每周例行报告
    20191010-2 每周例行报告
    20190919-1 每周例行报告
    彭思雨20190919-3效能分析
    zipfile
    subprocess
    configparser
    hashlib
    json & pickle
    headpq
  • 原文地址:https://www.cnblogs.com/ningl666/p/13331034.html
Copyright © 2011-2022 走看看