zoukankan      html  css  js  c++  java
  • 用mapreduce 处理气象数据集

      用mapreduce 处理气象数据集

    编写程序求每日最高最低气温,区间最高最低气温

    1. 气象数据集下载地址为:ftp://ftp.ncdc.noaa.gov/pub/data/noaa
    2. 按学号后三位下载不同年份月份的数据(例如201506110187号同学,就下载2018年以7开头的数据,看具体数据情况稍有变通)
    3. 解压数据集,并保存在文本文件中                                                            
    4. 对气象数据格式进行解析                                                                     
    5. 编写map函数,reduce函数                                                                                                                                                                                                                                                                                                     
    6. 将其权限作出相应修改                                                                              
    7. 本机上测试运行代码                                                                                         
    8. 放到HDFS上运行
      1. 将之前爬取的文本文件上传到hdfs上                                                                                
      2. 用Hadoop Streaming命令提交任务                                                                                                                           

    9. 查看运行结果                                                                                                                                                                                                                                                    最低气温                                                                   
  • 相关阅读:
    spark on yarn 无法提交任务问题
    git rebase 操作撤销
    vim 删除屏蔽行
    mysql 登录远程数据库 失败
    springboot拦截器中获取配置文件值
    根据经纬度获取地址 :位置名称 区 市 省 国家 邮编
    element-ui upload组件上传
    java读写excel文件( POI解析Excel)
    easyui+themeleaf 分页查询实现
    java生成二维码
  • 原文地址:https://www.cnblogs.com/stcy520/p/9016234.html
Copyright © 2011-2022 走看看