zoukankan      html  css  js  c++  java
  • 用mapreduce 处理气象数据集

      用mapreduce 处理气象数据集

    编写程序求每日最高最低气温,区间最高最低气温

    1. 气象数据集下载地址为:ftp://ftp.ncdc.noaa.gov/pub/data/noaa
    2. 按学号后三位下载不同年份月份的数据(例如201506110187号同学,就下载2018年以7开头的数据,看具体数据情况稍有变通)
    3. 解压数据集,并保存在文本文件中                                                            
    4. 对气象数据格式进行解析                                                                     
    5. 编写map函数,reduce函数                                                                                                                                                                                                                                                                                                     
    6. 将其权限作出相应修改                                                                              
    7. 本机上测试运行代码                                                                                         
    8. 放到HDFS上运行
      1. 将之前爬取的文本文件上传到hdfs上                                                                                
      2. 用Hadoop Streaming命令提交任务                                                                                                                           

    9. 查看运行结果                                                                                                                                                                                                                                                    最低气温                                                                   
  • 相关阅读:
    Search Insert Position(二分查找)
    c++基础题
    Divide Two Integers(模拟计算机除法)
    Swap Nodes in Pairs(链表操作)
    Letter Combinations of a Phone Number(带for循环的DFS,组合问题,递归总结)
    进程和程序的区别
    Add Two Numbers(链表)
    Longest Substring Without Repeating Characters
    02.友盟项目--原始日志数据生成
    01.友盟项目--nginx服务器配置
  • 原文地址:https://www.cnblogs.com/stcy520/p/9016234.html
Copyright © 2011-2022 走看看