zoukankan      html  css  js  c++  java
  • Kaggle-预测降雨量Bi-LSTM模型

    Kaggle-How Much Did it Rain? II

    Predict hourly rainfall using data from polarimetric radars

    (比赛链接:https://www.kaggle.com/c/how-much-did-it-rain-ii)
    关于双向LISTM层模型请参照如下链接:
    http://simaaron.github.io/Estimating-rainfall-from-weather-radar-readings-using-recurrent-neural-networks/

    Description

    自从收到来自Kaggle社区的科学界和教育界朋友的反馈后,美国气象学会人工智能委员会迫不及待开展How Much Did it Rain?第二版竞赛。

    How Much Did it Rain?II聚焦于解决同样的降雨测量预测的核心问题,但这次使用一个新的经过改进的数据集和评估指标来达到目的。这次竞赛将进一步为大学构建一个有用的教育工具,并对气象研究产生有意义的推进作用。

    最近,为了提高他们的降雨量预报器,美国国家气象局将他们的雷达网络升级为偏振雷达。这些偏振雷达可以相比于传统多普勒雷达能够提供更高质量的数据,因为偏振雷达能以水平和垂直方向发射无线电波脉冲。

    双脉冲更容易推断降雨量的大小和类型,因为雨滴随着尺寸的增加变得扁平,而冰晶趋向于垂直拉长。

    在这个竞赛中,你被提供偏振雷达值的快照并要求预测每小时降雨量总计。注意:许多训练集中的许多计量值都不可信(例如仪表会堵塞),更多信息在data page。

    Evaluation

    这个比赛的评估指标是Mean Absolute(MAE)。关于选择MAE而非RMSE的选择,请参阅本文(http://climate.geog.udel.edu/~climate/publication_html/Pdf/WM_CR_05.pdf)。

    Submission File

    对于数据集中的每一个仪表小时,提交文件包含两列:Id和Excepted 。Id对应于test.csv中该名称的列。Excepted是预测仪表值。文件应该包含以后header和如下格式:

    Id,Expected
    1,0.73
    2,1.23
    3,0.49
    etc.
    

    Data

    训练集数据包含2014年4月到8月期间美国中西部玉米种植州的20天内收集的NEXRD和MADIS数据。时间和位置信息已经被审查,数据已经被洗牌,因此他们不会按照时间和地点排序。测试数据由该月剩余天数的相同雷达和仪表数据组成。请参见本文以更好理解偏振雷达测量。

    File description

    • train.zip - 训练集。这个文件包括玉米成长季节每月超过20天在美国中西部仪表上进行的雷达观测。同时还提供了每个小时结束时的仪表观测值。
    • test.zip - 测试集。这个文件包括与训练集相同时间的美国中西部每月剩余10天或11天的雷达观测值。你需要预测每个小时结束时的仪表观测值。
    • sample_solution.zip - 一个正确格式的提交文件。
    • sample_dask.py - 将生成示例提交文件的python示例程序。这个程序使用Marshall-Palmer关系于雷达观测值以预测仪表观测值。

    Data column

    为了理解数据,你必须意识到一小时内有多次雷达观测,只有一个仪表观测值(’Excepted‘)。这就是为什么有多行有着相同’Id'。

    数据集中columns如下所示:

    • Id:仪表上一小时后的一组观测值的唯一编号
    • minutes_past:对于每一组雷达观测值,进行雷达观测的之间刚过一小时的分钟数。雷达观测是那个时间点的快照。
    • radar_km:雷达上仪表距离地面的距离。
    • Ref:以公里为单位的雷达反射率
    • Ref_5x5_10th:仪表周围5x5领域中10%反射率
    • Ref_5x5_50th:仪表周围5x5领域中50%反射率
    • Ref_5x5_90th:仪表周围5x5领域中90%反射率
    • RefCompsite:仪表上方垂直列中的最大反射率,以dBZ为单位
    • RefCompsite_5x5_10th
    • RefCompsite_5x5_50th
    • RefCompsite_5x5_90th
    • RhoHV:相关系数(无单位)
    • RhoHV_5x5_10th
    • RhoHV_5x5_50th
    • RhoHV_5x5_90th
    • Zdr:以dB为单位的差分反射率
    • Zdr_5x5_10th
    • Zdr_5x5_50th
    • Zdr_5x5_90th
    • Kdp:特定微分相位(度/公里)
    • Kdp_5x5_10th
    • Kdp_5x5_50th
    • Kdp_5x5_90th
    • Expected:小时结束时以毫米为实际仪表观测值

    Code:

    https://github.com/LiuChar1esM/how-much-did-it-rain

  • 相关阅读:
    CDB中plug PDB
    Oracle Flashback Technologies
    Oracle Flashback Technologies
    Oracle Flashback Technologies
    Oracle Flashback Technologies
    Oracle Flashback Technologies (总)
    Unplugging一个PDB
    使用已有PDB克隆PDB
    Oracle 12C -- 使用seed PDB创建新的pdb
    ROW_NUMBER() OVER函数的基本用法
  • 原文地址:https://www.cnblogs.com/LCharles/p/15221830.html
Copyright © 2011-2022 走看看