补交作业
01 Spark架构与运行流程,https://www.cnblogs.com/0311Chrome/p/14856587.html(第一次作业)
原因:当时忘记这次作业了
Spark RDD编程,https://www.cnblogs.com/0311Chrome/p/14856591.html(第二次作业)
原因,当时做完了忘记保存下来想着第二天再重新做也忘记了
RDD编程练习,https://www.cnblogs.com/0311Chrome/p/14856591.html(第三次作业)原因,当时也是忘记了写作业了
大作业:
1.选择使用什么数据,有哪些字段,多大数据量。
美国新冠肺炎疫情数据集,字段:累计确诊人数、累计死亡人数、新增确诊人数、新增死亡人数、各州累计确诊人数、各州累计死亡人数和美国各州
2.准备分析哪些问题?(8个以上)
美国每日的累计确诊病例数和死亡数
美国每日的新增确诊病例数
美国每日的新增死亡病例数
截止5.19,美国各州累计确诊、死亡人数和病死率
截止5.19,美国累计确诊人数前10的州
截止5.19,美国累计死亡人数前10的州
截止5.19,美国累计确诊人数最少的10个州
截止5.19,美国累计死亡人数最少的10个州
截止5.19,美国的病死率