zoukankan      html  css  js  c++  java
  • 大数据应用技术课程实践--选题与实践方案

    一、选题与意义

    1.Hadoop平台应用

    2.Kaggle分析数据项目

    简要说明理由与意义。

    Kaggle分析数据项目:亚马孙乐器的评测

    https://www.kaggle.com/eswarchandt/amazon-music-reviews

    选择第二个题目,Kaggle分析数据项目,理由是Hadoop的平台搭建对我个人能力来说,有些费时费力。

    而且对于个人能力和兴趣来说,更加喜欢Kaggle分析数据项目这一个选题。

    对通过Python进行数据清洗、数据处理、构建模型、进行应用这些更加熟练和清楚其中原理。

    二、实践方案

    简要说明理由。

    在Kaggle上找到自己感兴趣的数据集,然后下载后,在自己电脑上使用Python对数据进行处理和分析。

    个人电脑上已有Python的环境,且有anaconda和Pycharm可以用来进行数据分析。

    三、实践任务分解

    根据所选的题目,明确实验步骤,分解任务到每天。

    1、下载数据集

    2、读取数据集并进行数据清洗

    3、数据预处理

    4、对数据进行可视化

    5、根据数据特征选择模型构建并训练

    6、预测,分类

    7、评估模型

    8、完善和总结

    四、实践计划

    按任务分解撰写计划表,每天按计划表开展工作。

    第天根据实际情况更新计划表,有必要时调整。

     

    2.

    https://www.kaggle.com/competitions

    说明:

      • 个人项目,不要求组队,确实需要组队的说明理由。
      • 边操作边记录;
      • 每天完成当天文档;
      • 最后综合成课程实践报告。
  • 相关阅读:
    第二周作业
    第二次作业
    第一周作业
    我的2018年终总结
    css总结
    python中使用selenium错误-Firefox浏览器
    postman中 form-data、x-www-form-urlencoded、raw、binary的区别
    谷歌地图API(一)
    2014新年开题
    图书馆管理系统-需求分析
  • 原文地址:https://www.cnblogs.com/cyxxixi/p/13183098.html
Copyright © 2011-2022 走看看