一、选题与意义
1.Hadoop平台应用
2.Kaggle分析数据项目
简要说明理由与意义。
选择题目二,根据自己的实际的编程环境,以及对选题的理解程度后,我决定选择第二题。通过Kaggle平台上活跃的比赛社区氛围,也能够让我了解更多相关的技术应用,获得更多帮助。
二、实践方案
简要说明理由。
在kaggle中泰坦尼克号灾难项目是新手入门的最好项目之一,我将通过这个入门项目熟悉数据的预处理和分析,模型类型的选取比较,寻找提高预测准确率的方法。
三、实践任务分解
根据所选的题目,明确实验步骤,分解任务到每天。
四、实践计划
按任务分解撰写计划表,每天按计划表开展工作。
1.
- 网站用户购物行为分析
- 官网:http://dblab.xmu.edu.cn/post/7499/
- 淘宝双11数据分析与预测
- 官网:http://dblab.xmu.edu.cn/post/8116/
- 电信用户行为分析
- http://dblab.xmu.edu.cn/post/useranalysis/
大数据平台安装软件:
链接:https://pan.baidu.com/s/1lZM6BkZ6XoRE3uwepsQ_5A
提取码:ao1m
虚拟机镜像文件:
链接:https://pan.baidu.com/s/1e0qak_9Uymn_R1HmSu5ZLw
提取码:q0lt
2.
https://www.kaggle.com/competitions
说明:
- 个人项目,不要求组队,确实需要组队的说明理由。
- 边操作边记录;
- 每天完成当天文档;
- 最后综合成课程实践报告。