zoukankan      html  css  js  c++  java
  • 【经验分享】我经历的几门MOOC

    这半年来,从1月初到6月底,在coursera上注册了4们有关数据分析/挖掘的课程。这些课程都是利用业余时间学习,每周基本上花5个小时左右。其中通过了3门,注销了一门。感觉还是学到了一些东西。

    第一门课程 Computing for Data Science,2013年1月2日开课,为期4周。本课程主要是学习编程语言R---一种数据分析语言和环境,学完后可以用R完成基本分析任务,但一些高级的数据可视化掌握得不熟练,需要后面巩固。

    第二门课程 Data Analysis,2013年1月22日开课,为期8周。这门课程与上门课程配套的,主要用R进行一些数据分析。主要的理论是统计学,什么概率,抽样,统计,正太分布,置信区间,假设检验呀,线性回归,决策树,随机深林等。课程中有两个peer review作业(我最喜欢的部分),需要按照要求对两个问题进行分析,然后输出分析报告。第一个问题是分析LeadingClub(美国的一家P2P借贷平台)的借贷利率的制订方式,这个任务是在过年期间完成的,所以过年除开走亲戚的时间,基本上都耗在这上面了,不过还是值得的,这个过程学到了很多东西。这个问题用线性回归可以轻松解决。第二个问题分析三星手机收集的用户行为数据,预测用户的行为(走,坐,站,上楼,下楼等)。也是要输出一份分析报告,使用决策树和随机森林可以搞定。我很喜欢Coursera上的Peer Review的学习方式,因为这样可以知道其他人对同样一个问题的看法,达到交流和沟通的目的,review的过程也是一种学习的过程,所以我总是将那些我认为回答的很好的报告保留,作为以后的参考。

    第三门课程 (Web Intelligence and Big Data,2013年4月26日开始,为期12周)和第四门(Introduction to Data Science,2013年5月1日开始,为期8周)内容有点重复,主要是讲数据分析/挖掘在大数据(MR,NoSQL,HDFS)技术上的应用。但是第三门课程讲的太抽象,而且作业大多数都是选择题,感觉没有意思,后来注销了。第四门课程作业设置自比较合理,全部都是数据分析或者编程这种主观作业,而且还结合了实际问题---可选的real world project和aws上的nosql作业。课程还介绍了一个竞赛平台kaggle,而且有一个作业是参加这个平台中额一个竞赛,在这个作业的peer review中,我得了慢分。这个平台与以往的ACM竞赛平台不同。它上面的问题都是实际问题,解决方案会给相关企业带来直接的利益,而且有些问题还会给优秀的解决方案提供奖金(虽然不多)。后续会继续关注和参加比赛,历练自己。

    总结经验:Coursera上面的课程有时间限制,建议同时不要学习多门课程,尤其是平时还有很多工作,当时学习第三和第四们课程时,时间有重叠,感觉吃不消,所以果断注销了第三门课程,最后顺利完成了第四们课程。

  • 相关阅读:
    AcWing 1027. 方格取数 dp
    AcWing 1014. 登山 dp
    acwing 482. 合唱队形 dp
    LeetCode 1463. 摘樱桃II dp
    LeetCode 100. 相同的树 树的遍历
    LeetCode 336. 回文对 哈希
    LeetCode 815. 公交路线 最短路 哈希
    算法问题实战策略 DARPA大挑战 二分
    算法问题实战策略 LUNCHBOX 贪心
    AcWing 1100. 抓住那头牛 BFS
  • 原文地址:https://www.cnblogs.com/bourneli/p/3368185.html
Copyright © 2011-2022 走看看