五、随机森林和 Extra-Trees
六、Ada Boosting 和 Gradient Boosting
七、Stacking
八、学习scikit-learn文档,
官方学习文档: http://scikit-learn.org
http://scikit-learn.org/stable/user_guide.html
今年,Kaggle刚刚上线了Kaggle Learn模块,使用Kaggle的数据,来一点点进行机器学习实战。可以参考:https://www.kaggle.com/learn/overview
其次,对于Kaggle的入门级比赛,有很好的Tutorial,请看这个页面的所有Tutorial,只针对一个泰坦尼克数据,使用不同方案解决,是很好的步入机器学习竞赛的第一步:https://www.kaggle.com/c/titanic#tutorials
Kaggle官方博客也有很多好的内容:http://blog.kaggle.com/
在你参加具体比赛的时候,Kaggle的论坛会是你的好帮手:https://www.kaggle.com/discussion
有人整理出了Kaggle比赛中很多问题的第一名的解决方案思路,其实这些内容都是引用上面Kaggle的官方博客或者论坛的内容:)