看了这篇文章很好,有很多指导性思想:
http://www.cnblogs.com/tornadomeet/p/3395593.html
另外这个人的系列文章里面也有很多干货。
就看这个系列的吧:
http://blog.csdn.net/yaoqiang2011/article/category/5877239/3
http://blog.csdn.net/lewsn2008/article/category/1743571
http://blog.csdn.net/pakko/article/details/37878837
http://blog.csdn.net/han_xiaoyang/article/details/49123419
spark+svm:
http://blog.csdn.net/ksearch/article/details/24186795
另外本机上的 /Users/baidu/Documents/Data/Interview/机器学习-数据挖掘/机器学习实战(中文版+英文版+源代码)
机器学习实战.pdf