参考资料:http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html
关于libSVM的使用可以见上面的链接
libSVM就如同自己介绍的一样easy--use,而且支持的平台比较广泛,支持的语言也很多
mahout的许多算法是建立在hadoop支持的基础上的分布式计算理念的实现,虽然同是机器学习,但是二者支持的范围不太一样。
如果数据量很大,首选的当然是mahout,因为如果使用libSVM的话就会自己下功夫去处理分布式计算结果的聚合问题。
如果数据量比较小,模型简单,libSVM是和很好的选择,mahout有点简单的文档会在你想进一步设计自己的模型时有自杀的冲动【需要研读代码才知道怎么做,做什么】。
mahout | libSVM | |
需分析的数据量 | 大 | 小 |
支持系统 | Linux | windows、linux |
支持语言 | java | 很多 |
建模难度 | 高,需要对建模使用的算法有很好的掌握 | 较易 |
计算模式 | 分布式+单机 | 单机 |