欢迎转载,转载请注明出处,徽沪一郎,谢谢。
楔子
或许谈起storm是大数据实时计算框架已经让你不明觉厉,如果说storm还可以跟机器学习算法(ml)有机的结合在一起,是不是更加觉着高大尚呢。trident-ml就是一个这样让人无限遐想的产品。
其实要讲trident-ml无非是要回答这样几个问题,
- 什么是ml
- 什么是trident
- 为什么要将trident用于ml
trident-ml的官方站点 https://github.com/pmerienne/trident-ml
什么是ml
关于什么是ML(Machine Learning)以及machine learning的常见算法有哪些,详见维基百科中的介绍,要是觉着这解释不过瘾,那就来点有料的来自princeton大学的讲义
什么是trident
这个问题在本博的系列文章中已经屡次提及并有详尽的解释。
为什么要将trident和ml绑定在一块
Machine Learning机器学习库运行在trident之上使得分析的结果更为实时的反映出来,加快了调整步骤。举个例子吧,比如在逛京东或是amazon,通过这个实时的机器学习过程,后台服务可以给客户找到更为精确的推荐产品。
有什么同类的产品么
在软件这个世界里,从来不存在什么唯一,即然有trident-ml,那么就能找到同类的产品。
谈到机器学习,你可能听说过在该领域最牛的处理语言R。到了这里,想必已经料到与trident-ml相竞争的是一个什么东东了,对那就是trident-r。
trident-r的官方地址 https://github.com/quintona/storm-r
与trident-ml相比,trident-r表现的不够活跃,略显沉闷。
总结
关于apache storm,本博已经花了相当的篇幅来聊它的里里外外。从明儿开始,换个话题聊聊了。或者是yarn,或者是linux kernel或者是server application,谁知道呢?