1. 大数据计算分实时计算与离线计算
2. SparkSQL
3. Spark Streaming
4. Storm
5. ElasticSearch
6. HBase二级存储等
7. YARN
工作流定义;当前运行的工作流实例,包括实例的状态和变量
Oozie
实时数据检索和分析、日志分析
ELK Stack 是 Elasticsearch、Logstash、Kibana 三个开源软件的组合。在实时数据检索和分析场合,三者通常是配合共用,而且又都先后归于 Elastic.co 公司名下,故有此简称。
ELK Stack 在最近两年迅速崛起,成为机器数据分析,或者说实时日志处理领域,开源界的第一选择
http://www.cnblogs.com/danbo/p/5220516.html
功能自动化测试框架
Robot Framework
自然语言处理(Natural Language Processing,简称NLP)就是用计算机来处理、理解以及运用人类语言
自然语言处理=文本处理+机器学习
学习、抽象、总结能力外,还需要架构实践
greys-anatomy