zoukankan      html  css  js  c++  java
  • 53.storm简介

    一、简介

    1.storm是twitter开源的一个分布式的实时计算系统,用于数据实时分析,持续计算,分布式RPC等等。

    • 官网地址:http://storm-project.net
    • 源码地址:https://github.com/nathanmarz/storm
    • Jstorm实现高可用。

    2.实时计算要解决一些什么问题?

    • 最显而易见的就是实时推荐系统,比如我们在淘宝等电商购物网站买东西,我们会在网页旁边或者底端看到与自己需要商品相关的系列产品。这就是使用类似storm实时计算算法去做的,我们非常熟悉的hadoop只是做离线数据分析,无法做到实时分析计算。
    • 比如车流量实时计算,可以利用storm为我们实时计算每一个路段的拥挤度等相关路况信息。
    • 再比如过票,也是一种实时计算的机制,利用storm完全可以实现。

    3.实现一个实时计算系统

    • 低延迟:实时计算,延迟肯定要低。
    • 高性能:可以使用几台普通的服务器建立环境,结余成本。
    • 分布式:storm非常适合于分布式场景,大数据的实时计算;你的数据和计算单机就能搞定的话,那么不用考虑这些复杂问题了。我们所说的是单机搞不定的情况。
    • 可扩展:伴随着业务的发展,我们的数据量、计算量可能会越来越大,所以希望这个系统可以扩展。
    • 容错:这是分布式系统中通用的问题,一个节点挂了不能影响应用,storm可以轻松做到在节点挂了的时候实现任务转移,并且在节点重启的时候(也就是重新投入生产环境时,自动平衡任务)
    • 可靠性:可靠的消息处理。storm保证每一个消息至少能得到一次完整处理。任务失败时,它会负责从消息源重试消息。
    • 快速:系统的设计保证了消息能得到快速的处理,使用ZeroMQ作为其底层消费队列。
    • 本地模式:Storm有一个“本地模式”,可以在处理过程中完全模拟storm集群。这样可以快速进行开发和单元测试。

    二、storm体系结构

    • 首先我们那hadoop和storm进行一个简单的对比
    • Storm是一个开源的分布式实时计算系统,可以简单、可靠的处理大量的数据流。Storm有很多使用场景:如实时分析,在线机器学习,持续计算,分布式RPC,ETL等待。Storm支持水平扩展,具有高容错性,保证每个消息都得到处理,而且处理速度很快(在一个小集群中,每个节点每秒可以处理数以百万计的消息)。Storm的部署和运维都很便捷,而且更为重要的是,可以使用任意编程语言来开发应用。
    • storm框架结构图
    1. Nimbus主节点:主节点通常运行一个后台程序--Nimbus,用于响应分布式集群中的节点,分配任务和监测故障。这个很类似于Hadoop的Job Tracker
    2. Supervisor工作节点:通常运行一个后台程序--Supervisor,用于监听工作,指派工作进程,每一个工作节点都是topology中一个子集的实现。而Nimbus和Supervisor之间的协议通过zookeeper系统集群。
    3. zookeeper:是完成Supervisor和Nimbus之间协调的服务。而应用程序实现实时的逻辑则被封装到storm的topology。topology姿势一组由Spouts和Bolts通过Stream Groupings进行连接的图。
    4. Topology:拓扑,就是一个概念
    5. storm中运行的一个实时应用程序,因为各个组件间的消息形成逻辑上的一个拓扑结构。一个topology是spouts和bolts组成的图,通过stream groupings将图中的spouts和bolts连接起来:
  • 相关阅读:
    1133catalan数二维变种
    HDU2254 奥运 矩阵应用
    hdu1134大数+catalan数
    C#编写一个控制台应用程序,输入三角形或者长方形边长,计算其周长和面积并输出。
    简单工厂
    每日总结
    C#编写一个控制台应用程序,可根据输入的月份判断所在季节
    使用Java api对HBase 2.4.5进行增删改查
    C#编写程序,用 while 循环语句实现下列功能:有一篮鸡蛋,不止一个,有人两个两 个数,多余一个,三个三个数,多余一个,再四个四个地数,也多余一个,请问这篮鸡蛋至 少有多少个
    每日总结
  • 原文地址:https://www.cnblogs.com/sigm/p/6846474.html
Copyright © 2011-2022 走看看