zoukankan      html  css  js  c++  java
  • Storm程序的并发机制(重点掌握)

    概念

    Workers (JVMs): 在一个物理节点上可以运行一个或多个独立的JVM 进程。一个Topology可以包含一个或多个worker(并行的跑在不同的物理机上), 所以worker process就是执行一个topology的子集, 并且worker只能对应于一个topology 

    Executors (threads): 在一个worker JVM进程中运行着多个Java线程。一个executor线程可以执行一个或多个tasks。但一般默认每个executor只执行一个task。一个worker可以包含一个或多个executor, 每个component (spoutbolt)至少对应于一个executor, 所以可以说executor执行一个compenent的子集, 同时一个executor只能对应于一个component 

    Tasks(bolt/spout instances)Task就是具体的处理逻辑对象,每一个SpoutBolt会被当作很多task在整个集群里面执行。每一个task对应到一个线程,而stream grouping则是定义怎么从一堆task发射tuple到另外一堆task。你可以调用TopologyBuilder.setSpoutTopologyBuilder.setBolt来设置并行度 — 也就是有多少个task 

     

    配置并发度

     对于并发度的配置, storm里面可以在多个地方进行配置, 优先级为:

    defaults.yaml < storm.yaml < topology-specific configuration< internal component-specific configuration < external component-specific configuration 

    worker processes的数目, 可以通过配置文件和代码中配置, worker就是执行进程, 所以考虑并发的效果, 数目至少应该大于machines的数目 

    executor的数目, component的并发线程数,只能在代码中配置(通过setBoltsetSpout的参数), 例如, setBolt("green-bolt", new GreenBolt(), 2) 

    tasks的数目, 可以不配置, 默认和executor1:1, 也可以通过setNumTasks()配置 

    Topologyworker数通过config设置,即执行该topologyworkerjava)进程数。它可以通过 storm rebalance 命令任意调整。 

    3个组件的并发度加起来是10,就是说拓扑一共有10executor,一共有2worker,每个worker产生10 / 2 = 5条线程。

    绿色的bolt配置成2executor4task。为此每个executor为这个bolt运行2task

     

     

    动态的改变并行度

     

    Storm支持在不 restart topology 的情况下, 动态的改变(增减) worker processes 的数目和 executors 的数目, 称为rebalancing. 通过Storm web UI,或者通过storm rebalance命令实现: 

    storm rebalance mytopology -n 5 -e blue-spout=3 -e yellow-bolt=10

  • 相关阅读:
    DOM中元素节点、属性节点、文本节点的理解
    vue3+ts +vant 从0搭建移动端架子
    (转)一位软件工程师的6年总结
    tabcontrol的alignment属性设置成Right时,tabPage的text内容不能显示的问题<转>
    已知两点,画过两点的直线
    索引器
    SQL中 非 简体中文排序出现乱码的问题
    group by 列 聚合函数 where having
    SQL存储过程及事务
    使用C#创建Windows服务
  • 原文地址:https://www.cnblogs.com/ahu-lichang/p/6899535.html
Copyright © 2011-2022 走看看