zoukankan      html  css  js  c++  java
  • 【互动问答分享】第15期决胜云计算大数据时代Spark亚太研究院公益大讲堂

    “决胜云计算大数据时代”

                                                              Spark亚太研究院100期公益大讲堂 【第15期互动问答分享】

    Q1:AppClient和worker、master之间的关系是什么?

            AppClient是在StandAlone模式下SparkContext.runJob的时候在Client机器上应       用程序的代表。要完毕程序的registerApplication等功能。

            当程序完毕注冊后Master会通过Akka发送消息给client来启动Driver;

            在Driver中管理Task和控制Worker上的Executor来协同工作;

    Q2:Spark的shuffle 和hadoop的shuffle的差别大么?

            Spark的Shuffle是一种比較严格意义上的shuffle,在Spark中Shuffle是有RDD操作的依赖关系中的Lineage上父RDD中的每一个partition元素的内容交给多个子RDD;

            在Hadoop中的Shuffle是一个相对模糊的概念,Mapper阶段介绍后把数据交给Reducer就会产生Shuffle,Reducer三阶段的第一个阶段即是Shuffle。

     

    Q3:Spark 的HA怎么处理的?

            对于Master的HA,在Standalone模式下。Worker节点自己主动是HA的,对于Master的HA,一般採用Zookeeper;

            Utilizing ZooKeeper to provide leader election and some statestorage, you can launch multiple Masters in your cluster connected to the sameZooKeeper instance. One will be elected “leader” and the others will remain instandby mode. If the current leader dies, another Master will be elected,recover the old Master’s state, and then resume scheduling. The entire recoveryprocess (from the time the the first leader goes down) should take between 1and 2 minutes. Note that this delay only affects scheduling new applications– applications that were already running during Master failover are unaffected

            对于Yarn和Mesos模式,ResourceManager一般也会採用ZooKeeper进行HA;

  • 相关阅读:
    第二章 PROCESSES AND THREADS
    第一章 PROBLEMS
    第10章 图 10.1
    day2_jmeter关联的两种实现方式
    jmeter做SOAPui接口的性能测试
    day1_json_viewer美化接口请求、接口用例设计的方式和接口测试的必要性
    day1_jmeter接口如何添加断言
    day1_jmeter操作mysql步骤
    day1_jmeter添加cookie管理器和header信息头管理器
    day1_postman和jmeter处理接口入参既有key-value类型,也有上传文件类型的方式,利用postman实现自动化
  • 原文地址:https://www.cnblogs.com/bhlsheji/p/5090083.html
Copyright © 2011-2022 走看看