Task执行内幕与结果处理解密 - 走看看

zoukankan html css js c++ java

Task执行内幕与结果处理解密
本课主题
- Task执行内幕与结果处理解密
引言

这一章我们主要关心的是 Task 是怎样被计算的以及结果是怎么被处理的
- 了解 Task 是怎样被计算的以及结果是怎么被处理的
Task 执行原理流程图

[下图是Task执行原理流程图]
1. Executor 会通过 TaskRunner 在 ThreadPool 来运行具体的 Task，TaskRunner 内部会做一些准备的工作，例如反序例化 Task，然后通过网络获取需要的文件、Jar等
2. 运行 Thread 的 run 方法，导致 Task 的 runTask 被调用来执行具体的业务逻辑处理
3. 在Task 的 runTask内部会调用 RDD 的 iterator( ) 方法，该方法就是我们针对当前 Task 所对应的 Partition 进行计算的关键之所在，在处理内部会迭代 Partition 的元素并交给我们先定义的 Function 进行处理
  
  ShuffleMapTask: ShuffleMapTask 在计算具体的 Partition 之后实际上会通过 ShuffleManager 获得的 ShuffleWriter 把当前 Task 计算的数据具体 ShuffleManger 的实现来写入到具体的文件。操作完成后会把 MapStatus 发送给 DAGScheduler； (把 MapStatus 汇报给 MapOutputTracker)
  
  ResultTask: 根据前面 Stage 的执行结果进行 Shuffle 产生整个 Job 最后的结果；(MapOutputTracker 會把 ShuffleMapTask 執行結果交給 ResultTask)
Task 执行内幕源码解密
查看全文

相关阅读:
react axios 跨域访问一个或多个域名
 基础复习1
Webpack笔记
 小程序笔记下
 小程序笔记上
 webpack-dev-server的使用
 webpack资源加载常用配置
 vue实现组件切换的两种方式
 vue实现一个评论列表
 子组件调用父组件的数据及方法

原文地址：https://www.cnblogs.com/sky-sql/p/9079039.html

Copyright © 2011-2022 走看看