Spark-2.0原理分析-shuffle过程

zoukankan html css js c++ java

Spark-2.0原理分析-shuffle过程
shuffle概览

shuffle过程概览

shuffle数据流概览

shuffle数据流

shuffle工作流程

在运行job时，spark是一个stage一个stage执行的。先把任务分成stage，在任务提交阶段会把任务形成taskset，在执行任务。
spark的DAGScheduler根据RDD的ShuffleDependency来构建Stages：
- 例如：ShuffleRDD/CoGroupedRDD有一个ShuffleDependency。
- 很多操作通过钩子函数来创建ShuffleRDD
每个ShuffleDependency会map到spark的job的一个stage，然后会导致一个shuffle过程。

为什么shuffle过程代价很大

这是由于shuffle过程可能需要完成以下过程：
- 重新进行数据分区
- 数据传输
- 数据压缩
- 磁盘I/O
shuffle的体系结构

ShuffleManager接口

shuffleManager是spark的shuffle系统的可插拔接口。ShuffleManager将会在driver和每个executor上的SparkEnv中进行创建。可以通过参数spark.shuffle.manager进行设置。
driver通过ShuffleManager来注册shuffle，并且executor通过它来读取和写入数据。

ShuffleWriter

控制shuffle数据输出逻辑。

ShuffleReader

获取shuffle过程中用于ShuffleRDD的数据。

ShuffleBlockManager

管理抽象的bucket和计算数据块之间的mapping过程。

基于sort的shuffle

sort-based的shuffle，会把输入的记录根据目标分区id(partition ids)进行排序。然后写入单个的map输出文件中。为了读取map的输出部分，Reducers获取此文件的连续区域。当map输出的数据太大而内存无法存放时，输出的排序子集可以保存到磁盘，这些磁盘文件被合并后，生成最终的输出文件。
sort shuffle有两个不同的输出路径来产生map的输出文件：
Sort Shuffle Manager

Sort Shuffle Writer
- 每个map任务都会产生一个shuffle数据文件，和一个Index文件
  
  通过外部排序类ExternalSorter对数据进行排序
- 若map-side需要进行合并（combine）操作，数据将会按key和分区进行排序，若没有合并操作数据只会根据分区进行排序。
查看全文

相关阅读:
和为S的连续正数序列
 丑数
 整数中1出现的次数（从1到n整数中1出现的次数）
数据库常见面试题(非DBA方向)
两个链表的第一个公共结点
 最小的k个数
 常用的排序
 离散数学（第2版）课后习题答案
 Java入门基础正式汇总
 数学物理方程课后习题答案清华大学出版社出版姜玉山、徐延钦、王晓敏、张庆灵、刘超、李明维版第2章课后题答案与解析复习提纲