s通过案例彻底详解spark中DAG的逻辑视图的产生机制和过程 -- （视频笔记）（重点） - 走看看

zoukankan html css js c++ java

s通过案例彻底详解spark中DAG的逻辑视图的产生机制和过程 -- （视频笔记）（重点）

hadoop RDD 把hdfs的block转换为split 的逻辑映射

mapPartitioned RDD 从split中转换，与hadoop RDD 一一映射

textFile

flatMap 也是mapPartitioned RDD

map

reduceByKey

会将前期的窄依赖部分合并作为一个stage

第一个stage 会将结果写入到local file system（shuffle write）中

groupbykey及其以后因为存在shuffle，因此会生成一个新的stage

从上一个stage的local file system中获取数据（shuffer read）

driver 中的map output tracker的master负责跟踪第一个stage的输出。

参看spark shell的任务图形。

查看全文

相关阅读:
HDU 1257 最少拦截系统（最长递减子序列的条数）
POJ 2063 Investment 滚动数组+完全背包
 POJ 2392 Space Elevator 贪心+dp
CodeForces 154A Hometask dp
CodeForces 57C Array 组合计数+逆元
 hdu 4398 Template Library Management（贪心+stl）
优先队列详解(转载)
hdu 4393 Throw nails（优先队列）
hdu 4022 Bombing（map,multiset）
hdu 1027 Ignatius and the Princess II（产生第m大的排列，next_permutation函数）

原文地址：https://www.cnblogs.com/isenhome/p/5085959.html

Copyright © 2011-2022 走看看