Spark IMF传奇行动第22课：RDD的依赖关系彻底解密 - 走看看

zoukankan html css js c++ java

Spark IMF传奇行动第22课：RDD的依赖关系彻底解密
版权声明：本文为博主原创文章，未经博主允许不得转载。作者：HaiziS

昨晚听了王家林老师的Spark IMF传奇行动第22课：RDD的依赖关系彻底解密，笔记如下：

1,窄依赖是指每个父RDD的一个Partition最多被子RDD的一个Partition所使用，例如map、filter、union等都会产生窄依赖；

2宽依赖是指一个父RDD的Partition会被多个子RDD的Partition所使用，例如groupByKey、reduceByKey、sortByKey等操作都会产生宽依赖

表面上是数据在流动，实质上算子在流动,数据不动代码动
def combineByKeyWithClassTag[C]( createCombiner: V => C, mergeValue: (C, V) => C, mergeCombiners: (C, C) => C, partitioner: Partitioner, mapSideCombine: Boolean = true, serializer: Serializer = null)(implicit ct: ClassTag[C]): RDD[(K, C)] = self.withScope { 其中mapSideCombine: Boolean = true，表明了map端的combine操作为true,减少网络IO
后续课程可以参照新浪微博王家林_DT大数据梦工厂：http://weibo.com/ilovepains

王家林中国Spark第一人,微信公共号DT_Spark

转发请写明出处。
查看全文

相关阅读:
cocos2d-x 2.2 study ------------------------ 双击事件(转)
cocos2d-x打包Android
cocos2d-x在win7下的android交叉编译环境
 Cocos2d-x之CCImage深入分析
 Eclipse开发C/C++之使用技巧小结
 TortoiseSVN安装使用
 cocos2d-x 2.2 study ------------------------ CCCallFunC家族
 cocos2d-x改底层之动态改变UIListView中的某项在链表中的位置
 汇编语言，以10进制的方式显示数字
 JVM

原文地址：https://www.cnblogs.com/haitianS/p/5170791.html

Copyright © 2011-2022 走看看