RDD的依赖关系 - 走看看

zoukankan html css js c++ java

RDD的依赖关系

scala> val personRDD=sc.textFile("/tmp/person.txt")
personRDD: org.apache.spark.rdd.RDD[String] = /tmp/person.txt MapPartitionsRDD[39] at textFile at <console>:25

scala> val ageRDD=personRDD.map(x=>{val arr=x.split(",");(arr(2),1)})
ageRDD: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[41] at map at <console>:27

scala> val grouprdd=ageRDD.groupByKey()
grouprdd: org.apache.spark.rdd.RDD[(String, Iterable[Int])] = ShuffledRDD[40] at groupByKey at <console>:29

scala> grouprdd.dependencies.foreach(dep=>{println(dep.getClass);println(dep.rdd);println(dep.rdd.partitions);println(dep.rdd.partitions.size)})
class org.apache.spark.ShuffleDependency
MapPartitionsRDD[34] at map at <console>:27
[Lorg.apache.spark.Partition;@2e33dd0d
2

scala> personRDD.dependencies.foreach(dep=>{println(dep.getClass);println(dep.rdd);println(dep.rdd.partitions);println(dep.rdd.partitions.size)})
class org.apache.spark.OneToOneDependency
/tmp/person.txt HadoopRDD[38] at textFile at <console>:25
[Lorg.apache.spark.Partition;@5b0f052f
2

scala> ageRDD.dependencies.foreach(dep=>{println(dep.getClass);println(dep.rdd);println(dep.rdd.partitions);println(dep.rdd.partitions.size)})
class org.apache.spark.OneToOneDependency
/tmp/person.txt MapPartitionsRDD[39] at textFile at <console>:25
[Lorg.apache.spark.Partition;@5b0f052f
2

查看全文

相关阅读:
今天的温度还是有点高.....
[React] 点击---图片90°旋转
 javascript onclick事件可以调用两个方法吗？
vue 页面回退mounted函数不执行的问题及解决方法
 vue static和assets的区别
 js实现复制|剪切指定内容到粘贴板--clipboard
纯前端html导出pdf--分页+不分页--html2canvas+jsPDF
git常用命令行
 浅谈“观察者模式”那点小事儿
 [Linq] ORM

原文地址：https://www.cnblogs.com/playforever/p/9450010.html

Copyright © 2011-2022 走看看