day29-RDD 转换算子(6) - 走看看

zoukankan html css js c++ java

day29-RDD 转换算子(6)
repartition

该操作内部其实执行的是 coalesce 操作，参数 shuffle 的默认值为 true。无论是将分区数多的
RDD 转换为分区数少的 RDD，还是将分区数少的 RDD 转换为分区数多的 RDD，repartition
操作都可以完成，因为无论如何都会经 shuffle 过程。
```
val dataRDD = sparkContext.makeRDD(List(
 1,2,3,4,1,2
),2)
val dataRDD1 = dataRDD.repartition(4)
```
sortBy

该操作用于排序数据。在排序之前，可以将数据通过 f 函数进行处理，之后按照 f 函数处理
的结果进行排序，默认为升序排列。排序后新产生的 RDD 的分区数与原 RDD 的分区数一
致。中间存在 shuffle 的过程
```
val dataRDD = sparkContext.makeRDD(List(
 1,2,3,4,1,2
),2)
val dataRDD1 = dataRDD.sortBy(num=>num, false, 4)
```
查看全文

相关阅读:
Luogu P2016 战略游戏（树形DP）
Luogu P2486 染色（树链剖分+线段树）
Luogu P3178 树上操作（树链剖分+线段树）
Luogu P2590 树的统计（树链剖分+线段树）
Luogu P2146 软件包管理器（树链剖分+线段树）
获得spring
网卡绑定多个ip
描述01-配置文件咋整
 进程查看
 端口查看，进程杀死

原文地址：https://www.cnblogs.com/wuren-best/p/14464390.html

Copyright © 2011-2022 走看看