Spark 获取指定分区内的数据 - 走看看

zoukankan html css js c++ java

Spark 获取指定分区内的数据
K:有什么用? 内存不足可以用.

1.上代码

我是1-10分为3个分区 , 并取出下标号为0 的分区的数据 ,然后Type ,要想获得自己想要的分区 , 执行

这里返回的是新 RDD , 并且支持 map等操作 , 但是你只能操作一个分区了 . 在某些内存不够用的情况下 , 可以采用这种分阶段操作的方法.

(题外话 , 我们都知道Spark是惰性加载 , 所以这里如果是生产环境理应存在shuffer).
.mapPartitionsWithIndex { (index, iter) => if (index == 0) { iter } else { Iterator.empty } }
查看全文

相关阅读:
求斐波那契数列的第n项
 八大经典排序算法
 [BZOJ 3083] 遥远的国度
 [BZOJ 3306] 树
 [SCOI 2010] 序列操作
 [AHOI 2013] 差异
 [USACO2006 DEC] Milk Patterns
[JSOI 2007] 字符加密
 [BZOJ 2588] Count on a tree
[NOIP 2018 Day1] 简要题解

原文地址：https://www.cnblogs.com/alpha-cat/p/12939638.html

Copyright © 2011-2022 走看看