zoukankan html css js c++ java

spark zip && zipPartitions && zipWithIndex && zipWithUniqueId

zip transformation算子，将两个RDD中的元素（KV格式/非KV格式）变成一个KV格式的RDD,两个RDD的每个分区元素个数必须相同。

spark.sparkContext.setLogLevel("error")

 spark.sparkContext.setLogLevel("error")
    val kzc=spark.sparkContext.parallelize(1.to(10),2)
    val bd=spark.sparkContext.parallelize(List("a","b","c","d","e","f","g","h","i","j"),2)
    kzc.zip(bd).collect().foreach(println(_))

zipPartitions

 spark.sparkContext.setLogLevel("error")
    val kzc=spark.sparkContext.parallelize(1.to(10),2)
    val bd=spark.sparkContext.parallelize(List("a","b","c","d","e","f"),2)
    val res=kzc.zipPartitions(bd){
      (iterator1,iterator2)=>{
        val result=new scala.collection.mutable.ListBuffer[String]()
        while(iterator1.hasNext && iterator2.hasNext){
          result.append(iterator1.next()+"|"+iterator2.next())
        }
        result.iterator
      }
    }
    res.collect().foreach(println(_))

zipWithIndex 该函数将RDD中的元素和这个元素在RDD中的索引号（从0开始）组合成（K,V）对。

spark.sparkContext.setLogLevel("error")
    val kzc=spark.sparkContext.parallelize(1.to(10),2)
    val bd=spark.sparkContext.parallelize(List("a","b","c","d","e","f"),2)
    bd.zipWithIndex().collect().foreach(println(_))

查看全文

相关阅读:
phpstrom中Terminal窗口打开
 window安装reidis完成之后，想要把数据存入redis，必须开扩展，不然报错，redis windows phpstudy 安装扩展
 Windows 安装 Anaconda3+PyCharm
表单序列化+ajax跨域提交
 微信小程序无法获取到unionId(专业踩坑20年)
支付宝的同步和异步的区别
 layui多图上传
 多图上传控制器及模型代码（2）thinkphp5+layui实现多图上传保存到数据库，可以实现图片自由排序，自由删除。
【JZOJ4816】【NOIP2016提高A组五校联考4】label
【JZOJ4815】【NOIP2016提高A组五校联考4】ksum

原文地址：https://www.cnblogs.com/students/p/14262861.html