zoukankan html css js c++ java

寒假学习进度

行动算子

（1）

 def main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
    val sc = new SparkContext(sparkConf)

    val rdd = sc.makeRDD(List(1, 2, 3, 4))

    //    //两两聚合
    //    val i: Int = rdd.reduce(_+_)
    //    print(i)

//    //方法将不同分区的数据采集到driver端内存中，形成数组
//    val ints: Array[Int] = rdd.collect()
//    println(ints.mkString(","))


    //数据源中的数据个数
    val l: Long = rdd.count()
    print(l)
//
//    //数据源中的第一个
//    val i: Int = rdd.first()

//    //获取多少个数据
//    val ints: Array[Int] = rdd.take(3)
//    print(ints.mkString(","))

//    //先排序，然后在取数据
//    val ints: Array[Int] = rdd.takeOrdered(3)
//    print(ints.mkString(","))
    sc.stop()
  }

（2）

def main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
    val sc = new SparkContext(sparkConf)

    val rdd = sc.makeRDD(List(1, 2, 3, 4))

    //（初始值）（分区内规则，分区外规则）
    //aggregate的初始值会参与分区内的计算,并且参与分区间的计算
    //aggregatebykey的初始值会参与分区内的计算
//    val i: Int = rdd.aggregate(0)(_ + _, _ + _)
//    println(i)

    //fold是aggregate的简化
    val i: Int = rdd.fold(0)(_ + _)
    println(i)
    sc.stop()
  }

（3）

 def main(args: Array[String]): Unit = {
    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
    val sc = new SparkContext(sparkConf)

//    val rdd = sc.makeRDD(List(1, 2, 3, 4))
    //统计数据出现的次数
//    val intToLong: collection.Map[Int, Long] = rdd.countByValue()

//    print(intToLong)

    val rdd = sc.makeRDD(List(("a",1),("a",2),("a",3)))

    val stringToLong: collection.Map[String, Long] = rdd.countByKey()
    print(stringToLong)
    sc.stop()
  }

（4）

//groupby:
def wordcount1(sc:SparkContext)={

  val fileRDD: RDD[String] = sc.textFile("D:\\qq text\\1791028291\\FileRecv\\《飘》英文版.txt")
  // 将文件中的数据进行分词
  val wordRDD: RDD[String] = fileRDD.flatMap( _.split(" ") )
  val group: RDD[(String, Iterable[String])] = wordRDD.groupBy(word => word)
  val wordcount: RDD[(String, Int)] = group.mapValues(iter => iter.size)

  wordcount.collect().foreach(println)
}

//reduceByKey
def wordcount2(sc:SparkContext)={

  val fileRDD: RDD[String] = sc.textFile("D:\\qq text\\1791028291\\FileRecv\\《飘》英文版.txt")
  // 将文件中的数据进行分词
  val wordRDD: RDD[String] = fileRDD.flatMap( _.split(" ") )
  val wordmap: RDD[(String, Int)] = wordRDD.map((_, 1))
  val group: RDD[(String, Int)] = wordmap.reduceByKey(_ + _)

  group.collect().foreach(println)
}

查看全文

相关阅读:
指针的引用
 引用的基础知识
 const的基础用法
 解决'fopen':this function or variable may be unsafe先关问题的方法
 C++类中不写成员函数易犯错模型
 PCB接地设计宝典：ADI资深专家总结的良好接地指导原则
 电路板级的电磁兼容性设计
 自然对流仿真设置
 Pspice 原理图以及仿真图输出到 word
信号完整性常见问题

原文地址：https://www.cnblogs.com/chenghaixiang/p/15786423.html