zoukankan html css js c++ java

spark的runJob方法

    //保存的路径
    val basePath = "/tmp/kuan2"

    //设置日志级别
    //    Example.setStreamingLogLevels()
    //创建sparkConf
    val sparkConf = new SparkConf().setAppName("runJob")
    //设置master,此处设置本地执行
    sparkConf.setMaster("local[*]")
    //创建SparkContext
    val sc = new SparkContext(sparkConf)

    //创建3个分区的RDD
    val rdd = sc.makeRDD(List("a", "b", "c", "d", "e", "f", "g", "宽"), 3).map(_ * 10)


    //在每个executor上执行的函数
    //此处定义的是,针对每个分区,我们把计算好的结果写入到本地目录中
    val func = (tc: TaskContext, it: Iterator[String]) => {
      //根据partitionID,创建待生成的文件名
      val out = new PrintWriter(s"${basePath}/${tc.partitionId()}", "UTF-8")
      try {
        while (it.hasNext) {
          out.println(it.next())
        }
      } finally {
        out.close()
      }
      //此处单机测试,所有的输出本机文件,如果分布式运行,那么输出文件还是放到hdfs吧
      //测试输出
      s"I Am Partition ${tc.partitionId()}"
    }

    //开始执行函数
    val res = sc.runJob(rdd, func)
    //输出各个partition的执行结果.如果返回结果比较小,直接返回到driver
    res.foreach(println)
  }

查看全文

相关阅读:
VS Code中Vetur与prettier、ESLint联合使用
 export 和 export default 的区别，exports 与 module.exports的区别
 css clearfix实现
 通过表单自动提交，实现页面转发
 .net webapi后台返回pdf文件流，前端ajax请求下载，空白pdf排错经历
 MS Sql Service 记一次in查询的优化
 MS SQL Service 查看执行计划
 ContOS7挂载硬盘
 centos命令行连接redis服务器
 如何造轮子

原文地址：https://www.cnblogs.com/luckuan/p/5250258.html