zoukankan html css js c++ java

Spark makeRDD方法本地Task的默认分区数

注意setMaster("local")和setMaster("local[*])的分区数是不一样的。*会匹配所有的cpu核数。

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Seq_Partition_04 {
  def main(args: Array[String]): Unit = {
    val sparkConf: SparkConf = new SparkConf().setMaster("local").setAppName("Operator")
    val sc: SparkContext = new SparkContext(sparkConf)

    val rdd: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4))
    rdd.saveAsTextFile("seq_output_04")
    sc.stop()
  }
}

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Seq_Partition_05 {
  def main(args: Array[String]): Unit = {
    val sparkConf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
    val sc: SparkContext = new SparkContext(sparkConf)

    val rdd: RDD[Int] = sc.makeRDD(List(1, 2, 3, 4))
    rdd.saveAsTextFile("seq_partition_05")
    sc.stop()
  }
}

如果spark.default.parallelism没有设置，就会使用cpu的核数。

查看全文

相关阅读:
KeBugCheckEx0xD1
Ti DSP编程入门
 动态链接库
 Hello,world! x86版本
 用回调函数联系两个模块
 DataGrid模版列超级链接列传递参数问题总结（多个参数传递）
后台代码里执行弹出脚本方法！(Response.Write)
Oracle数据导入导出imp/exp
安装sql2000: 出现 A previous program installation created pending file operations on the installation machine. You must restart the computer before running setup
解决问题：　　An unhandled exception of type 'System.Exception' occurred in system.data.oracleclient.dll

原文地址：https://www.cnblogs.com/mkl34367803/p/15780731.html