zoukankan html css js c++ java

scala语言中的case关键字在spark中的一个奇特使用

package com.spark.demo

import com.spark.demo.util.SparkUtil
import org.apache.spark.rdd.RDD

import scala.collection.mutable

/**
  * @created by imp ON 2019/2/14
  */
case class Person1(name:String,age:Int)
object CaseDemo {
  def main(args: Array[String]): Unit = {
    val appName = this.getClass.getName
    val isLocal = true
    val conf = SparkUtil.generateSparkConf(appName, isLocal, that => {
      // 这里可以单独的指定当前spark应用的相关参数
      // nothings
      that.set("", "")
    })
    // 2.3 SparkContext对象的构建
    val sc = SparkUtil.getSparkContext(conf)
    //可单独写方法判断 读取hdfs的某一天文件夹下所以文件
    val path = "data/person"
    val data: RDD[Any] = sc.textFile(path).map {
      //case替代map(line=>)的写法 不在使用._1 ._2  上一个父rdd的类型值可直接命名为变量使用
      case (line) => {
        val arr = line.split(" ")
        (arr(0), arr(1))
      }
    }
      .map(info => {
        Person1(info._1, info._2.toInt)
      })
      .map {
        //case（p）相当于 map（p=>{}）
        case (person) => {
          (person, (person.name, person.age))
        }

      }.map {
      case (person, (name, age)) => {

        val map = mutable.HashMap[String, Int]()
        map.+=(name -> age)
      }

    }
    data.foreach(println(_))


  }

}

结果如下

data.map(i=>{   })与

data.map{

case（上一个父rdd的类型值可直接命名为变量使用)=>{
//case()

}

}是一样的道理 第二个代码看起来明了，可直接知道父rdd的数据类型及结构，

查看全文

相关阅读:
kerberos
BZOJ 3309 莫比乌斯反演
 Pollard_rho定理大数的因数个数这个板子超级快
 POJ 3171 区间覆盖最小值&&线段树优化dp
拼题 L2-001 紧急救援最短路计数+记录路径
 HDU 6464 权值线段树 && HDU 6468 思维题
 HDU 1394 线段树求逆序对
 [Poi2010]Bridges 最大流+二分答案判定混合图欧拉回路
 01背包多重背包复习模板
 CF 2018 Battle of Brains GYM 102062 F

原文地址：https://www.cnblogs.com/hejunhong/p/10375006.html