zoukankan      html  css  js  c++  java
  • 解决spark dataframe get 报空指针异常 java.lang.NullPointerException

    Spark 编程读取hive,hbase, 文本等外部数据生成dataframe后,一般我们都会map遍历get数据的每个字段,此时如果原始数据为null时,如果不进行判断直接转化为string,就会报空指针异常 java.lang.NullPointerException
    示例代码如下:

        val data = spark.sql(sql)
    
        val rdd = data.rdd.map(record => {
          val recordSize = record.size
          for(i <- 0 to (recordSize-1)){
            val str = record.get(i).toString
            do something...
          }
    

    为了解决该问题,可以对代码添加判空逻辑,如下所示:

        val data = spark.sql(sql)
    
        val rdd = data.rdd.map(record => {
          val recordSize = record.size
          for(i <- 0 to (recordSize-1)){
            val str = record.get(i)
            if(!record.isNullAt(i) && !str.toString.isEmpty){
             do something...
            }
          }
    

    record.isNullAt(i) 判断第i个字段取值是否为null
    不为null的话,再用isEmpty判断是否为空

  • 相关阅读:
    mangoDB
    python文档
    单例模式
    celery
    flask 部署
    json
    Docker+Jenkins+Go完成自动化部署
    Go多协程循环打印ABAC
    正则表达式
    从零开始学Go之并发(四):互斥
  • 原文地址:https://www.cnblogs.com/xiaodf/p/11558883.html
Copyright © 2011-2022 走看看