zoukankan      html  css  js  c++  java
  • 【原创】数据处理中判断空值的方法(np.isnan、is np.nan和pd.isna)比较

     

    1、np.isnan(只有数组数值运算时可使用)
    注意:numpy模块的isnan方法仅支持对数值进行判断,因此传入的如果是字符串类型会报错
     
    2、is np.nan(不建议使用)
    如果我们的空值只会出现由numpy模块的nan,或只想判断由numpy模块生成的nan值,可以使用,但其他场合一律不建议使用
    注意:因为math模块同样可以产生nan值,且math.nan由is np.nan判断是False,例如下面代码
     
     1 a = math.nan
     2 b = np.nan
     3  
     4 a is b
     5 Out[19]: False
     6  
     7 np.isnan(a)
     8 Out[20]: True
     9 np.isnan(b)
    10 Out[21]: True
    11  
    12 a is np.nan
    13 Out[22]: False
    14 b is np.nan
    15 Out[23]: True
    3、pd.isna(大部分数据处理的场合推荐使用)
    如果我们的空值既会出现np.nan,也会出现math.nan,甚至还会出现None,或者要判断的数据值既可能是数值型也可能是字符串(符合大部分场景的实际情况),墙裂推荐使用pd.isna,例如下面代码
     
     1 pd.isna(np.nan)
     2 Out[29]: True
     3 pd.isna(math.nan)
     4 Out[30]: True
     5 pd.isna(None)
     6 Out[31]: True
     7 pd.isna('a')
     8 Out[32]: False
     9 pd.isna(10)
    10 Out[33]: False
  • 相关阅读:
    Hive中将文件加载到数据库表失败解决办法
    Hive安装及配置
    Hadoop下MapReduce实现Pi值的计算
    CentOS下Hadoop运行环境搭建
    kettle案例实现
    假期周总结报告03
    假期周总结报告02
    假期周进度报告01
    阅读笔记6
    阅读笔记5
  • 原文地址:https://www.cnblogs.com/oceanicstar/p/10869725.html
Copyright © 2011-2022 走看看