zoukankan      html  css  js  c++  java
  • 处理缺失数据

     简介

    缺失数据(missing data)在大部分数据分析应用中都很常见。pandas的设计目标之一就是让缺失数据的处理任务尽量轻松。

    例如, pandas对象上的所有描述统计都排除了缺失数据。

    pandas使用浮点值NaN(not a Number)表示浮点和非浮点数组中的缺失数据。它只是一个便于被检测出来的标记而已

    由于Numpy的数据类型体系中缺乏真正的NA数据类型或定位模式, 所以它是我能想到的最佳解决方案

    NA处理方法

     

     判断缺失数据, isnull()

    滤除缺失数据, dropna()

    布尔类型索引取值

    DataFrame

     面对DataFrame对象, 事情变得复杂了。 你可能希望丢弃全NA或含有NA的行货列。drop默认丢弃任何含有缺失值的行:

     丢弃全为NA的行:

     丢弃全为NA的列:

     

     翻滚数据

     

     填充缺失数据  fillna()  ,fillna(0, inplace=True)对现有对象修改

    fillna value调用一个字典{}作为标量值用于填补缺失值。

     

     

     

  • 相关阅读:
    HTML静态网页--JavaScript-简介
    html 表单 css样式表
    html 表格 嵌套 frameset 热点
    触发器
    存储过程 if 复习 while 学习
    变量运算符
    SQL数学函数
    SQL数据库基础
    批處理文章引用
    对Excel操作(VBA)
  • 原文地址:https://www.cnblogs.com/renfanzi/p/6434022.html
Copyright © 2011-2022 走看看