zoukankan      html  css  js  c++  java
  • 利用Python进行数据分析(10) pandas基础: 处理缺失数据

     
    数据不完整在数据分析的过程中很常见。
    pandas使用浮点值NaN表示浮点和非浮点数组里的缺失数据。
    pandas使用isnull()和notnull()函数来判断缺失情况。

    对于缺失数据一般处理方法为滤掉或者填充

    滤除缺失数据
     
    对于一个Series,dropna()函数返回一个包含非空数据和索引值的Series,例如:

    对于DataFrame,dropna()函数同样会丢掉所有含有空元素的数据,例如:
     
    但是可以指定how='all',这表示只有行里的数据全部为空时才丢弃,例如:
     
    如果想以同样的方式按列丢弃,可以传入axis=1,例如:
     
     
    填充缺失数据

    如果不想丢掉缺失的数据而是想用默认值填充这些空洞,可以使用fillna()函数:
     
    如果不想只以某个标量填充,可以传入一个字典,对不同的列填充不同的值:


  • 相关阅读:
    python之递归函数
    python之内置函数
    python之迭代器与生成器
    python之装饰器函数
    python之函数进阶
    python之初识函数
    一起学Android之Dialog
    一起学Android之Menu
    一起学Android之GridView
    一起学Android之ViewPager
  • 原文地址:https://www.cnblogs.com/sirkevin/p/5767532.html
Copyright © 2011-2022 走看看