zoukankan      html  css  js  c++  java
  • 利用Python进行数据分析_Pandas_处理缺失数据

    申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。

     1 读取excel数据

    import pandas as pd
    import numpy as np
    file = 'D:example.xls'
    df = pd.DataFrame(pd.read_excel(file))
    df

    2 检测缺失值

    2.1 isnull返回一个含有布尔值的对象

    import pandas as pd
    import numpy as np
    file = 'D:example.xls'
    df = pd.DataFrame(pd.read_excel(file))
    df = df.isnull()
    df

    2.2 notnull  是isnull 的否定式

    import pandas as pd
    import numpy as np
    file = 'D:example.xls'
    df = pd.DataFrame(pd.read_excel(file))
    df = df.notnull()
    df

    3 滤除缺失数据

    3.1 滤除所有包含缺失值的行

    df.dropna()

    3.2 查看不含缺失值的所有行、列

    df.dropna(thresh=4)

    4 填充缺失数据

    DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

    4.1 统一填充某一个值value

    df.fillna(0)或df.fillna(value=0)

    4.2 用前面的值填充缺失部分

    df.fillna(method='ffill')

    4.3 用后面的值填充缺失部分

    df.fillna(method='bfill')

    4.3 某N列用特定的值填充缺失部分

    df.fillna({'起息日':'2018-12-11','评级得分':'100'})

    4.4 指定一整个轴的值填充缺失部分

    df.fillna(method='ffill',axis=1)

  • 相关阅读:
    Git官方推荐用书
    二叉树-补习
    POJ 2251 Dungeon Master(三维BFS)
    Codeforces 675C Money Transfers (思维题)
    HDU 1195 Open the Lock(BFS)
    HDU 1010 Tempter of the Bone(DFS+剪枝)
    POJ 1426 Find The Multiple(DFS,BFS)
    POJ 3216 Prime Path (BFS)
    POJ 3278 Catch that cow(BFS)
    UVa 572 Oil Deposits(简单DFS)
  • 原文地址:https://www.cnblogs.com/zhouwp/p/10022741.html
Copyright © 2011-2022 走看看