zoukankan      html  css  js  c++  java
  • 关于参数thresh的理解(pd.dropna(thresh=n))

    书上的表达:假设你只想保留包含一定数量的观察值的行,可以使用thresh参数来表示。

    嗯嗯嗯....有些模棱两可。摸索了一番,终于理解了。

    格式:df.dropna ( thresh=n )

     简单的理解:这一行除去NA值,剩余数值的数量大于等于n,便显示这一行。

     


    1.先创建数组,代码如下:

     1 import numpy as np
     2 from numpy import nan as NA
     3 
     4 import pandas as pd
     5 from pandas import Series,DataFrame
     6 
     7 df = pd.DataFrame (np.random .randn(8,7))
     8 
     9 df.iloc[0,:] = NA
    10 df.iloc[1,:6] = NA
    11 df.iloc[2,:5] = NA
    12 df.iloc[3,:4] = NA
    13 df.iloc[4,:3] = NA
    14 df.iloc[5,:2] = NA
    15 df.iloc[6,0] = NA

     输出显示:(最左边一列是索引)


    2.验证:

    (1)n=1,即剔除NA值,这些行剩余的数值数量大于等于1

    df.dropna(thresh=1)

    输出显示:索引号为[0]的第1行被剔除

    (2)n=3,即剔除NA值,这些行剩余的数值数量大于等于3

    df.dropna(thresh=3)

    输出显示:索引号为[0]至[2]的前3行被剔除

    (3)n=6,即剔除NA值,这些行剩余的数值数量大于等于6

    df.dropna(thresh=6)

    输出显示:索引号为[0]至[5]的前6行被剔除

     

     

     

  • 相关阅读:
    jq的遍历与杂项
    jq的事件
    jquery的效果
    jquery入门
    面向对象。对象的继承
    面向对象克隆对象
    面向对象this指向问题
    实例对象及原型链
    GCD多线程任务总结
    C语言链表的简单实用
  • 原文地址:https://www.cnblogs.com/zeng-ymzkx/p/11468912.html
Copyright © 2011-2022 走看看