zoukankan      html  css  js  c++  java
  • DataFrame在任意处添加一列或者多列的方法

    很多时候我们需要在任意处添加一列,而非末尾添加一列,下面就介绍一下几种方法

    1.df.insert但是这个允许插入一列

    DataFrame.insert(loc,column,value,allow_duplicates = False)

    参数

    loc: int,插入索引。必须验证0 <= loc <= len(columns)

    column:str, number, or hashable object,插入列的标签

    value:int, Series, or array-like

    allow_duplicates:bool, 可选

    前面三个是必选,后面的可选

    值得注意的是,如果你不知道value的值,可以使用np.nan代替,后续再赋值

    data = pd.DataFrame(columns=['a','b'], data=[[1,2],[3,4]])
    data.insert(2,'c',value=np.nan)
    '''
       a  b   c
    0  1  2 NaN
    1  3  4 NaN
    '''

    2.pd.concat,df.reindex和list.insert(index, obj)配合,可以在任意处插入一列或者多列

    首先,如果要在df的后面添加一列,只需要data['c']=xx,但是如果你想一次性添加两列级以上,df[['D','E']] == None ,结果报错

    所以接下来我想介绍这种认为比较简便的方法:

    利用pd.concat 在DataFrame后面添加两列,这种方法的缺点是不能指定位置

    pd.concat([df, pd.DataFrame(columns=list('DE'))]),然后利用 reindex来重排和增加列名df.reindex(columns=list('ABCDE')),

    当然这里举的例子比较简单,在实际运用中,列名可能都比较长,都敲出来肯定不方便,所以我们需要更强大的方法,运用到 list.insert的方法list.insert(index, obj)

    col_name = df.columns.tolist()
    col_name.insert(1,'D')
    df.reindex(columns=col_name)
    #或者不用数字索引,直接在某列前面或后面插入,利用 list.index的方法
    col_name = df.columns.tolist()
    col_name.insert(col_name.index('B'),'D')# 在 B 列前面插入
    df.reindex(columns=col_name)
    col_name = df.columns.tolist()
    col_name.insert(col_name.index('B')+1,'D') # 在 B 列后面插入
    df.reindex(columns=col_name)

    这样子就基本能满足所有要求了

  • 相关阅读:
    WEB开发者必备的7个JavaScript函数
    json分别算出元素的个数和最多的元素
    jquery 对 Json 的各种遍历
    判断图片是否加载完成
    obj转换成数组
    用JavaScript获取页面上被选中的文字的技巧
    PAT 1088 三人行(20 分)(暴力破解+流程分析)
    PAT 1087 有多少不同的值(20)(STL-set代码)
    PAT 1086 就不告诉你(15 )(代码)
    PAT 1087 有多少不同的值(20)(STL—set)
  • 原文地址:https://www.cnblogs.com/cgmcoding/p/13930464.html
Copyright © 2011-2022 走看看