zoukankan      html  css  js  c++  java
  • python dataframe rename_详解pandas DataFrame修改行列名

    在做WISE数据处理时,有时候需要将几组数据生成一个DataFrame,然而在生成的过程中我一般不会设置列的名字(因为这种过程可能会有很多步),所以最后的列名是默认的。为了方便自己以后读代码,还是希望最后已处理好的数据有相应的数据相关列名。

    自己在网上也查了了一些人的解决办法,感觉没有一个能讲明白,现将自己的理解总结如下。

    方法1:修改DataFrame的columns或index属性值

    DataFrame属性链接:DataFrame。现在我们知道,对于每一个DataFrame都有index和columns两个属性,这两个属性给出了Dataframe的

    math?formula=%5Ccolor%7Bred%7D%7B%E7%B4%A2%E5%BC%95%7D和

    math?formula=%5Ccolor%7Bred%7D%7B%E5%88%97%7D的信息。所以我们可以对DataFrame的index或columns属性信息重新赋值,以达到对行或者列重新命名。

    math?formula=%5Ccolor%7Bred%7D%7B%E6%B3%A8%7D:这种方法是一次性将所有的行 or 列重新命名,不能仅对单个或几个行 or 列重新命名,因为DataFrame的index或columns属性值是不可更改的(即:可以将index属性值整体赋值,但不能对单个或者几个赋值)。

    import numpy as np

    import pandas as pd

    df = pd.DataFrame({undefined

    'col1':['a','a','b',np.nan,'c'],

    'col2':[2, 1, 8, 7, 6],

    'col3':[0, 4, 7, 2, 3],

    })

    df

    col1 col2 col3

    0 a 2 0

    1 a 1 4

    2 b 8 7

    3 NaN 7 2

    4 c 6 3

    #修改行标签

    df.columns

    Index(['col1', 'col2', 'col3'], dtype='object')

    df.columns = ['a','b','c']

    df

    a b c

    0 a 2 0

    1 a 1 4

    2 b 8 7

    3 NaN 7 2

    4 c 6 3

    #修改列标签

    df.index = ['a0','a1','a2','a3','a4']

    df

    col1 col2 col3

    a0 a 2 0

    a1 a 1 4

    a2 b 8 7

    a3 NaN 7 2

    a4 c 6 3

    方法2:pandas.DataFrame.rename()函数

    rename函数是专门为了修改DataFrame坐标轴标签函数。rename函数的优点:可以

    math?formula=%5Ccolor%7Bred%7D%7B%E9%80%89%E6%8B%A9%E6%80%A7%E7%9A%84%E4%BF%AE%E6%94%B9%7D某行某列的标签。

    math?formula=%5Ccolor%7Bred%7D%7B%E6%B3%A8%7D:函数/字典中的值必须是唯一的(1对1)。 未包含在字典/Series中的标签将保留原样。 列出的额外标签不会引发错误。

    DataFrame.rename(self, mapper=None, index=None, columns=None, axis=None, copy=True, inplace=False, level=None, errors='ignore')

    参数介绍:

    参数

    含义

    mapper

    映射结构,修改columns或index要传入一个映射体,可以是字典、函数。修改列标签跟columns参数一起;修改行标签跟index参数一起。

    index

    行标签参数,mapper, axis=0 等价于 index=mapper

    columns

    列标签参数,mapper, axis=1 等价于 columns=mapper

    axis

    轴标签格式,0代表index,1代表columns,默认index

    copy

    默认为True,赋值轴标签后面的数据

    inplace

    默认为False,不在原处修改数据,返回一个新的DataFrame

    level

    默认为None,处理单个轴标签(有的数据会有2个或多个index或columns)

    errors

    默认ignore,如果映射体里面包含DataFrame没有的轴标签,忽略不报错

    例子:

    df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})

    df.rename(columns={"A": "a", "B": "c"})

    a c

    0 1 4

    1 2 5

    2 3 6

    df.rename(index={0: "x", 1: "y", 2: "z"})

    A B

    x 1 4

    y 2 5

    z 3 6

    df.rename(str.lower, axis='columns')

    a b

    0 1 4

    1 2 5

    2 3 6

    df.rename({1: 2, 2: 4}, axis='index')

    A B

    0 1 4

    2 2 5

    4 3 6

  • 相关阅读:
    spi详解
    spi协议
    C语言break,return
    通信协议
    传输层
    网络层
    数据链路层
    物理层
    无线通信
    cpu设计过程
  • 原文地址:https://www.cnblogs.com/interdrp/p/15728437.html
Copyright © 2011-2022 走看看