pandas DataFrame apply()函数(2)

上一篇pandas DataFrame apply()函数(1)说了如何通过apply函数对DataFrame进行转换,得到一个新的DataFrame.

这篇介绍DataFrame apply()函数的另一个用法,得到一个新的pandas Series:

apply()中的函数接收的参数为一行(列),把一行(列)通过计算,返回一个值,最后返回一个Series:

下图展示了把DataFrame的各列转换成一个数,最后返回成一个Series:

举个栗子:

import numpy as np
import pandas as pd

df = pd.DataFrame({
    'a': [4, 5, 3, 1, 2],
    'b': [20, 10, 40, 50, 30],
    'c': [25, 20, 5, 15, 10]
})


# 对整个DataFrame应用np.mean()函数,取各列的平均值,返回一个包含了各列平均值的Series  
print df.apply(np.mean)

# 结果:
a     3.0
b    30.0
c    15.0
dtype: float64

# 对整个DataFrame应用np.max()函数,取各列的最大值,返回一个包含了各列最大值的Series

print df.apply(np.max) 

# 结果: a 5 b 50 c 25 dtype: int64

如果想要返回各列中第二大的数字组成的Series:

def get_second_largest(se):
    sorted_se = se.sort_values(ascending=False)
    return sorted_se.iloc[1]
    
def second_largest(df):
    return df.apply(get_second_largest)
    
print(second_largest(df))

a     4
b    40
c    20
dtype: int64

查看全文

相关阅读:
设置maven阿里云镜像和公司私服并存
 idea favorites bookmarks标签收藏夹数据丢失bug
C#后期绑定调用COM组件
 SQL Studio 1.0：一款轻便的SQL脚本工具兼容SQL Server、MySQL、Access2007
SQL Studio 2.0: 新版发布
 SQLHelper用的不爽，试试CmdRunner吧
 Flask + uWSGI+ Linux 指南及避坑
 Flask + Pyinstaller 打包后运行报错 SystemError
Url重写之UrlRewriter
.net5 提取压缩包内指定文件内容无需解压

原文地址：https://www.cnblogs.com/liulangmao/p/9355633.html