转自:https://blog.csdn.net/anshuai_aw1/article/details/82347016
1.Apply
Python中apply函数的格式为:apply(func,*args,**kwargs)
当然,func可以是匿名函数。
用途:当一个函数的参数存在于一个元组或者一个字典中时,用来间接的调用这个函数,并将元组或者字典中的参数按照顺序传递给参数
解析:args是一个包含按照函数所需参数传递的位置参数的一个元组,简单来说,假如A函数的函数位置为 A(a=1,b=2),那么这个元组中就必须严格按照这个参数的位置顺序进行传递(a=3,b=4),而不能是(b=4,a=3)这样的顺序。kwargs是一个包含关键字参数的字典,而其中args如果不传递,kwargs需要传递,则必须在args的位置留空。
apply的返回值就是函数func函数的返回值。
//也就是说,第一个参数是一个函数,第二个参数是该函数的参数列表即传入的实参,第三个是一个字典,在第二个参数没有的情况下,第三个要对应参数列表标出来。
例子:
def function(a,b): print(a,b) apply(function,('good','better')) apply(function,(2,3+6)) apply(function,('cai','quan')) apply(function,('cai',),{'b':'caiquan'}) apply(function,(),{'a':'caiquan','b':'Tom'})
结果:
('good', 'better') (2, 9) ('cai', 'quan') ('cai', 'caiquan') ('caiquan', 'Tom')
有时候,函数的参数可能是DataFrame中的行或者列。
2.DataFrame中的apply用法
#函数应用和映射 import numpy as np import pandas as pd df=pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['utah','ohio','texas','oregon']) print(df) """ b d e utah -0.667969 1.974801 0.738890 ohio -0.896774 -0.790914 0.474183 texas 0.043476 0.890176 -0.662676 oregon 0.701109 -2.238288 -0.154442 """ #将函数应用到由各列或行形成的一维数组上。DataFrame的apply方法可以实现此功能 f=lambda x:x.max()-x.min() #默认情况下会以列为单位,分别对列应用函数 t1=df.apply(f) print(t1) t2=df.apply(f,axis=1) print(t2) """ b 1.597883 d 4.213089 e 1.401566 dtype: float64 utah 2.642770 ohio 1.370957 texas 1.552852 oregon 2.939397 dtype: float64 """ #除标量外,传递给apply的函数还可以返回由多个值组成的Series def f(x): return pd.Series([x.min(),x.max()],index=['min','max']) t3=df.apply(f) #从运行的结果可以看出,按列调用的顺序,调用函数运行的结果在右边依次追加 print(t3) """ b d e min -0.896774 -2.238288 -0.662676 max 0.701109 1.974801 0.738890 """ #元素级的python函数,将函数应用到每一个元素 #将DataFrame中的各个浮点值保留两位小数 f=lambda x: '%.2f'%x t3=df.applymap(f) print(t3) """ b d e utah -0.67 1.97 0.74 ohio -0.90 -0.79 0.47 texas 0.04 0.89 -0.66 oregon 0.70 -2.24 -0.15 """ #注意,之所以这里用map,是因为Series有一个元素级函数的map方法。而dataframe只有applymap。 t4=df['e'].map(f) print(t4) """ utah 0.74 ohio 0.47 texas -0.66 oregon -0.15 """
//学习了,要多练习。