zoukankan      html  css  js  c++  java
  • Python中apply用法学习【转载】

    转自:https://blog.csdn.net/anshuai_aw1/article/details/82347016

    1.Apply

    Python中apply函数的格式为:apply(func,*args,**kwargs)

    当然,func可以是匿名函数。

    用途:当一个函数的参数存在于一个元组或者一个字典中时,用来间接的调用这个函数,并将元组或者字典中的参数按照顺序传递给参数

    解析:args是一个包含按照函数所需参数传递的位置参数的一个元组,简单来说,假如A函数的函数位置为 A(a=1,b=2),那么这个元组中就必须严格按照这个参数的位置顺序进行传递(a=3,b=4),而不能是(b=4,a=3)这样的顺序。kwargs是一个包含关键字参数的字典,而其中args如果不传递,kwargs需要传递,则必须在args的位置留空。

    apply的返回值就是函数func函数的返回值。

    //也就是说,第一个参数是一个函数,第二个参数是该函数的参数列表即传入的实参,第三个是一个字典,在第二个参数没有的情况下,第三个要对应参数列表标出来。

    例子:

       def function(a,b):  
            print(a,b)  
        apply(function,('good','better'))  
        apply(function,(2,3+6))  
        apply(function,('cai','quan'))  
        apply(function,('cai',),{'b':'caiquan'})  
        apply(function,(),{'a':'caiquan','b':'Tom'})  

    结果:

    ('good', 'better')
    (2, 9)
    ('cai', 'quan')
    ('cai', 'caiquan')
    ('caiquan', 'Tom')

    有时候,函数的参数可能是DataFrame中的行或者列。

    2.DataFrame中的apply用法

    #函数应用和映射
    import numpy as np
    import pandas as pd
    df=pd.DataFrame(np.random.randn(4,3),columns=list('bde'),index=['utah','ohio','texas','oregon'])
    print(df)
    """
                   b         d         e
    utah   -0.667969  1.974801  0.738890
    ohio   -0.896774 -0.790914  0.474183
    texas   0.043476  0.890176 -0.662676
    oregon  0.701109 -2.238288 -0.154442
    """
     
    #将函数应用到由各列或行形成的一维数组上。DataFrame的apply方法可以实现此功能
    f=lambda x:x.max()-x.min()
    #默认情况下会以列为单位,分别对列应用函数
    t1=df.apply(f)
    print(t1)
    t2=df.apply(f,axis=1)
    print(t2)
     
    """
    b    1.597883
    d    4.213089
    e    1.401566
    dtype: float64
    utah      2.642770
    ohio      1.370957
    texas     1.552852
    oregon    2.939397
    dtype: float64
    """
     
    #除标量外,传递给apply的函数还可以返回由多个值组成的Series
    def f(x):
        return pd.Series([x.min(),x.max()],index=['min','max'])
    t3=df.apply(f)
    #从运行的结果可以看出,按列调用的顺序,调用函数运行的结果在右边依次追加
    print(t3)
     
    """
                b         d         e
    min -0.896774 -2.238288 -0.662676
    max  0.701109  1.974801  0.738890
    """
     
    #元素级的python函数,将函数应用到每一个元素
    #将DataFrame中的各个浮点值保留两位小数
    f=lambda x: '%.2f'%x
    t3=df.applymap(f)
    print(t3)
    """
                b      d      e
    utah    -0.67   1.97   0.74
    ohio    -0.90  -0.79   0.47
    texas    0.04   0.89  -0.66
    oregon   0.70  -2.24  -0.15
    """
     
    #注意,之所以这里用map,是因为Series有一个元素级函数的map方法。而dataframe只有applymap。
    t4=df['e'].map(f)
    print(t4)
     
    """
    utah     0.74
    ohio     0.47
    texas   -0.66
    oregon  -0.15
    """

    //学习了,要多练习。

  • 相关阅读:
    HackingLab-再加密一次你就得到key啦~
    操作系统理论细节 2
    操作系统理论细节 1
    各种调度算法均衡利弊
    Github实现代码高亮
    Oracle 生成一张测试表并插入随机的个人基本信息数据
    一,Spring Boot 入门
    关于IDEA2020年1月新版MAVEN无法自动导入依赖
    操作系统存储管理--虚拟内存地址和物理内存地址
    apache2.4 tomcat 出现502 Proxy Error错误
  • 原文地址:https://www.cnblogs.com/BlueBlueSea/p/10256114.html
Copyright © 2011-2022 走看看