zoukankan      html  css  js  c++  java
  • 10-简约不简单的匿名函数

    匿名函数基础

    首先,什么是匿名函数呢?以下是匿名函数的格式:

    lambda argument1, argument2,... argumentN : expression
    

    我们可以看到,匿名函数的关键字是lambda,之后是一系列的参数,然后用冒号隔开,最后则是由这些参数组成的表达式。我们通过几个例子看一下它的用法:

    square = lambda x: x**2
    square(3)
    
    9
    

    这里的匿名函数只输入一个参数x,输出则是输入x的平方。因此当输入是3时,输出便是9。如果把这个匿名函数写成常规函数的形式,则是下面这样:

    def square(x):
        return x**2
    square(3)
     
    9
    

    可以看到,匿名函数lambda和常规函数一样,返回的都是一个函数对象(function object),它们的用法也极其相似,不过还是有下面几点区别。

    第一,lambda是一个表达式(expression),并不是一个语句(statement)

    • 所谓的表达式,就是用一系列“公式”去表达一个东西,比如x + 2x**2等等;

    • 而所谓的语句,则一定是完成了某些功能,比如赋值语句x = 1完成了赋值,print语句print(x)完成了打印,条件语句 if x < 0:完成了选择功能等等。

    因此,lambda可以用在一些常规函数def不能用的地方,比如,lambda可以用在列表内部,而常规函数却不能:

    [(lambda x: x*x)(x) for x in range(10)]
    # 输出
    [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
    

    再比如,lambda可以被用作某些函数的参数,而常规函数def也不能:

    l = [(1, 20), (3, 0), (9, 10), (2, -1)]
    l.sort(key=lambda x: x[1]) # 按列表中元祖的第二个元素排序
    print(l)
    # 输出
    [(2, -1), (3, 0), (9, 10), (1, 20)]
    

    常规函数def必须通过其函数名被调用,因此必须首先被定义。但是作为一个表达式的lambda,返回的函数对象就不需要名字了。

    第二,lambda的主体是只有一行的简单表达式,并不能扩展成一个多行的代码块。

    这其实是出于设计的考虑。Python之所以发明lambda,就是为了让它和常规函数各司其职:lambda专注于简单的任务,而常规函数则负责更复杂的多行逻辑。关于这点,Python之父Guido van Rossum曾发了一篇文章解释,你有兴趣的话可以自己阅读。

    为什么要使用匿名函数?

    理论上来说,Python中有匿名函数的地方,都可以被替换成等价的其他表达形式。一个Python程序是可以不用任何匿名函数的。不过,在一些情况下,使用匿名函数lambda,可以帮助我们大大简化代码的复杂度,提高代码的可读性。

    通常,我们用函数的目的无非是这么几点:

    1. 减少代码的重复性;

    2. 模块化代码。

    对于第一点,如果你的程序在不同地方包含了相同的代码,那么我们就会把这部分相同的代码写成一个函数,并为它取一个名字,方便在相对应的不同地方调用。

    对于第二点,如果你的一块儿代码是为了实现一个功能,但内容非常多,写在一起降低了代码的可读性,那么通常我们也会把这部分代码单独写成一个函数,然后加以调用。

    不过,再试想一下这样的情况。你需要一个函数,但它非常简短,只需要一行就能完成;同时它在程序中只被调用一次而已。那么请问,你还需要像常规函数一样,给它一个定义和名字吗?

    答案当然是否定的。这种情况下,函数就可以是匿名的,你只需要在适当的地方定义并使用,就能让匿名函数发挥作用了。

    举个例子,如果你想对一个列表中的所有元素做平方操作,而这个操作在你的程序中只需要进行一次,用lambda函数可以表示成下面这样:

    squared = map(lambda x: x**2, [1, 2, 3, 4, 5])
    

    如果用常规函数,则表示为这几行代码:

    def square(x):
        return x**2
    
    squared = map(square, [1, 2, 3, 4, 5])
    

    这里我简单解释一下。函数map(function, iterable)的第一个参数是函数对象,第二个参数是一个可以遍历的集合,它表示对iterable的每一个元素,都运用function这个函数。两者一对比,我们很明显地发现,lambda函数让代码更加简洁明了。

    再举一个例子,在Python的Tkinter GUI应用中,我们想实现这样一个简单的功能:创建显示一个按钮,每当用户点击时,就打印出一段文字。如果使用lambda函数可以表示成下面这样:

    from tkinter import Button, mainloop
    button = Button(
        text='This is a button',
        command=lambda: print('being pressed')) # 点击时调用lambda函数
    button.pack()
    mainloop()
    

    而如果我们用常规函数def,那么需要写更多的代码:

    from tkinter import Button, mainloop
    
    def print_message():
        print('being pressed')
    
    button = Button(
        text='This is a button',
        command=print_message) # 点击时调用lambda函数
    button.pack()
    mainloop()
    

    显然,运用匿名函数的代码简洁很多,也更加符合Python的编程习惯。

    Python函数式编程

    最后,我们一起来看一下,Python的函数式编程特性,这与我们今天所讲的匿名函数lambda,有着密切的联系。

    所谓函数式编程,是指代码中每一块都是不可变的(immutable),都由纯函数(pure function)的形式组成。这里的纯函数,是指函数本身相互独立、互不影响,对于相同的输入,总会有相同的输出,没有任何副作用。

    举个很简单的例子,比如对于一个列表,我想让列表中的元素值都变为原来的两倍,我们可以写成下面的形式:

    def multiply_2(l):
        for index in range(0, len(l)):
            l[index] *= 2
        return l
    

    这段代码就不是一个纯函数的形式,因为列表中元素的值被改变了,如果我多次调用multiply_2()这个函数,那么每次得到的结果都不一样。要想让它成为一个纯函数的形式,就得写成下面这种形式,重新创建一个新的列表并返回。

    def multiply_2_pure(l):
        new_list = []
        for item in l:
            new_list.append(item * 2)
        return new_list
    

    函数式编程的优点,主要在于其纯函数和不可变的特性使程序更加健壮,易于调试(debug)和测试;缺点主要在于限制多,难写。当然,Python不同于一些语言(比如Scala),它并不是一门函数式编程语言,不过,Python也提供了一些函数式编程的特性,值得我们了解和学习。

    Python主要提供了这么几个函数:map()、filter()和reduce(),通常结合匿名函数lambda一起使用。这些都是你需要掌握的东西,接下来我逐一介绍。

    首先是map(function, iterable)函数,前面的例子提到过,它表示,对iterable中的每个元素,都运用function这个函数,最后返回一个新的可遍历的集合。比如刚才列表的例子,要对列表中的每个元素乘以2,那么用map就可以表示为下面这样:

    l = [1, 2, 3, 4, 5]
    new_list = map(lambda x: x * 2, l) # [2, 4, 6, 8, 10]
    

    我们可以以map()函数为例,看一下Python提供的函数式编程接口的性能。还是同样的列表例子,它还可以用for循环和list comprehension(目前没有统一中文叫法,你也可以直译为列表理解等)实现,我们来比较一下它们的速度:

    python3 -mtimeit -s'xs=range(1000000)' 'map(lambda x: x*2, xs)'
    2000000 loops, best of 5: 171 nsec per loop
    
    python3 -mtimeit -s'xs=range(1000000)' '[x * 2 for x in xs]'
    5 loops, best of 5: 62.9 msec per loop
    
    python3 -mtimeit -s'xs=range(1000000)' 'l = []' 'for i in xs: l.append(i * 2)'
    5 loops, best of 5: 92.7 msec per loop
    

    你可以看到,map()是最快的。因为map()函数直接由C语言写的,运行时不需要通过Python解释器间接调用,并且内部做了诸多优化,所以运行速度最快。

    接下来来看filter(function, iterable)函数,它和map函数类似,function同样表示一个函数对象。filter()函数表示对iterable中的每个元素,都使用function判断,并返回True或者False,最后将返回True的元素组成一个新的可遍历的集合。

    举个例子,比如我要返回一个列表中的所有偶数,可以写成下面这样:

    l = [1, 2, 3, 4, 5]
    new_list = filter(lambda x: x % 2 == 0, l) # [2, 4]
    

    最后我们来看reduce(function, iterable)函数,它通常用来对一个集合做一些累积操作。

    function同样是一个函数对象,规定它有两个参数,表示对iterable中的每个元素以及上一次调用后的结果,运用function进行计算,所以最后返回的是一个单独的数值。

    举个例子,我想要计算某个列表元素的乘积,就可以用reduce()函数来表示:

    l = [1, 2, 3, 4, 5]
    product = reduce(lambda x, y: x * y, l) # 1*2*3*4*5 = 120
    

    当然,类似的,filter()和reduce()的功能,也可以用for循环或者list comprehension来实现。

    通常来说,在我们想对集合中的元素进行一些操作时,如果操作非常简单,比如相加、累积这种,那么我们优先考虑map()、filter()、reduce()这类或者list comprehension的形式。至于这两种方式的选择:

    • 在数据量非常多的情况下,比如机器学习的应用,那我们一般更倾向于函数式编程的表示,因为效率更高;

    • 在数据量不多的情况下,并且你想要程序更加Pythonic的话,那么list comprehension也不失为一个好选择。

    不过,如果你要对集合中的元素,做一些比较复杂的操作,那么,考虑到代码的可读性,我们通常会使用for循环,这样更加清晰明了。

    总结

    这节课,我们一起学习了Python中的匿名函数lambda,它的主要用途是减少代码的复杂度。需要注意的是lambda是一个表达式,并不是一个语句;它只能写成一行的表达形式,语法上并不支持多行。匿名函数通常的使用场景是:程序中需要使用一个函数完成一个简单的功能,并且该函数只调用一次。

    其次,我们也入门了Python的函数式编程,主要了解了常见的map(),fiilter()和reduce()三个函数,并比较了它们与其他形式(for循环,comprehension)的性能,显然,它们的性能效率是最优的。

    思考题

    最后,我想给你留下两道思考题。

    第一问:如果让你对一个字典,根据值进行由高到底的排序,该怎么做呢?以下面这段代码为例,你可以思考一下。

    d = {'mike': 10, 'lucy': 2, 'ben': 30}
    

    第二问:在实际工作学习中,你遇到过哪些使用匿名函数的场景呢

  • 相关阅读:
    完美配置Tomcat的HTTPS
    ant的build.xml,引入第三方包
    Eclipse生成jar文件
    持续集成
    Java_Ant详解
    Python简介
    Python 2.7教程
    Eclipse和PyDev搭建完美Python开发环境(Windows篇)
    Jmeter4.0----正则表达式提取器(11)
    Jmeter4.0----设置集合点_并发(10)
  • 原文地址:https://www.cnblogs.com/ting152/p/13260514.html
Copyright © 2011-2022 走看看