在使用python在做数据处理分析时经常会用到list这个内置对象,通常对于list上会有一些计算,比如过滤,元素查找等等,对于数据量不大的时候for循环遍历对性能并不构成很大影响,但是当数据量很大的时候瓶颈就出现了。但是很幸运的是python提供了几个内置全局函数可以高效的处理list操作,他们就是map,reduce,filter,当然他们能处理的并不仅仅是list,只要是一个序列就可以。
通常与这些函数匹配使用的还有lambda表达式
map
map(function, sequence)
function:一个用来处理sequence元素的函数,这个函数当然可以使用lambda表达式
sequence:一个序列,可以是tuple,list,dict
map返回值是经过function处理过之后的一个新列表
2.filter
filter(function, sequence)
参数与返回类型和map基本一致
3.reduce
reduce(function, sequence)
参数和map,filter不太一样,function必须接收两个参数,计算的结果与后一个输入再做同样计算
返回值并不是一个列表,是经过function处理之后的一个值
使用方法:
from functools import reduce
l = ['a', 'bc', 'cde', 'defg']
lf = filter(lambda x: len(x) > 2, l)
lm = map(lambda x: x+'_n', l)
lr = reduce(lambda x,y: x+y, l)
print(list(lf))
print(list(lm))
print(lr)
输出:
['cde', 'defg']
['a_n', 'bc_n', 'cde_n', 'defg_n']
abccdedefg