一、生成器(generator)
先来看看一个简单的菲波那切数列,出第一个和第二个外,任意一个数都是由前两个数相加得到的。如:0,1,1,2,3,5,8,13......
输入斐波那契数列前N个数:
def fab(max): n, a, b = 0, 0, 1 while n < max: print b a, b = b, a + b n = n + 1
结果:
>>> fib(100) 1 1 2 3 5 8 13
但是,要提高 fib 函数的可复用性,最好不要直接打印出数列,而是返回一个 List。每次循环将b的值append到一个list中。
然而,问题又来了。。。
该函数在运行中占用的内存会随着参数 max 的增大而增大,如果要控制内存占用,最好不要用 List来保存中间结果,而是通过 iterable 对象来迭代。
在python2 中:
for i in range(1000): pass
range会生成一个含有1000个元素的list,极大地浪费了内存空间。
for i in xrange(1000): pass
而改进后的xrange则生成一个可迭代(iterable)对象,每次迭代时返回下一个数值,占用空间极少。
如此,我们可以利用iterable来写一个fib类:
class Fab(object): def __init__(self, max): self.max = max self.n, self.a, self.b = 0, 0, 1 def __iter__(self): return self def next(self): if self.n < self.max: r = self.b self.a, self.b = self.b, self.a + self.b self.n = self.n + 1 return r raise StopIteration()
然后,for循环会在每次循环中自动调用next()方法,不断返回数列的下一个数。占用内存始终为常数。
>>> for n in Fab(5): ... print(n)
虽然实现了需求,但用class实现的fib并不简洁,由此我们可以引入yield。
def fab(max): n, a, b = 0, 0, 1 while n < max: yield b # print(b) a, b = b, a + b n = n + 1
然后:
>>> for n in fab(5): ... print(n)
yield 的作用就是把一个函数变成一个 generator,带有 yield 的函数不再是一个普通函数,Python 解释器会将其视为一个 generator,调用 fib(5) 不会执行 fab 函数,而是返回一个 iterable 对象在 for 循环执行时,每次循环都会执行 fib 函数内部的代码,执行到 yield b 时,fib 函数就返回一个迭代值,下次迭代时,代码从 yield b 的下一条语句继续执行,而函数的本地变量看起来和上次中断执行前是完全一样的,于是函数继续执行,直到再次遇到 yield。
手动执行过程:
>>> f = fab(5) >>> f.next() 1 >>> f.next() 1 >>> f.next() 2 >>> f.next() 3 >>> f.next() 5 >>> f.next() Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
当函数执行结束时,generator 自动抛出 StopIteration 异常,表示迭代完成。在 for 循环里,无需处理 StopIteration 异常,循环会正常结束。
一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。