Python学习之==>生成器

zoukankan html css js c++ java

Python学习之==>生成器
一、列表生成式

如果要生成列表[1x1, 2x2, 3x3, ..., 10x10]怎么做？除了循环还可以用一行语句代替循环生成，如下：
1 s = [i*i for i in range(10)] 2 print(s) #[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
这种写法就是Python的列表生成式，写列表生成式时，把要生成的元素 i * i 放到前面，后面跟 for 循环，就可以把list创建出来。

二、生成器

1、通过列表生成式实现

　　通过列表生成式，我们可以直接创建一个列表。但受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，会占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。

　　所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不断推算出后续的元素呢？这样就不必创建完整的list，从而节省大量的空间。在Python中，这种一边循环一边计算的机制，称为生成器：generator。

　　要创建一个generator，有很多种方法。第一种方法很简单，只要把一个列表生成式的[]改成()，就创建了一个generator：
1 l = [i*i for i in range(10)] 2 print(l) #[0, 1, 4, 9, 16, 25, 36, 49, 64, 81] 3 4 g = (i for i in range(5)) 5 print(g) #<generator object <genexpr> at 0x000001F1DFCE01A8>
创建l和g的区别仅在于最外层的[]和()，l是一个list，而g是一个generator。

我们可以直接打印出list的每一个元素，但我们怎么打印出generator的每一个元素呢？

如果要一个一个打印出来，可以通过next()函数获得generator的下一个返回值，如下：
1 g = (i for i in range(5)) 2 print(next(g)) # 0 3 print(next(g)) # 1 4 print(next(g)) # 2 5 print(next(g)) # 3 6 print(next(g)) # 4 7 print(next(g)) # StopIteration
generator保存的是算法，每次调用next(g)，就计算出g的下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出StopIteration的错误。

当然，上面这种不断调用next(g)的用法，实际上很少这么用，正确的方法是使用for循环，因为generator也是可迭代对象，如下：
1 g = (i for i in range(5)) 2 for i in g: 3 print(i) 4 # 0 5 # 1 6 # 2 7 # 3 8 # 4
所以，我们创建了一个generator后，基本上永远不会调用next()，而是通过for循环来迭代它，并且不需要关心StopIteration的错误

2、用函数实现

generator非常强大。如果推算的算法比较复杂，用类似列表生成式的for循环无法实现的时候，还可以用函数来实现。

比如，著名的斐波拉契数列（Fibonacci），除第一个和第二个数外，任意一个数都可由前两个数相加得到：

0,1, 1, 2, 3, 5, 8, 13, 21, 34, ...
1 def fib(max): 2 n,before,after = 0,0,1 3 while n <= max: 4 print(before) 5 before,after = after,before+after 6 n = n + 1
上面的函数输出的结果入下：
1 fib(8) 2 # 0 3 # 1 4 # 1 5 # 2 6 # 3 7 # 5 8 # 8 9 # 13 10 # 21
仔细观察，可以看出，fib函数实际上是定义了斐波拉契数列的推算规则，可以从第一个元素开始，推算出后续任意的元素，这种逻辑其实非常类似generator。也就是说，上面的函数和generator仅一步之遥。要把fib函数变成generator，只需要把print(before)改为yield before就可以了，如下：
1 def fib(max): 2 n,before,after = 0,0,1 3 while n <= max: 4 yield before 5 before,after = after,before+after 6 n = n + 1
这就是定义generator的另一种方法。如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator，如下：
1 g = fib(5) 2 print(g) # <generator object fib at 0x000001C0DAD201A8>
这里，最难理解的就是generator和函数的执行流程不一样。函数是顺序执行，遇到return语句或者最后一行函数语句就返回。而变成generator的函数，在每次调用next()的时候执行，遇到yield语句返回，再次执行时从上次返回的yield语句处继续执行，如下：
1 g = fib(5) 2 print(g) # <generator object fib at 0x000001C0DAD201A8> 3 4 print(next(g)) # 1 5 print(next(g)) # 1 6 print('干点别的')# 干点别的 7 print(next(g)) # 2 8 print(next(g)) # 3 9 print(next(g)) # 5
在上面fib的例子，我们在循环过程中不断调用yield，就会不断中断。当然要给循环设置一个条件来退出循环，不然就会产生一个无限数列出来。

同样的，把函数改成generator后，我们基本上从来不会用next()来获取下一个返回值，而是直接使用for循环来迭代，如下：
1 g = fib(5) 2 print(g) # <generator object fib at 0x000001C0DAD201A8> 3 for i in g: 4 print(i) 5 # 1 6 # 1 7 # 2 8 # 3 9 # 5 10 # 8
使用send方法给变成了generator的函数传值，如下：
1 def bar(): 2 print('ok1') 3 count = yield 1 4 print(count) 5 print('ok2') 6 yield 2 7 8 b = bar() 9 s = b.send(None) # 等同于next(b),第一次send前如果没有next，只能传一个None 10 print(s) # 返回第一个yield后面的1 11 k = b.send('AAA') # 第二次send把参数的值赋给count 12 print(k) # 返回第二个yield后面的2 13 # ok1 14 # 1 15 # AAA 16 # ok2 17 # 2
第一次执行b.send(None)后进入函数体，先打印ok1，碰到yield返回1，中断函数执行。第二次执行b.send('AAA')后再次进入函数，把AAA付给count打印出来，然后接着往下走，打印ok2，再往下走碰到yield返回2。

文件读取：
1 def read_file(fpath): 2 BLOCK_SIZE = 1024 3 with open(fpath, 'rb') as f: 4 while True: 5 block = f.read(BLOCK_SIZE) 6 if block: 7 yield block 8 else: 9 return
如果直接对文件对象调用 read() 方法，会导致不可预测的内存占用。好的方法是利用固定长度的缓冲区来不断读取文件内容。通过 yield，我们不再需要编写读文件的迭代类，就可以轻松实现文件读取。
查看全文

相关阅读:
HD1205吃糖果（鸽巢、抽屉原理）
POJ3628 Bookshelf 2(01背包+dfs)
poj1631Bridging signals(最长单调递增子序列 nlgn)
【转】KMP算法
 Intern Day1
记 MINIEYE C++应用开发实习生技术一面
 解决Mac下CLion无法编译运行多个cpp的问题
 记赛目科技C++开发工程师实习生技术面
 Git总结
 Docker学习大纲

原文地址：https://www.cnblogs.com/L-Test/p/10165254.html