如何选择使用列表推导式或生成器表达式

zoukankan html css js c++ java

如何选择使用列表推导式或生成器表达式
列表推导的缺点是：在列表推导过程中，对于输入序列中的每个值来说，可能都要创建仅含一项元素的全新列表。当输入的数据比较少时，不会出现问题。但如果输入数据非常多，那么可能会消耗大量内存，并导致程序崩溃。

ge:

要读取一份文件并返回每行的字符数。若采用列表推导式来做，则需要把文件每一行的长度都保存在内存中。如果这个文件特别大，那么这种列表推导式就会出现问题。
ml = [len(x) for x in open('/tem/my_file.txt')] print ml
>>>[28,37,43,5,6,7]

为了解决此问题，python提供了生成器表达式（generator expression）,它是对列表推导和生成器的一种泛化。生成器表达式在运行的时候，并不会把整个输出序列都呈现出来，而是会估值为迭代器（iterator）,这个迭代器每次都可以根据生成器表达式产生一项数据

*****把实现列表推导式所使用的那种写法放在一对圆括号中，就构成了生成器表达式。******

二者的区别在于：

对生成器表达式求值的时候，他会立即返回一个迭代器，而不会深入处理文件中的字符。
>>> it = (len(x) for x in ['aaaa','bbbbb']) >>> it <generator object <genexpr> at 0x028BFC88>
以刚才返回的it迭代器为参数，调用内置函数next()，即可使其按着生成器表达式来输出一个值。多次命令迭代器根据生成表达式来生成新值，而不用担心内存用量激增。
>>> print next(it) 4 >>> print next(it) 5 >>> print next(it) Traceback (most recent call last): File "<pyshell#79>", line 1, in <module> print next(it) StopIteration
使用生成器表达是还有个好处是：可以相互结合。
its = ((x, x**2) for x in it)##注意此处的it为可迭代对象哦 print next(its)
最后需要注意一点就是：由生成器表达式所返回的那个迭代器是有状态的，用过一轮之后，就不要重复使用了。

总结：

1、当输入的数据量较大时，列表推导式可能会因为占用太多内存而出现问题

2、由生产器表达式所返回的迭代器，可以逐次产生输出值，从而避免了内存用量问题

3、可以进行结合使用

4、串在一起的生成器表达式执行速度很快
查看全文

相关阅读:
LeetCode--Insert Interval
LeetCode--Surrounded Regions
LeetCode--Container With Most Water
LeetCode--Permutation Sequence
NYOJ---540奇怪的排序
 NYOJ-858下三角矩阵
 素数筛选法
 NYOJ----776删除元素
 矩阵快速幂
 神奇算式

原文地址：https://www.cnblogs.com/magicking/p/8999423.html