一、容器
容器是一种把多个元素组织在一起的数据结构,容器中的元素可以逐个地迭代获取,可以用in, not in关键字判断元素是否包含在容器中。通常这类数据结构把所有的元素存储在内存中。
1 >>> 4 in [3, 4] 2 True 3 >>> 4 in (3, 4) 4 True
二、可迭代对象Iterable和迭代器Iterator
我们在用for ... in ...语句循环时,in后面跟随的对象要求是可迭代对象,即可以直接作用于for循环的对象统称为可迭代对象(Iterable),如list、tuple、dict、set、str等。
可迭代对象是实现了__iter__()方法的对象,而迭代器(Iterator)则是实现了__iter__()和__next__()方法的对象,可以显示地获取下一个元素。这种可以被next调用并不断返回下一个值的对象称为迭代器。迭代器一定是可迭代对象,反过来则不一定成立。
__iter__
返回迭代器自身,__next__
返回容器中的下一个值。
iter()
函数可以把一个可迭代对象转换成一个迭代器。
用iter()函数可以把list、dict、str等Iterable变成Iterator,例如:
1 i = iter([1, 2, 3]) 2 print(i.__next__()) 3 print(i.__next__()) 4 print(i.__next__()) 5 print(i.__next__())
1 2 3 Traceback (most recent call last): File "4.py", line 12, in <module> print(i.__next__()) StopIteration
判断一个对象是否是可迭代对象的方法:
1 >>> from collections import Iterable 2 >>> isinstance([1, 2, 3], Iterable) 3 True 4 >>> isinstance((1, 2, 3), Iterable) 5 True 6 >>> isinstance({'one': 1}, Iterable) 7 True 8 >>> isinstance('abc', Iterable) 9 True 10 >>> isinstance(b'abc', Iterable) 11 True 12 >>> isinstance(bytearray('abc', encoding='utf-8'), Iterable) 13 True
判断一个对象是否是迭代器:
1 1 >>> from collections import Iterator 2 2 >>> isinstance((x for x in range(10)), Iterator) 3 3 True 4 4 >>> isinstance([], Iterator) 5 5 False 6 6 >>> isinstance({}, Iterator) 7 7 False 8 8 >>> isinstance(b'abc', Iterator) 9 9 False
for..in..循环的运行实质:
更直观地感受迭代器内部的执行过程,我们自定义一个迭代器,以斐波那契数列为例:
1 class Fib: 2 def __init__(self): 3 self.prev = 0 4 self.curr = 1 5 6 def __iter__(self): 7 return self 8 9 def __next__(self): 10 value = self.curr 11 self.curr += self.prev 12 self.prev = value 13 return value 14 15 >>> f = Fib() 16 >>> list(islice(f, 0, 10)) 17 [1, 1, 2, 3, 5, 8, 13, 21, 34, 55]
三、生成器
生成器(generator)就是一个能返回迭代器的函数,其实就是定义一个迭代算法,可以理解为一个特殊的迭代器。调用这个函数就得到一个迭代器,生成器中的yield相当于一个断点,执行到此返回一个值后暂停,从而实现next取值。
生成器算得上是Python语言中最吸引人的特性之一,生成器其实是一种特殊的迭代器,不过这种迭代器更加优雅。它不需要再像上面的类一样写__iter__()
和__next__()
方法了,只需要一个yiled
关键字。 生成器一定是迭代器(反之不成立),因此任何生成器也是以一种懒加载的模式生成值。用生成器来实现斐波那契数列的例子是:
1 def fib(): 2 prev, curr = 0, 1 3 while True: 4 yield curr 5 prev, curr = curr, curr + prev 6 7 >>> f = fib() 8 >>> list(islice(f, 0, 10)) 9 [1, 1, 2, 3, 5, 8, 13, 21, 34, 55]
fib
就是一个普通的python函数,它特殊的地方在于函数体中没有return
关键字,函数的返回值是一个生成器对象。当执行f=fib()
返回的是一个生成器对象,此时函数体中的代码并不会执行,只有显示或隐示地调用next的时候才会真正执行里面的代码。
生成器在Python中是一个非常强大的编程结构,可以用更少地中间变量写流式代码,此外,相比其它容器对象它更能节省内存和CPU,当然它可以用更少的代码来实现相似的功能。
1 def something(): 2 result = [] 3 for ... in ...: 4 result.append(x) 5 return result
都可以用生成器函数来替换:
def something(): result = [] for ... in ...: result.append(x) return result
现在就可以动手重构你的代码了,但凡看到类似:
1 def iter_something(): 2 for ... in ...: 3 yield x
四、生成表达式
生成器表达式(generator expression)是列表推倒式的生成器版本,看起来像列表推导式,但是它返回的是一个生成器对象而不是列表对象。
1 >>> a = (x*x for x in range(10)) 2 >>> a 3 <generator object <genexpr> at 0x401f08> 4 >>> sum(a) 5 285