1、迭代器(Iterator)
- 迭代是访问集合元素的一种方式
- 迭代器是一个可以记住遍历的位置的对象。
- 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。
- 迭代器有两个基本的方法:iter() 和 next()。
字符串,列表或元组对象都可用于创建迭代器:
实例1:
basket = ['apple', 'orange', 'pear', 'banana'] it = iter(basket) # 创建迭代器对象 # 输出迭代器的下一个元素 print(next(it)) # 输出迭代器的下一个元素 print(next(it))
以上代码,输出:
apple
orange
实例2:
basket = 'abc' it = iter(basket) # 创建迭代器对象 print(next(it)) # 输出迭代器的下一个元素 print(next(it)) # 输出迭代器的下一个元素
以上代码,输出:
a
b
通常会和for语句搭配使用,如:
basket = 'abc' it = iter(basket) # 创建迭代器对象 for n in it: print(n)
以上代码,输出:
a
b
c
Python中 list,truple,str,dict这些都可以被迭代,但他们并不是迭代器。为什么?
因为和迭代器相比有一个很大的不同,list/truple/map/dict这些数据的大小是确定的,也就是说有多少是可知的。但迭代器不是,迭代器不知道要执行多少次,所以可以理解为不知道有多少个元素,每调用一次next(),就会往下走一步,是惰性的。
判断是不是可以迭代,用Iterable
from collections import Iterable print('{} 是Iterable?', isinstance({}, Iterable)) print('() 是Iterable?', isinstance((), Iterable)) print('100 是Iterable?', isinstance(100, Iterable))
以上代码,输出:
{} 是Iterable? True
() 是Iterable? True
100 是Iterable? False
判断是不是迭代器,用Iterator
from collections import Iterator print('{} 是Iterable?', isinstance({}, Iterator)) print('() 是Iterable?', isinstance((), Iterator)) print('(x for x in range(10)) 是Iterable?', isinstance((x for x in range(10)), Iterator))
以上代码,输出:
{} 是Iterable? False () 是Iterable? False (x for x in range(10)) 是Iterable? True
凡是可以for循环的,都是Iterable
凡是可以next()的,都是Iterator
集合数据类型如list,truple,dict,str,都是Itrable不是Iterator,但可以通过iter()函数获得一个Iterator对象
Python中的for循环就是通过next实现的
for x in [1, 2, 3, 4, 5]: pass
等价于
# 先获取iterator对象 it = iter([1, 2, 3, 4, 5]) while True: try: # 获取下一个值 x = next(it) except StopIteration: # 遇到StopIteration就退出循环 break
2、生成器
在 Python 中,使用了 yield 的函数被称为生成器(generator)。
- 跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。
- 在调用生成器运行的过程中,每次遇到 yield 时函数会暂停并保存当前所有的运行信息,返回yield的值。并在下一次执行 next()方法时从当前位置继续运行。
def fibonacci(n): # 生成器函数 - 斐波那契 a, b, counter = 0, 1, 0 while True: if counter > n: return yield a a, b = b, a + b counter += 1 f = fibonacci(10) # f 是一个迭代器,由生成器返回生成
什么情况下需要使用 yield?一个函数 f,f 返回一个 list,这个 list 是动态计算出来的(不管是数学上的计算还是逻辑上的读取格式化),并且这个 list 会很大(无论是固定很大还是随着输入参数的增大而增大),这个时候,我们希望每次调用这个函数并使用迭代器进行循环的时候一个一个的得到每个 list 元素而不是直接得到一个完整的 list 来节省内存,这个时候 yield 就很有用。