迭代器与生成器
1 迭代器
迭代器指的是迭代取值的工具,迭代是一个重复的过程,并且每次重复都是基于上一次的结果而继续的,
单纯的重复并不是迭代!
1.1 迭代器的作用
迭代器是用来迭代取值的工具,而涉及到把多个值循环取出来的类型
有:列表、字符串、元组、字典、集合、打开文件
l = ['egon', 'liu', 'alex']
i = 0
while i < len(l):
print(l[i])
i += 1
上述迭代取值的方式只适用于有索引的数据类型:列表、字符串、元组
为了解决基于索引迭代器取值的局限性
python必须提供一种能够不依赖于索引的取值方式,这就是迭代器
1.2 迭代器的使用
1.2.1 可迭代的对象
但凡内置有__iter__方法的对象都称之为可迭代的对象
s1=''
s1.__iter__()
l=[]
l.__iter__()
t=(1,)
t.__iter__()
d={'a':1}
d.__iter__()
set1={1,2,3}
set1.__iter__()
with open('a.txt',mode='w') as f:
f.__iter__()
pass
1.2.2 迭代器对象
调用可迭代对象下的__iter__方法会将其转换成迭代器对象
内置有__next__方法并且内置有__iter__方法的对象就称为迭代器对象
d={'a':1,'b':2,'c':3}
d_iterator=d.__iter__()
print(d_iterator) # <dict_keyiterator object at 0x0000022FF0E13A90>
print(d_iterator.__next__()) # a
print(d_iterator.__next__()) # b
print(d_iterator.__next__()) # c
print(d_iterator.__next__()) # 抛出异常StopIteration,值取完了
d={'a':1,'b':2,'c':3}
d_iterator=d.__iter__()
while True:
try:
print(d_iterator.__next__())
except StopIteration:
break
# 得到"a","b","c"
print('====>>>>>>') # 在一个迭代器取值取完后,再对其取值就会报错
d_iterator=d.__iter__()
while True:
try:
print(d_iterator.__next__())
except StopIteration:
break
# 什么都得不到,因为迭代器值已取完
l=[1,2,3,4,5]
l_iterator=l.__iter__()
while True:
try:
print(l_iterator.__next__())
except StopIteration:
break
# 得到1,2,3,4,5
1.3 可迭代对象与迭代器对象详解
1.3.1 可迭代对象("可以转换成迭代器的对象")
内置有__iter__方法的对象
可迭代对象使用.__iter__(): 得到迭代器对象
1.3.2 迭代器对象
内置有__next__方法并且内置有__iter__方法的对象
迭代器对象.__next__():得到迭代器的下一个值
迭代器对象.__iter__():得到迭代器的本身,调用和没调用相同
dic={'a':1,'b':2,'c':3}
dic_iterator=dic.__iter__()
print(dic_iterator is dic_iterator.__iter__().__iter__().__iter__())
# True
1.3.3 数据类型分类
可迭代对象:字符串、列表、元组、字典、集合、文件对象
迭代器对象:文件对象
s1=''
s1.__iter__()
l=[]
l.__iter__()
t=(1,)
t.__iter__()
d={'a':1}
d.__iter__()
set1={1,2,3}
set1.__iter__()
with open('a.txt',mode='w') as f:
f.__iter__()
f.__next__()
1.4 for循环的工作原理
for循环可以称之为叫迭代器循环
d={'a':1,'b':2,'c':3}
1、d.__iter__()得到一个迭代器对象
2、迭代器对象.__next__()拿到一个返回值,然后将该返回值赋值给k
3、循环往复步骤2,直到抛出StopIteration异常for循环会捕捉异常然后结束循环
d={'a':1,'b':2,'c':3}
for k in d: # d_it = d.__iter__()
print(k) # 循环k = d_it.__next__()直到抛出异常结束循环
with open('a.txt',mode='rt',encoding='utf-8') as f:
for line in f: # f.__iter__()
print(line)
list('hello') #原理同for循环
1.5 迭代器优缺点总结
优点:
I、为序列和非序列类型提供了一种统一的迭代取值方式。
II、惰性计算:迭代器对象表示的是一个数据流,可以只在需要时才去调用next来计算出一个值,就迭代器本身来说,同一时刻在内存中只有一个值,因而可以存放无限大的数据流,而对于其他容器类型,如列表,需要把所有的元素都存放于内存中,受内存大小的限制,可以存放的值的个数是有限的。
缺点:
I、除非取尽,否则无法获取迭代器的长度
II、只能取下一个值,不能回到开始,更像是‘一次性的’,迭代器产生后的唯一目标就是重复执行next方法直到值取尽,否则就会停留在某个位置,等待下一次调用next;若是要再次迭代同个对象,你只能重新调用iter方法去创建一个新的迭代器对象,如果有两个或者多个循环使用同一个迭代器,必然只会有一个循环能取到值。
2 生成器
生成器就是一个自定义的迭代器
生成器就是迭代器
2.1 生成器的使用
在函数内一旦存在yield关键字,调用函数并不会执行函数体代码
会返回一个生成器对象,生成器即自定义的迭代器
def func():
print('第一次')
yield 1
print('第二次')
yield 2
print('第三次')
yield 3
print('第四次')
g=func()
print(g)
# 生成器就是迭代器
g.__iter__()
# g.__next__()会触发函数体代码的运行,然后遇到yield停下来,将yield后的值
# 当做本次调用的结果返回
g = func()
print(g)
g.__iter__()
res1 = g.__next__()
# 第一次
print(res1)
# 1
res2 = g.__next__()
# 第二次
print(res2)
# 2
res3 = g.__next__()
# 第三次
print(res3)
# 3
res4 = g.__next__()
# 第四次
# StopIteration
2.2 应用案列
def my_range(start,stop,step=1):
print('start...')
while start < stop:
yield start
start+=step
print('end....')
g=my_range(1,5,2)
print(next(g)) # start...
# 1
print(next(g)) # 3
print(next(g)) # end....
# StopIteration
for n in my_range(1,7,2):
print(n)
# start...
# 1
# 3
# 5
# end....
2.3 总结yield
有了yield关键字,我们就有了一种自定义迭代器的实现方式。yield可以用于返回值,但不同于return,函数一旦遇到return就结束了,而yield可以保存函数的运行状态挂起函数,用来返回多次值
tips
len('aaa') # 'aaa'.__len__()
next(g) # g.__next__()
iter(可迭代对象) # 可迭代对象.__iter__()
3 yield表达式
3.1 x=yield
def dog(name):
print('道哥%s准备吃东西啦...' %name)
while True:
# x拿到的是yield接收到的值
x = yield # x = '肉包子'
print('道哥%s吃了 %s' %(name,x))
g=dog('alex')
g.send('肉包子') # TypeError: can't send non-None value to a just-started generator
# send传给yield值之前必须初始化,即必须先执行g.send(None)或next(g)
g.send(None) # 等同于next(g)
# 道哥alex准备吃东西啦...
g.send(['一根骨头','aaa'])
# 道哥alex吃了 ['一根骨头', 'aaa']
g.send('肉包子') # g.send("肉包子")相当于 next(g)+为当前的yield传入值:肉包子
# 道哥alex吃了 肉包子
g.send('一桶泔水')
# 道哥alex吃了 一桶泔水
g.close()
g.send('1111') # 报错StopIteration,关闭之后无法传值
3.2 x=yield 返回值
x=yield 返回值 要将这行代码分开看,即x=yield和yield 返回值
这里的返回值是前一段代码的返回值
执行这行代码时会将send的值传入yield,赋值给x
然后执行这行下面的代码,直到遇到下一个yield
而下一个yield 返回值才是这一段代码的返回值
def dog(name):
food_list=[]
print('道哥%s准备吃东西啦...' %name)
while True:
# x拿到的是yield接收到的值
x = yield food_list # x = '肉包子'
print('道哥%s吃了 %s' %(name,x))
food_list.append(x) # ['一根骨头','肉包子']
g=dog('alex')
res=g.send(None) # next(g)
# 道哥alex准备吃东西啦...
print(res)
# []
res=g.send('一根骨头')
# 道哥alex吃了 一根骨头
print(res)
# ['一根骨头']
res=g.send('肉包子')
# 道哥alex吃了 肉包子
print(res)
# ['一根骨头', '肉包子']
def func():
print('start.....')
x=yield 1111 # x='xxxxx'
print('哈哈哈啊哈')
print('哈哈哈啊哈')
print('哈哈哈啊哈')
print('哈哈哈啊哈')
yield 22222
g=func() # 得到生成器
res=next(g) # 初始化
print(res) # 1111
res=g.send('xxxxx') # 为yield传入xxxx
print(res) # 22222
1