【目录】
一 、生成器和yield
1、什么是生成器
2、为何要有生成器
3、如何使用生成器
二、yield表达式应用
三 、三元表达式、字典生成式、集合生成器、列表生成式、生成器表达式
一、生成器(generator)和yield
1、yield关键字
有了yield关键字,我们就有了一种自定义迭代器的实现方式。
yield可以用于返回值,但不同于return,函数一旦遇到return就结束了,而yield可以保存函数的运行状态挂起函数,用来返回多次值
2、什么是生成器
若函数体包含yield关键字,再调用函数,并不会执行函数体代码,得到的返回值即生成器对象
栗子:
>>> def my_range(start,stop,step=1):
... print('start...')
... while start < stop:
... yield start
... start+=step
... print('end...')
...
>>> g=my_range(0,3)
>>> g
<generator object my_range at 0x104105678>
生成器内置有__iter__和__next__方法,所以生成器本身就是一个迭代器
>>> g.__iter__
<method-wrapper '__iter__' of generator object at 0x1037d2af0>
>>> g.__next__
<method-wrapper '__next__' of generator object at 0x1037d2af0>
因而我们可以用next(生成器)触发生成器所对应函数的执行:
>>> next(g) # 触发函数执行直到遇到yield则停止,将yield后的值返回,并在当前位置挂起函数
start...
0
>>> next(g) # 再次调用next(g),函数从上次暂停的位置继续执行,直到重新遇到yield...
1
>>> next(g) # 周而复始...
2
>>> next(g) # 触发函数执行没有遇到yield则无值返回,即取值完毕抛出异常结束迭代
end...
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
for循环迭代版:
>>> for i in countdown(3):
... print(i)
...
countdown start
3
2
1
Done!
二、yield表达式应用
(1)栗子1—— x=yield
def dog(name):
print('道哥%s准备吃东西啦...' %name)
while True:
# x拿到的是yield接收到的值
x = yield # x = '肉包子'
print('道哥%s吃了 %s' %(name,x))
g=dog('alex')
g.send(None) # 等同于next(g)
g.send(['一根骨头','aaa'])
# g.send('肉包子')
# g.send('一同泔水')
# g.close()
# g.send('1111') # 关闭之后无法传值
(2)栗子2—— x=yield 返回值
def dog(name):
food_list=[]
print('道哥%s准备吃东西啦...' %name)
while True:
# x拿到的是yield接收到的值
x = yield food_list # x = '肉包子'
print('道哥%s吃了 %s' %(name,x))
food_list.append(x) # ['一根骨头','肉包子']
g=dog('alex')
res=g.send(None) # next(g)
print(res)
res=g.send('一根骨头')
print(res)
res=g.send('肉包子')
print(res)
(3)再来一颗栗子
def func():
print('start.....')
x=yield 1111 # x='xxxxx'
print('哈哈哈啊哈')
print('哈哈哈啊哈')
print('哈哈哈啊哈')
print('哈哈哈啊哈')
yield 22222
g=func()
res=next(g)
print(res)
res=g.send('xxxxx')
print(res)
三 、三元表达式、列表生成式、字典生成式、集合生成器、生成器表达式
1、三元表达式
三元表达式是python为我们提供的一种简化代码的解决方案,语法——
res = 条件成立时返回的值 if 条件 else 条件不成立时返回的值
栗子:
原版——
def max2(x,y):
if x > y:
return x
else:
return y
res = max2(1,2)
升级版——
x=1
y=2
res = x if x > y else y # 三元表达式
2、列表生成式
列表生成式是python为我们提供的一种简化代码的解决方案,用来快速生成列表,语法如下:
[expression for item1 in iterable1 if condition1
for item2 in iterable2 if condition2
...
for itemN in iterableN if conditionN
]
#类似于
res=[]
for item1 in iterable1:
if condition1:
for item2 in iterable2:
if condition2
...
for itemN in iterableN:
if conditionN:
res.append(expression)
栗子:
原版——
egg_list=[]
for i in range(10):
egg_list.append('鸡蛋%s' %i)
升级版——
egg_list=['鸡蛋%s' %i for i in range(10)]
应用——
l = ['alex_dsb', 'lxx_dsb', 'wxx_dsb', "xxq_dsb", 'egon']
new_l=[]
for name in l:
if name.endswith('dsb'):
new_l.append(name)
new_l=[name for name in l if name.endswith('dsb')]
new_l=[name for name in l]
print(new_l)
# 把所有小写字母全变成大写
new_l=[name.upper() for name in l]
print(new_l)
# 把所有的名字去掉后缀_dsb
new_l=[name.replace('_dsb','') for name in l]
print(new_l)
3、字典生成式
keys=['name','age','gender']
dic={key:None for key in keys}
print(dic)
items=[('name','egon'),('age',18),('gender','male')]
res={k:v for k,v in items if k != 'gender'}
print(res)
4、集合生成式
keys=['name','age','gender']
set1={key for key in keys}
print(set1,type(set1))
5、生成器表达式
创建一个生成器对象有两种方式——
一种是调用带yield关键字的函数,
另一种就是生成器表达式,与列表生成式的语法格式相同,只需要将[]换成(),即:
(expression for item in iterable if condition)
对比列表生成式返回的是一个列表,生成器表达式返回的是一个生成器对象:
>>> [x*x for x in range(3)]
[0, 1, 4]
>>> g=(x*x for x in range(3))
>>> g
<generator object <genexpr> at 0x101be0ba0>
>>> next(g)
0
>>> next(g)
1
>>> next(g)
4
>>> next(g) #抛出异常StopIteration
g=(i for i in range(10) if i > 3)
#!!!!!!!!!!!强调!!!!!!!!!!!!!!!
#此刻g内部一个值也没有
print(g,type(g))
print(g)
print(next(g))
print(next(g))
print(next(g))
应用:
如果我们要读取一个大文件的字节数,应该基于生成器表达式的方式完成
with open('db.txt','rb') as f:
nums=(len(line) for line in f)
total_size=sum(nums) # 依次执行next(nums),然后累加到一起得到结果=
详解版:
with open('笔记.txt', mode='rt', encoding='utf-8') as f:
#方式一:
res=0
for line in f:
res+=len(line)
print(res)
# 方式二:
res=sum([len(line) for line in f])
print(res)
#方式三 :效率最高
res = sum((len(line) for line in f))
#上述可以简写为如下形式
res = sum(len(line) for line in f)
print(res)