python基础—迭代器、生成器
1 迭代器定义
迭代的意思是重复做一些事很多次,就像在循环中做的那样。
只要该对象可以实现__iter__方法,就可以进行迭代。
迭代对象调用__iter__方法会返回一个迭代器,所谓的迭代器就是具有next方法的对象。(在调用next方法时不需要任何参数)。在调用next方法时,迭代器会返回它的下一个值。如果next方法被调用,但迭代器没有值可以返回,就会引发一个StopITeration异常。
一个实现了__iter__方法的对象是可迭代的,一个实现了next方法的对象是迭代器。
迭代器也有__iter__方法。
2 迭代器特性
优点:
1 迭代器提供了一种不依赖索引的取值方式,这样就可以遍历那些没有索引的可迭代对象了(字典,集合,文件)
2 迭代器与列表比较,迭代器是惰性计算的,更节省内存
缺点:
1 无法获取迭代器的长度,使用不如列表索引取值灵活
2 一次性的,只能往后取值,不能倒着取值
迭代规则的关键是?为什么不是使用列表?
1 如果有一个函数,可以一个接一个地计算值,那么在使用时可能是计算一个值时获取一个值,而不是像列表一样获取所有的值。如果有很多值,列表会占用太多的内存。
2 使用迭代器更通用,更简单,更优雅
3 迭代器代码
(1)索引方式循环
l=['a','b','c','d'] i=0 while i<len(l): print(l[i]) i+=1 for i in range(len(l)): print(l[i])
(2)只要被内置了__iter__方法就是可迭代对象
可迭代的:只要对象本身有__iter__方法,那他就是可迭代的
l=['a','b','c','d'] l.__iter__() #相当于iter(l) iter(l) i=iter(l)
i 就是迭代器,i 就是列表l的迭代器
(3)迭代器的__next__方法
迭代器使用__next__方法,可以不依赖下标取值,超出字典长度会有结束报错。
调用__next__方法必须是迭代器,也只有迭代器才有__next__方法。
l=['a','b','c','d'] i=iter(l) print(i.__next__()) print(i.__next__()) print(i.__next__()) print(i.__next__()) print(i.__next__())
输出结果:
a b c d StopIteration #报错
(4)while循环与迭代器
d={'a':1,'b':2,'c':3,'d':4} i=iter(d) while True: try: print(next(i)) except StopIteration: break
输出结果:
b c a d
(5)for循环与迭代器
在这里for就是使用可迭代对象的__iter__方法返回此可迭代对象的迭代器,并且执行此迭代器的next方法,并且出现StopITeration报错就结束
For循环与列表
d={'a':1,'b':2,'c':3,'d':4} for i in d: print(i)
For循环与文件
with open('a.txt','r') as f: for line in f: print(line.strip())
(6)迭代器也有__iter__方法
f 的迭代器也有__iter__方法,并且指向f这个迭代器本身
(7)迭代器是一次性的
只能往后取值,不能倒着取值
可迭代对象不是一次性的。
d={'a':1,'b':2,'c':3,'d':4} i=iter(d) print(next(i)) print(next(i)) print(next(i)) print(next(i)) for x in i: #迭代器i已经将上面的值取完,for循环在这里没有值可取 print(x)
输出结果:
d a b c
(8)isinstance判断对象是否是可迭代对象和迭代器对象
Isinstance使用例子:
print(type('ssssss') is str) print(isinstance("ssssss",str))
输出结果:
True True
用isinstance判断是不是可迭代对象与迭代器对象
#查看可迭代对象和迭代器对象
from collections import Iterable,Iterator str1='hello' list1=[1,2,3] tuple1=(1,2,3) dict1={"a":1,"b":2,"c":3} set1={1,2,3,4} f1=open('a.txt') #都是可迭代的 str1.__iter__() list1.__iter__() tuple1.__iter__() dict1.__iter__() set1.__iter__() f1.__iter__() print(isinstance(str1,Iterable)) #True print(isinstance(list1,Iterable)) #True print(isinstance(tuple1,Iterable)) #True print(isinstance(dict1,Iterable)) #True print(isinstance(set1,Iterable)) #True print(isinstance(f1,Iterable)) #True #查看是否是迭代器 print(isinstance(str1,Iterator)) #False print(isinstance(list1,Iterator)) #Flase print(isinstance(tuple1,Iterator)) #Flase print(isinstance(dict1,Iterator)) #Flase print(isinstance(set1,Iterator)) #Flase print(isinstance(f1,Iterator)) #Flase
4、生成器
4.1 生成器函数定义
生成器就是一个函数,这个函数内包含有yield这个关键字
返回一个生成器对象。生成器本质就是迭代器
生成器是一个包含yield关键字的函数。当它被调用时,在函数体中的代码不会被执行,而会返回一个迭代器。每次请求一个值,就会请求生成器中的代码,直到遇到一个yield或者return语句。Yield语句意味着生成一个值。Return语句意味着生成器要停止执行。
生成器是由两部分组成的:生成器的函数和生成器的迭代器。生成器的函数是有def语句定义的,包含yield部分。生成器的迭代器是这个函数返回的部分。生成器函数返回的迭代器可以像其他迭代器那样使用。
4.2 yield作用
生成器与return有何区别?
Return只能返回一次函数就彻底结束了,而yield返回多次值
yield到底干了什么事情?
1 yield把函数变成生成器-,生成器实质就是迭代器。 相当于把__iter__和__next__方法封装到函数内部。
2 用return返回值能返回一次,而yield返回多次
3 函数在暂停以及继续下一次运行时的状态是由yield保存
任何包含yield语句的函数称为生成器。Yield不是像return那样返回值,而是每次产生多个值。生成器每次产生一个值(使用yield语句),函数就会被冻结:即函数停在那点等待被重新唤醒。函数被重新唤醒之后就从停止的那点开始。
4.3 生成器运行详解
Test函数中yield返回给g一个生成器,实质就是迭代器,通过next方法取值,并且在取值时会执行test函数和取yield的返回值。即next函数会触发生成器函数g的运行,遇到yield停止
from collections import Iterable,Iterator def test(): print("first") yield 1 g=test() print(g) print(next(g)) print(isinstance(g,Iterable)) print(isinstance(g,Iterator))
输出结果:
<generator object test at 0x000000E8CBDE5360> first 1 True True
def test(): print("one") yield 1 print("two") yield 2 print("three") yield 3 g=test() res=next(g) print(res) res=next(g) print(res) res=next(g) print(res) res=next(g) print(res)
输出结果:
one 1 two 2 three 3 StopIteration #报错
def test(): print("one") yield 1 print("two") yield 2 print("three") yield 3 g=test() for i in g: print(i)
输出结果:
one 1 two 2 three 3
一个yield可以返回多个值,接收的类型是元组
yield可以返会任何类型的值
def test(): yield 1,2,3,4 g=test() print(next(g))
输出结果:
(1,2,3,4)
生成器与return有何区别?
Return只能返回一次函数就彻底结束了,而yield返回多次值
yield到底干了什么事情?
1 yield把函数变成生成器--->迭代器
2 用return返回值能返回一次,而yield返回多次
3 函数在暂停以及继续下一次运行时的状态是由yield保存
例子:
def countdown(n): print("start countnum") while n>0: yield n n-=1 print('done') g=countdown(5) print(next(g)) print(next(g)) print(next(g)) print(next(g)) print(next(g)) try: print(next(g)) #这一次next函数应用没有yield返回,会报错StopIteration,需要try检测 except StopIteration: pass g=countdown(5) print(next(g)) for i in g: #for会将g变成迭代器:iter(g),执行next取值,并捕捉next出现的异常 print(i)
输出结果:
start countnum 5 4 3 2 1 done start countnum 5 4 3 2 1 done
4.4 用生成器模拟管道
tailf命令的实现
1 普通函数实现
#/usr/bin/env python import time def tail(file_path): with open(file_path,'r') as f: f.seek(0,2) while True: line=f.readline() if not line: time.sleep(0.3) continue else: print(line,end="") tail("/tmp/a.txt")
2 生成器函数实现
#/usr/bin/env python import time def tail(file_path): with open(file_path,'r') as f: f.seek(0,2) while True: line=f.readline() if not line: time.sleep(0.3) continue else: yield line g=tail("/tmp/a.txt") print(g) for line in g: print(line)
tail -f |grep “error” 实现
#/usr/bin/env python import time #定义阶段:定义两个生成器函数 def tail(file_path): with open(file_path,'r') as f: f.seek(0,2) while True: line=f.readline() if not line: time.sleep(0.3) continue else: yield line def grep(pattern,lines): for line in lines: if pattern in line: yield line #调用阶段:得到两生成器对象 g=tail("/tmp/a.txt") gg=grep("error",g) #next触发执行gg生成器函数 for line in gg: print(line)
1 迭代器的应用
文件名:a.txt 文件内容如下:
apple 10 3
tesla 100000 1
mac 3000 2
lenovo 30000 3
chicken 10 3
实现功能:cat a.txt|grep apple
要求1:定义迭代器函数cat
要求2:定义迭代器函数grep
要求3:模拟管道的功能,将cat的处理结果作为grep的输入
def cat(file_auth): with open(file_auth,"r") as f: f.seek(0) for line in f: yield line def grep(pattern,lines): for line in lines: if pattern in line: yield line cat_func=cat("/tmp/a.txt") grep_func=grep("apple",cat_func) for line in grep_func: print(line)
5、协程函数
5.1 协程函数定义
如果在一个函数内部yield的使用方式是表达式形式的话,如x=yield,那么该函数成为协程函数。
yield是表达式方式使用,则必须用send方法进行传值。
协程函数=生成器+yield表达式+send方法
5.2 e.send与next(e)的区别
e.send与next(e)的区别
1 如果函数内yield是表达式形式,那么必须先next(e)
使用send方法只有在生成器挂起之后才有意义(也就是在yield函数第一次被执行之后),因此要用send方式时需要用next方法初始化生成器。
用next(e)初始化 相当于 e.send(None) ,可以用装饰器解决初始化问题
2 二者的共同之处是都可以让函数在上次暂停的位置继续运行,不一样的地方在于send在触发下一次代码的执行时,会顺便给yield传一个值。
end可以传多个值,但是必须是元组类型
5.3协程函数举例
def eater(name): print("%s start to eat food"%name) while True: food=yield print("%s get %s,to start eat"%(name,food)) print("done") e=eater("people") print(e) next(e) e.send("apple") e.send("fruit") e.send("beef") e.send("meet")
输出结果:
<generator object eater at 0x000000F944583D00> people start to eat food people get apple,to start eat people get fruit,to start eat people get beef,to start eat people get meet,to start eat
def eater(name): print("%s start to eat food"%name) food_list=[] while True: food=yield food_list print("%s get %s,to start eat"%(name,food)) food_list.append(food) print("done") e=eater("people") print(e) next(e) print(e.send("apple")) print(e.send("fruit")) print(e.send("beef")) print(e.send("meet"))
输出结果:
<generator object eater at 0x0000006F92D83D00> people start to eat food people get apple,to start eat ['apple'] people get fruit,to start eat ['apple', 'fruit'] people get beef,to start eat ['apple', 'fruit', 'beef'] people get meet,to start eat ['apple', 'fruit', 'beef', 'meet']
2 生成器的应用
把下述函数改成生成器的形式,执行生成器函数的到一个生成器g,
然后g.send(url),打印页面的内容,利用g可以无限send
from urllib.request import urlopen def get(url): while True: def index(): print(url) print(urlopen(url).read()) url=yield index g=get("http://www.baidu.com") next(g) baidu=g.send("http://www.baidu.com") baidu()
5.4 协程函数用装饰器初始化
协程函数使用装饰器完成初始化
def auth(func): def wrapper(*args,**kwargs): res=func(*args,**kwargs) next(res) return res return wrapper @auth def eater(name): print("%s start to eat food"%name) food_list=[] while True: food=yield food_list print("%s get %s,to start eat"%(name,food)) food_list.append(food) print("done") e=eater("people") e.send("123")