一 迭代的概念
迭代是Python最强大的功能之一,是访问集合元素的一种方式。
迭代器是一个可以记住遍历的位置的对象。
迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。
迭代器有两个基本的方法:iter() 和 next()。
迭代器协议:
- 迭代器协议是指:对象必须提供一个next()方法,执行该方法要么返回带代中的下一项,要么引起一个Stoplteration异常,以终止迭代(只能往后走,不能往前退);
- 可迭代对象:实现了迭代器协议的对象(如何实现:对内部定义一个__iter__方法);
- 协议是一种约定:可迭代对象实现了迭代器协议,python的内部工具(如:for循环,sum,min,max函数等)使用迭代器协议访问对象;
字符串,列表或元组对象都可用于创建迭代器:
#迭代器即迭代的工具,那什么是迭代呢? #迭代是一个重复的过程,每次重复即一次迭代,并且每次迭代的结果都是下一次迭代的初始值 while True: #只是单纯地重复,因而不是迭代 print('===>') l=[1,2,3] count=0 while count < len(l): #迭代 print(l[count]) count+=1
二 为何要有迭代器?什么是可迭代对象?什么是迭代器对象?
#1、为何要有迭代器? 对于序列类型:字符串、列表、元组,我们可以使用索引的方式迭代取出其包含的元素。但对于字典、集合、文件等类型是没有索引的,若还想取出其内部包含的元素,则必须找出一种不依赖于索引的迭代方式,这就是迭代器 #2、什么是可迭代对象? 可迭代对象指的是内置有__iter__方法的对象,即obj.__iter__,如下 'hello'.__iter__ (1,2,3).__iter__ [1,2,3].__iter__ {'a':1}.__iter__ {'a','b'}.__iter__ open('a.txt').__iter__ #3、什么是迭代器对象? 可迭代对象执行obj.__iter__()得到的结果就是迭代器对象 而迭代器对象指的是即内置有__iter__又内置有__next__方法的对象 文件类型是迭代器对象 open('a.txt').__iter__() open('a.txt').__next__() #4、注意: 迭代器对象一定是可迭代对象,而可迭代对象不一定是迭代器对象
三 迭代器对象的使用
dic={'a':1,'b':2,'c':3} iter_dic=dic.__iter__() #得到迭代器对象,迭代器对象即有__iter__又有__next__,但是:迭代器.__iter__()得到的仍然是迭代器本身 iter_dic.__iter__() is iter_dic #True print(iter_dic.__next__()) #等同于next(iter_dic) print(iter_dic.__next__()) #等同于next(iter_dic) print(iter_dic.__next__()) #等同于next(iter_dic) # print(iter_dic.__next__()) #抛出异常StopIteration,或者说结束标志 #有了迭代器,我们就可以不依赖索引迭代取值了 iter_dic=dic.__iter__() while 1: try: k=next(iter_dic) print(dic[k]) except StopIteration: break #这么写太丑陋了,需要我们自己捕捉异常,控制next,python这么牛逼,能不能帮我解决呢?能,请看for循环
四 for循环
#基于for循环,我们可以完全不再依赖索引去取值了 dic={'a':1,'b':2,'c':3} for k in dic: print(dic[k]) #for循环的工作原理 #1:执行in后对象的dic.__iter__()方法,得到一个迭代器对象iter_dic #2: 执行next(iter_dic),将得到的值赋值给k,然后执行循环体代码 #3: 重复过程2,直到捕捉到异常StopIteration,结束循环
五 迭代器的优缺点
#优点: - 提供一种统一的、不依赖于索引的迭代方式 - 惰性计算,节省内存 #缺点: - 无法获取长度(只有在next完毕才知道到底有几个值) - 一次性的,只能往后走,不能往前退
说明:
for循环可用于任何可迭代对象
for循环开始时,会通过迭代协议传输给iter()内置函数,从而能够从迭代对象中获得一个迭代器,返回的对象含有需要的next()方法。
六 生成器,生成器表达式和列表解析
什么是生成器?
- 可以理解为一种数据类型,这种数据类型自动实现了迭代器协议(其他数据类型需要调用自己内置的__iter__方法),所以生成器就是可迭代对象;
生成器分类及在python中的表现形式:(python中有两种不同的方式提供生成器)
- 生成器函数:常规函数定义,但是使用yield语句而不是使用retum语句返回结果,yield语句一次返回一个结果,在每个结果中间挂机函数的状态,以便下次从他离开的地方执行;
- 生成器表达式:类似于列表推导,但是生成器返回按需要产生结果的一个对象,而不是一次构建一个列表;
#生成器函数(只要函数内部包含有yield关键字,那么函数名()的到的结果就是生成器,并且不会执行函数内部代码) cp = [1,2,3,4,5] def test(): yield 1 yield 2 yield 3 date = test() print(next(date)) print(next(date)) print(next(date))
生成器表达式:
#三元表达式 name = "lw" res = "sb" if name == "lw" else "帅哥" print(res) egg1 = ["鸡蛋 %s" %i for i in range(10) if i > 5 ] print(egg1) #正常列表(在内存中存储) egg_list = [] for i in range(10): egg_list.append("鸡蛋 %s" %i) print(egg_list) #列表解析(在内存中存储) egg = ["鸡蛋 %s" %i for i in range(10)] print(egg) #生成器表达式(基于迭代器协议转换成可迭代对象,不占内存) laomuji = ("鸡蛋 %s" %i for i in range(10)) print(laomuji) #<generator object <genexpr> at 0x000001A6F46231A8> print(laomuji.__next__()) #等于next(laomuji)
生成器的优点
- python使用生成器对延迟操作提供了支持,所谓延迟操作,是指在需要的时候产生结果,而不是立即产生结果,这就是生成器的主要好处;
生成器小结
- 是可迭代对象;
- 实现了延迟计算,省内存;
- 生成器本质和其他数据类型一样,都实现了迭代协议,只不过生成器附加了一个延迟计算省内存的好处,其余的可迭代对象没有这点好处;
#三元表达式 name = "lw" res = "sb" if name == "lw" else "帅哥" print(res)
总结:
- 把列表解析的[]换成()得到的就是生成器表达式;
- 列表解析与生成器表达式都是一种便利的变成方式,只不过生成器表达式更省内存;
- python不但使用迭代器协议,让for循环变得更加通用。大部分内置函数也是使用迭代器协议访问对象的,例如:sum函数是python的内置函数,该函数使用迭代器内部协议访问对象,而生成器实现了迭代器协议,所以我们可以直接这样计算一系列值得和;
print(sum(i ** 2 for i in range(3)))
- 而不用多此一举的构建一个列表
print(sum([i ** 2 for i in range(3)]))