一、可迭代对象和迭代器的区别
可迭代对象(Iterable):是实现了__iter__()方法的对象,当调用__iter__()可以返回一个迭代器对象。所有可以被for循环迭代的都是可迭代对象
可以通过isinstance()判断是不是可迭代对象。常见的可迭代对象如下:列表、元组、字符串、字典、file、socket
from collections import Iterable print(isinstance([], Iterable)) #True print(isinstance('abc',Iterable)) #True print(isinstance(iter([]),Iterable)) #True print(isinstance(233,Iterable)) #False
迭代器(Iterator):不但实现了__iter__()方法,还实现了__next__()方法。可以通过next()方法不断生产一个下一个元素,直到抛出StopIteration抛出错误。
from collections import Iterator print(isinstance([], Iterator)) #False print(isinstance('abc',Iterator)) #False print(isinstance(iter([]),Iterator)) #True print(isinstance((i for i in range(5)),Iterator)) #True
迭代器的一些限制:
#1、迭代器只能不断取下一个元素,不能返回 #2、迭代器不能直接简单的复制 #3、迭代器超出范围会报错
二、迭代器的生成
ls=[1,2,3] print(type(ls)) #<class 'list'> ls_i=iter(ls) print(type(ls_i)) #<class 'list_iterator'>
我们可以用dir来查看一下,迭代器具有哪些方法:
print(dir(ls_i)) #['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__length_hint__', '__lt__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__setstate__', '__sizeof__', '__str__', '__subclasshook__']
上面的__iter__和__next__就是为了实现迭代器协议而产生的。
下面我们介绍一下迭代器内部的iter()和next()方法: iter()返回迭代器本身。 next()返回迭代器的下一个元素。
ls=[1,2,3] ls_i=iter(ls) #生成迭代器 a=ls_i.__iter__() print(a) print(ls_i) print(a.__next__()) print(a.__next__()) print(ls_i.__next__())
上面代码的运行结果如下:
<list_iterator object at 0x005C16F0> <list_iterator object at 0x005C16F0> 1 2 3
三、自己编写一个迭代器
主要是编写实现iter()和next()方法:
class listIterator(object): def __init__(self,data): self.__data=data self.__count=0 def __iter__(self): return self def __next__(self): if self.__count<len(self.__data): val=self.__data[self.__count] self.__count+=1 return val else: raise StopIteration ls=listIterator([1,2,3]) for i in ls: print(i)
上面这段代码就实现了一个简单的迭代器。其中定义了一个count变量,这个变量的作用就是记录迭代器进行到哪一个元素。我们要知道迭代器是一次性的,我们生成一个元素后,迭代器就会
删除这个元素,所以我们要记录进行到哪一个元素。具体可以看一下上面的代码。下面我们再通过一个例子来进一步加深count的理解。
ls=[1,2,3,4,5] for i in ls: print(i) ls.remove(i) print(ls)
上面的输出如:
1
3
5
[2, 4]
为什么会这样呢。其实for循环的本质就是先调用ls的__iter()__方法把列表变成一个迭代器,然后用next()去生成每个元素。记住count是记录迭代器进行到第几个元素!!
我们来仔细看一下整个函数的运行过程。
count=0 生成1 remove 1 然后ls=[2,3,4,5] count=1 这时候生成的就是3了,因为count是记录列表进行到第几个元素。而不管原来列表有没有发生变化。 所以remove后 ls=[2,4,5] count=2, 输出第三个元素5,然后remove ,最后ls=[2,4] count=3,大于列表长度,直接结束for