自学Python之路-Python基础+模块+面向对象
自学Python之路-Python网络编程
自学Python之路-Python并发编程+数据库+前端
自学Python之路-django
自学Python4.6 - 迭代器
之前所讲的可以使用for循环:
- list
- dic
- str
- set
- tuple
- f = open()
- range()
- enumerate 枚举
print(dir([])) 告诉我们列表拥有的所有方法 , 其中有双下划线的为双下方法
print(dir("")) 告诉我们字符串拥有的所有方法
print([1].__add__([2])) print([1]+[2]) # 同以上,python内部算法执行就是_add_
迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。
迭代器只能往前不会后退,不过这也没什么, 因为人们很少在迭代途中往后退。
另外,迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。
迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件(cat就是迭代器形式,读一行显示一行)
特点:
- 访问者不需要关心迭代器内部的结构,仅需通过_nex_t()方法不断去取下一个内容;
- 不能随机访问集合中的某个值 ,只能从头到尾依次访问,且只能取所有数据取一次;
- 访问到一半时不能往回退;
- 便于循环比较大的数据集合,节省内存空间
(迭代器并不会在内存中占用一大块内存,而是随着循坏每次生成一个,每次_next_()每次提供一个)
1. 生成一个迭代器(在Python3.0中)
others = iter(['carlos','gary','tong','rain']) #iter代表生成的是个迭代器 print(others) #输出结果为<list_iterator object at 0x01E96650>表示为迭代器 print(others.__next__()) print(others.__next__()) print(others.__next__()) print(others.__next__()) # 迭代器只有4个元素,如果超过迭代器元素的数量继续迭代的话,它会自动返回“StopIteration”的信息
输出:
carlos
gary
tong
rain
2. for在iter迭代器中的实例(利用for 循环取出iter中每个元素)
obj = iter([11,22,33,44,55,66,77,88,99,90]) for n in obj: #利用for 循环取出iter中每个元素。 print(n)
输出:
11
22
33
44
55
66
77
88
99
90
3. 迭代器的循环可以避开索引,但有时候需要索引来进行一些操作。内建函数enumerate,它能在iter函数的结果前加上索引,以元组返回。
obj =iter(['carlos','gary','jack','rain']) for i in enumerate(obj): print(i)
输出:
(0, 'carlos')
(1, 'gary')
(2, 'jack')
(3, 'rain')
4. while 在iter函数中应用
obj = iter([11,22,33,44,55,66,77,88,99,90]) while True: #while循环的话判断为真,赋一个变量。然后把每次通过obj.__next__()的结果赋值给变量打印出来。当循环超过iter中的值后条件就为Talse,那么就会报StopIteration的错误 val = obj.__next__() print(val)
输出:
11
22
33
44
55
66
77
88
99
90
Traceback (most recent call last):
File "D:/PyCharm Community Edition 2016.3.2/aaaa.py", line 20, in <module>
val = obj.__next__()
StopIteration
5. 分析迭代器内存开销
#把文件一次加载到内存中,然后逐行打印。当文件很大时,这个方法的内存开销就很大了 * / for line in open("test.txt").readlines(): print line #这是最简单也是运行速度最快的写法,他并没显式的读取文件,而是利用迭代器每次读取下一行 * / for line in open("test.txt"): # use file iterators print line
补充:
- 迭代器双下方法 : 很少直接调用的方法。一般情况下,是通过其他语法触发的;
- 可迭代协议:只要含有有__iter__的方法 '__iter__' in dir(数据)都是可迭代的;
- 迭代器协议: 只要内部含有__iter__和__next__方法就是迭代器协议;
- 迭代器一定可迭代,可迭代的通过调用._iter_()方法就能得到一个迭代器;
- 迭代器中的_next_()方法可以一个一个的获取值;
- 可迭代的一定可以被for循环(for循环其实就是在使用迭代器)。