迭代器
迭代是Python最强大的功能之一,是访问集合元素的一种方式。
迭代器是一个可以记住遍历的位置的对象。
迭代器对象从集合等第一个元素开始访问,直到所有的元素被访问结束,迭代器只能往前不会后退。
迭代器有两个基本的方法:iter()和next()
字符串,列表或元组对象都可以用于创建迭代器。
迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件
特点:
- 访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容
- 不能随机访问集合中的某个值 ,只能从头到尾依次访问
- 访问到一半时不能往回退
- 便于循环比较大的数据集合,节省内存
>>> list = [1,2,3,4] >>> it = iter(list) # 创建迭代器对象 >>> print(next(it)) # 输出迭代器的下一个元素 1 >>> print(next(it)) 2
迭代器对象可以使用常规for语句进行遍历:
list=[1,2,3,4] it = iter(list) # 创建迭代器对象 for x in it: print (x)
执行以上程序,输出结果如下:
1 2 3 4
也可以使用 next() 函数:
import sys # 引入 sys 模块 list=[1,2,3,4] it = iter(list) # 创建迭代器对象 while True: try: print (next(it)) except StopIteration: sys.exit()
执行以上程序,输出结果如下:
1 2 3 4
凡是能够用for循环遍历的数据结构和对象统统可以称为可迭代的,即Iterable。我们现在接触到Iterable数据结构有list、tuple、dict、string、set,还有生成器generator(下面将讲到)。
但是,他们之间有什么区别呢?generator不但可以使用for循环,还可以被next()
函数不断调用并返回下一个值,直到返回StopIteration
错误。
能够被next()
函数不断调用并返回下一个值的对象称为迭代器Iterator。generator是Iterable,同时也是一个Iterator;而list、tuple、str、dict不是Iterator。
当然,可以通过isinstance()
判断一个对象是否为Iterator。
>>> from collections import Iterator >>> isinstance((x*x for x in range(10)), Iterator) True >>> isinstance([],Iterator) False >>> isinstance({},Iterator) False >>> isinstance("ABC",Iterator) False
如果想让list、tuple、str、dict等Iterable对象转变成Iterator,用iter()函数能够让Iterable对象变为Iterator
>>> isinstance(iter("ABC"),Iterator) True >>> i = iter("ABC") >>> next(i) 'A' >>> next(i) 'B' >>> next(i) 'C'
Iterable和Iterator对象到底有什么区别呢?
实际上,python中Iterator对象表示的是一个数据流,Iterator对象可以被next()函数不断调用返回下一个值,直到数据全部被返回。Iterator对象数据流可以被看作是一个序列,但是这个序列的长度是不可提前预知的,因为只能通过next()或者for循环按照需要调用下一个数据,所以Iterator对象的计算是一种惰性计算。
正是因为这样的特性,Iterator可以表示一个无限大的数据流,譬如全体自然数,而list是无法完成这样的任务的。
列表生成式
在讲到生成器之前我们先来讲一下列表生成式
列表生成式,顾名思义,就是用来生成列表的。以前我们生成列表的时候,一般都是先定义一个list = [] ,再用for循环将元素一个一个append到list中。
简单列表的生成,可以使用list(range(1,100)),那么如果需要生成[1*1,2*2,3*3....]呢?
>>> [x*x for x in range(10)] [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
同时,还可以添加一些更多的要素,判断使用符合要求的x参与计算。
>>> [x*x for x in range(10) if x%2==0] [0, 4, 16, 36, 64]
使用多重循环还可以生成全排列
>>> [x+y for x in 'ABC' for y in 'LMN'] ['AL', 'AM', 'AN', 'BL', 'BM', 'BN', 'CL', 'CM', 'CN'] >>> >>> [x+y+z for x in 'ABC' for y in 'LMN' for z in 'OPQ' if z=='Q'] ['ALQ', 'AMQ', 'ANQ', 'BLQ', 'BMQ', 'BNQ', 'CLQ', 'CMQ', 'CNQ']
生成器
通过列表生成器,我们可以创造一个列表。但是,受到内存容量的限制,列表的容量肯定是有限的,如若我们只需要使用列表中的一部分,就不需要一下子生成很大的列表,直接按需生成就好了,列表生成器就提供了这样的功能。
生成器相当于是一个生成列表元素的算法,有了这个算法,就不用一下子生成很多元素了,只需要在需要的时候生成就可以了,节省了很多空间。在Python中,这种一边循环一遍计算的机制,称为:generator。
创建一个generator只需要把列表生成器的[]改成()就可以了。
>>> [x*x for x in range(10)] [0, 1, 4, 9, 16, 25, 36, 49, 64, 81] >>> (x*x for x in range(10)) <generator object <genexpr> at 0x00000259A50BD308>
获取generator里面的元素,可以使用next()函数生成generator的下一个元素。
>>> g=(x*x for x in range(10)) >>> next(g) 0 >>> next(g) 1 >>> next(g) 4 . . . >>> next(g) 81 >>> next(g) Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
一直调用next()函数就可以遍历generator的所有元素,直到抛出StopIteration错误。
但是最常用的当然还是for循环,毕竟generator也是Iterator的对象。
>>> g=(x*x for x in range(5)) >>> for element in g: ... print(element) ... 0 1 4 9 16
一般我们创建一个generator后,基本上不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。
有时候,推算元素的算法很复杂,并不能通过列表生成器实现,而需要通过函数打印出来,譬如菲波那切数列。
#!/usr/bin/env python def fib(Max): n = 0 a,b = 0,1 while n < Max: print(b) a,b = b,a+b n = n + 1 fib(5) 结果: 1 1 2 3 5
在Python中,使用了yield的函数被称为生成器(generator)。
跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。
在调用生成器运行的过程中,每次遇到yield时函数会暂停并保存当前所有灯运行信息,返回yield的值。并在下一次执行next()方法时从当前位置继续运行。
#!/usr/bin/env python def fib(Max): n = 0 a,b = 0,1 while n < Max: yield b a,b = b,a+b n = n + 1 g = fib(5) print(next(g)) print(next(g)) for i in g: print(i) 结果: 1 1 2 3 5
在函数的执行过程中,遇到return才会返回,但是变成了generator的函数,遇到了yield就会中断,并且返回yield的参数。
那么,遇到了yield就会中断并返回,我们能不能通过yield传一些参数进去呢?
#!/usr/bin/env python def fib(Max): n = 0 a,b = 0,1 while n < Max: e = yield b print(e) a,b = b,a+b n = n + 1 g = fib(5) print(next(g)) print(next(g)) print(g.send("the third element")) print(g.send("forth")) 结果: 1 None 1 the third element 2 forth 3
在上面的generator定义中,使用了e = yield b语句,这样遇到yield返回b的同时,还能够通过g.send(arg)传入一个参数赋值给e,这样,就可以通过generator进行参数传递了。
>>> def fib(Max): ... n = 0 ... a,b = 0,1 ... while n < Max: ... e = yield b ... print(e) ... a,b = b,a+b ... n = n + 1 ... >>> g = fib(5) >>> g.send("the first element") Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: can't send non-None value to a just-started generator >>> g.send(None) 1
注意,看上面的代码,为什么会报错?说明启动一个generator的时候,只能传入None作为参数,而generator就相当于next(g)!
2.装饰器
原则:
1、不能修改被装饰函数的源代码。
2、不能修改被装饰函数的调用方式。
3、不能改变被装饰函数的执行结果。
装饰器对被装饰函数是透明的。
如何理解装饰器
1、函数即“变量”
2、高阶函数
a:把一个函数名作为实参传递给另外一个函数
b:返回值中包含函数名
3、嵌套函数
在一个函数体内声明另一个函数称为函数的嵌套
参考链接:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014318435599930270c0381a3b44db991cd6d858064ac0000
装饰器(decorator)是一种高级的Python语法。装饰器可以对一个函数,方法或者类加工。
由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数。
>>> def now(): ... print('2017-05-01') ... >>> f = now >>> f() 2017-05-01
函数对象有一个__name__属性,可以拿到函数的名字:
>>> now.__name__ 'now' >>> f.__name__ 'now'
现在,假设我们要增强now()函数的功能。比如,在函数调用前后自动打印日志,但是又不希望修改now()函数的定义,这种在代码运行期间动态增加功能的方式,就称之为:装饰器(decorator)。
本质上,decorator就是一个返回函数的高阶函数。所以,我们要定义一个能打印日志的decorator,可以定义如下:
def log(func): def wrapper(*args, **kwargs): print("call %s():" % func.__name__) return func(*args, **kwargs) return wrapper
观察上面的log,因为它是一个decorator,所以接受一个函数作为参数,并返回一个函数。我们要借助Python的@语法,吧decorator置于函数的定义处:
@log # 把这句放在这儿就相当于执行了 now = log(now) def now(): print("2017-05-01")
调用now()函数,不仅会运行now()函数本身,还会运行now()函数前打印一行日志:
>>> now() call now(): 2017-05-01
把@log放在now()函数的定义处,就相当于执行了语句:
now = log( now )
由于log()是一个decorator,返回一个函数,所以,原来的now()函数仍然存在,只是现在同名的now变量指向了新的函数,于是调用now()将执行新函数,即在log()函数中返回的wrapper()函数。
如果decorator本身需要传入参数,那就需要编写一个返回decorator的高阶函数,写出来会更复杂。比如,要自定义log的文本:
>>> def log(text): ... def decorator(func): ... def wrapper(*args, **kwargs): ... print("%s %s():" % (text, func.__name__)) ... return func(*args, **kwargs) ... return wrapper ... return decorator ... >>> @log("execute") ... def now(): ... print("2017-05-01") ... >>> now() execute now(): 2017-05-01
和两层嵌套的decorator相比,3层嵌套的效果是这样的:
>>> now = log("execute")(now)
我们来剖析上面的语句,首先执行log('execute'),返回的是的decorator函数,在调用返回的函数,参数是now函数,返回值最终是wrapper函数。
以上两种decorator的定义都没有问题,但还差最后一步。因为我们讲了函数也是对象。它有__name__等属性,但你去看经过decorator装饰之后的函数,它们的__name__已经从原来的'now'变成了'wrapper':
>>> now.__name__ 'wrapper'
因为返回的那个wrapper()函数名字就是'wrapper',所以,需要把原始函数的__name__等属性复制到wrapper()函数中,否则,有些依赖函数签名的代码执行就会出错。
不需要编写wrapper.__name__ = func.__name__这样的代码,Python内置的functools.wraps就是干这个事的,所以,一个完整的decorator的写法如下:
import functools def log(func): @functools.wraps(func) def wrapper(*args, **kw): print('call %s():' % func.__name__) return func(*args, **kw) return wrapper @log("execute") def now(): print("2017-05-01") now()
或者针对带参数的decorator:
import functools def log(text): def decorator(func): @functools.wraps(func) def wrapper(*args, **kwargs): print("%s %s():" % (text, func.__name__)) return func(*args, **kwargs) return wrapper return decorator @log("execute") def now(): print("2017-05-01") now()