zoukankan      html  css  js  c++  java
  • python简单笔记

    迭代器

    迭代是Python最强大的功能之一,是访问集合元素的一种方式。

    迭代器是一个可以记住遍历的位置的对象。

    迭代器对象从集合等第一个元素开始访问,直到所有的元素被访问结束,迭代器只能往前不会后退。

    迭代器有两个基本的方法:iter()next()

    字符串,列表或元组对象都可以用于创建迭代器。

    迭代器的一大优点是不要求事先准备好整个迭代过程中所有的元素。迭代器仅仅在迭代到某个元素时才计算该元素,而在这之前或之后,元素可以不存在或者被销毁。这个特点使得它特别适合用于遍历一些巨大的或是无限的集合,比如几个G的文件

    特点:

    1. 访问者不需要关心迭代器内部的结构,仅需通过next()方法不断去取下一个内容
    2. 不能随机访问集合中的某个值 ,只能从头到尾依次访问
    3. 访问到一半时不能往回退
    4. 便于循环比较大的数据集合,节省内存
    >>> list = [1,2,3,4]
    >>> it = iter(list)  # 创建迭代器对象
    >>> print(next(it))  # 输出迭代器的下一个元素
    1
    >>> print(next(it))
    2

    迭代器对象可以使用常规for语句进行遍历:

    list=[1,2,3,4]
    it = iter(list)    # 创建迭代器对象
    for x in it:
        print (x)

    执行以上程序,输出结果如下:

    1
    2
    3
    4

    也可以使用 next() 函数:

    复制代码
    import sys         # 引入 sys 模块
    
    list=[1,2,3,4]
    it = iter(list)    # 创建迭代器对象
    
    while True:
        try:
            print (next(it))
        except StopIteration:
            sys.exit()
    复制代码

    执行以上程序,输出结果如下:

    1
    2
    3
    4

    凡是能够用for循环遍历的数据结构和对象统统可以称为可迭代的,即Iterable。我们现在接触到Iterable数据结构有list、tuple、dict、string、set,还有生成器generator(下面将讲到)。

    但是,他们之间有什么区别呢?generator不但可以使用for循环,还可以被next()函数不断调用并返回下一个值,直到返回StopIteration错误。

    能够被next()函数不断调用并返回下一个值的对象称为迭代器Iterator。generator是Iterable,同时也是一个Iterator;而list、tuple、str、dict不是Iterator。

    当然,可以通过isinstance()判断一个对象是否为Iterator。

    复制代码
    >>> from collections import Iterator
    >>> isinstance((x*x for x in range(10)), Iterator)
    True
    >>> isinstance([],Iterator)
    False
    >>> isinstance({},Iterator)
    False
    >>> isinstance("ABC",Iterator)
    False
    复制代码

    如果想让list、tuple、str、dict等Iterable对象转变成Iterator,用iter()函数能够让Iterable对象变为Iterator

    复制代码
    >>> isinstance(iter("ABC"),Iterator)
    True
    >>> i = iter("ABC")
    >>> next(i)
    'A'
    >>> next(i)
    'B'
    >>> next(i)
    'C'
    复制代码

    Iterable和Iterator对象到底有什么区别呢?

    实际上,python中Iterator对象表示的是一个数据流,Iterator对象可以被next()函数不断调用返回下一个值,直到数据全部被返回。Iterator对象数据流可以被看作是一个序列,但是这个序列的长度是不可提前预知的,因为只能通过next()或者for循环按照需要调用下一个数据,所以Iterator对象的计算是一种惰性计算。

    正是因为这样的特性,Iterator可以表示一个无限大的数据流,譬如全体自然数,而list是无法完成这样的任务的。

    列表生成式

    在讲到生成器之前我们先来讲一下列表生成式

    列表生成式,顾名思义,就是用来生成列表的。以前我们生成列表的时候,一般都是先定义一个list = [] ,再用for循环将元素一个一个append到list中。

    简单列表的生成,可以使用list(range(1,100)),那么如果需要生成[1*1,2*2,3*3....]呢?

    >>> [x*x for x in range(10)]
    [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

    同时,还可以添加一些更多的要素,判断使用符合要求的x参与计算。

    >>> [x*x for x in range(10) if x%2==0]
    [0, 4, 16, 36, 64]

    使用多重循环还可以生成全排列

    >>> [x+y for x in 'ABC' for y in 'LMN']
    ['AL', 'AM', 'AN', 'BL', 'BM', 'BN', 'CL', 'CM', 'CN']
    >>>
    >>> [x+y+z for x in 'ABC' for y in 'LMN' for z in 'OPQ' if z=='Q']
    ['ALQ', 'AMQ', 'ANQ', 'BLQ', 'BMQ', 'BNQ', 'CLQ', 'CMQ', 'CNQ']

    生成器

    通过列表生成器,我们可以创造一个列表。但是,受到内存容量的限制,列表的容量肯定是有限的,如若我们只需要使用列表中的一部分,就不需要一下子生成很大的列表,直接按需生成就好了,列表生成器就提供了这样的功能。

    生成器相当于是一个生成列表元素的算法,有了这个算法,就不用一下子生成很多元素了,只需要在需要的时候生成就可以了,节省了很多空间。在Python中,这种一边循环一遍计算的机制,称为:generator。

    创建一个generator只需要把列表生成器的[]改成()就可以了。

    >>> [x*x for x in range(10)]
    [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
    >>> (x*x for x in range(10))
    <generator object <genexpr> at 0x00000259A50BD308>

    获取generator里面的元素,可以使用next()函数生成generator的下一个元素。

    复制代码
    >>> g=(x*x for x in range(10))
    >>> next(g)
    0
    >>> next(g)
    1
    >>> next(g)
    4
    .
    .
    .
    >>> next(g)
    81
    >>> next(g)
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    StopIteration
    复制代码

    一直调用next()函数就可以遍历generator的所有元素,直到抛出StopIteration错误。

    但是最常用的当然还是for循环,毕竟generator也是Iterator的对象。

    复制代码
    >>> g=(x*x for x in range(5))
    >>> for element in g:
    ...     print(element)
    ...
    0
    1
    4
    9
    16
    复制代码

    一般我们创建一个generator后,基本上不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。

    有时候,推算元素的算法很复杂,并不能通过列表生成器实现,而需要通过函数打印出来,譬如菲波那切数列。

    复制代码
    #!/usr/bin/env python
    
    def fib(Max):
        n = 0
        a,b = 0,1
        while n < Max:
            print(b)
            a,b = b,a+b
            n = n + 1
    
    fib(5)
    
    结果:
    1
    1
    2
    3
    5
    复制代码

    在Python中,使用了yield的函数被称为生成器(generator)。

    跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。

    在调用生成器运行的过程中,每次遇到yield时函数会暂停并保存当前所有灯运行信息,返回yield的值。并在下一次执行next()方法时从当前位置继续运行。

    复制代码
    #!/usr/bin/env python
    
    def fib(Max):
        n = 0
        a,b = 0,1
        while n < Max:
            yield b
            a,b = b,a+b
            n = n + 1
    
    g = fib(5)
    print(next(g))
    print(next(g))
    for i in g:
        print(i)
    
    结果:
    1
    1
    2
    3
    5
    复制代码

    在函数的执行过程中,遇到return才会返回,但是变成了generator的函数,遇到了yield就会中断,并且返回yield的参数。

    那么,遇到了yield就会中断并返回,我们能不能通过yield传一些参数进去呢?

    复制代码
    #!/usr/bin/env python
    
    def fib(Max):
        n = 0
        a,b = 0,1
        while n < Max:
            e = yield b
            print(e)
            a,b = b,a+b
            n = n + 1
    
    g = fib(5)
    print(next(g))
    print(next(g))
    print(g.send("the third element"))
    print(g.send("forth"))
    
    结果:
    1
    None
    1
    the third element
    2
    forth
    3
    复制代码

    在上面的generator定义中,使用了e = yield b语句,这样遇到yield返回b的同时,还能够通过g.send(arg)传入一个参数赋值给e,这样,就可以通过generator进行参数传递了。

    复制代码
    >>> def fib(Max):
    ...     n = 0
    ...     a,b = 0,1
    ...     while n < Max:
    ...         e = yield b
    ...         print(e)
    ...         a,b = b,a+b
    ...         n = n + 1
    ...
    >>> g = fib(5)
    >>> g.send("the first element")
    Traceback (most recent call last):
      File "<stdin>", line 1, in <module>
    TypeError: can't send non-None value to a just-started generator
    >>> g.send(None)
    1
    复制代码

    注意,看上面的代码,为什么会报错?说明启动一个generator的时候,只能传入None作为参数,而generator就相当于next(g)!

    2.装饰器

    原则:
    1、不能修改被装饰函数的源代码。
    2、不能修改被装饰函数的调用方式。
    3、不能改变被装饰函数的执行结果。
    装饰器对被装饰函数是透明的。

    如何理解装饰器
    1、函数即“变量”
    2、高阶函数
    a:把一个函数名作为实参传递给另外一个函数
    b:返回值中包含函数名
    3、嵌套函数
    在一个函数体内声明另一个函数称为函数的嵌套

    参考链接:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014318435599930270c0381a3b44db991cd6d858064ac0000

    装饰器(decorator)是一种高级的Python语法。装饰器可以对一个函数,方法或者类加工。

    由于函数也是一个对象,而且函数对象可以被赋值给变量,所以,通过变量也能调用该函数。

    >>> def now():
    ...     print('2017-05-01')
    ...
    >>> f = now
    >>> f()
    2017-05-01

    函数对象有一个__name__属性,可以拿到函数的名字:

    >>> now.__name__
    'now'
    >>> f.__name__
    'now'

    现在,假设我们要增强now()函数的功能。比如,在函数调用前后自动打印日志,但是又不希望修改now()函数的定义,这种在代码运行期间动态增加功能的方式,就称之为:装饰器(decorator)。

    本质上,decorator就是一个返回函数的高阶函数。所以,我们要定义一个能打印日志的decorator,可以定义如下:

    def log(func):
        def wrapper(*args, **kwargs):
            print("call %s():" % func.__name__)
            return func(*args, **kwargs)
        return wrapper

    观察上面的log,因为它是一个decorator,所以接受一个函数作为参数,并返回一个函数。我们要借助Python的@语法,吧decorator置于函数的定义处:

    @log  # 把这句放在这儿就相当于执行了 now = log(now)
    def now():
        print("2017-05-01")

    调用now()函数,不仅会运行now()函数本身,还会运行now()函数前打印一行日志:

    >>> now()
    call now():
    2017-05-01

    把@log放在now()函数的定义处,就相当于执行了语句:

    now = log( now )

    由于log()是一个decorator,返回一个函数,所以,原来的now()函数仍然存在,只是现在同名的now变量指向了新的函数,于是调用now()将执行新函数,即在log()函数中返回的wrapper()函数。

    如果decorator本身需要传入参数,那就需要编写一个返回decorator的高阶函数,写出来会更复杂。比如,要自定义log的文本:

    复制代码
    >>> def log(text):
    ...     def decorator(func):
    ...         def wrapper(*args, **kwargs):
    ...             print("%s %s():" % (text, func.__name__))
    ...             return func(*args, **kwargs)
    ...         return wrapper
    ...     return decorator
    ...
    >>> @log("execute")
    ... def now():
    ...     print("2017-05-01")
    ...
    >>> now()
    execute now():
    2017-05-01
    复制代码

    和两层嵌套的decorator相比,3层嵌套的效果是这样的:

    >>> now = log("execute")(now)

    我们来剖析上面的语句,首先执行log('execute'),返回的是的decorator函数,在调用返回的函数,参数是now函数,返回值最终是wrapper函数。

    以上两种decorator的定义都没有问题,但还差最后一步。因为我们讲了函数也是对象。它有__name__等属性,但你去看经过decorator装饰之后的函数,它们的__name__已经从原来的'now'变成了'wrapper':

    >>> now.__name__
    'wrapper'

    因为返回的那个wrapper()函数名字就是'wrapper',所以,需要把原始函数的__name__等属性复制到wrapper()函数中,否则,有些依赖函数签名的代码执行就会出错。

    不需要编写wrapper.__name__ = func.__name__这样的代码,Python内置的functools.wraps就是干这个事的,所以,一个完整的decorator的写法如下:

    复制代码
    import functools
    
    def log(func):
        @functools.wraps(func)
        def wrapper(*args, **kw):
            print('call %s():' % func.__name__)
            return func(*args, **kw)
        return wrapper
    
    @log("execute")
    def now():
        print("2017-05-01")
    
    now()
    复制代码

    或者针对带参数的decorator:

    复制代码
    import functools
    
    def log(text):
        def decorator(func):
            @functools.wraps(func)
            def wrapper(*args, **kwargs):
                print("%s %s():" % (text, func.__name__))
                return func(*args, **kwargs)
            return wrapper
        return decorator
    
    @log("execute")
    def now():
        print("2017-05-01")
    
    now()
  • 相关阅读:
    爬虫基础 2.1 http原理
    爬虫基础 2.1 http原理
    3.29上午
    3.28
    3.27下午
    3.27上午
    3.24上午
    3.23下午
    3.23上午
    3.22上午
  • 原文地址:https://www.cnblogs.com/zhisy/p/6832326.html
Copyright © 2011-2022 走看看