zoukankan      html  css  js  c++  java
  • 关于对生成器对象的理解

    Python的for语句循环本质上就是通过调用Iterable可迭代对象的__iter()__方法获得一个Iterator迭代器对象,然后不断调用Iterator迭代器对象__next()__方法实现的。Iterator迭代器对象则是一个需要实现__iter__()和__next__()两个迭代器协议方法的对象。python中生成器提供了一种方便的方法来实现迭代器协议,而不需要必须实现__iter__()和__next__()两个迭代器协议方法。
    
    生成器的定义方式有两种,一种是调用生成器函数,一种是使用生成器表达式语法。
    • 调用生成器函数

      生成器函数是指在函数体中使用yield表达式仅返回结果的函数。yield表达式仅在定义生成器函数时使用,因此只能用在函数定义的主体中。在函数体中使用yield表达式会使该函数成为生成器函数。当生成器函数被调用时,它返回一个称为生成器的迭代器,该迭代器由python自动生成。然后,生成器控制了生成器函数的执行。因为返回的生成器是一个迭代器,所以生成器函数的执行结果也就可以被循环。当生成器的的__next__方法被调用时,生成器函数的函数体内的语句开始执行,执行进行到第一个yield表达式时,立即将yield表达式的结果返回给生成器的调用者,同时将生成器函数内部的状态挂起。即保持生成器函数的执行进度,和生成器函数内的局部状态:包括局部变量的当前绑定,指令指针,内部计算栈和任何异常处理的状态。当生成器的再次调用__next__方法来时,生成器函数恢复执行,并再次执行到yield表达式返回结果再保持状态,直到无法再执行到yield表达式。此时生成器自动抛出StopIteration异常。
      我们先定义一个简单生成器函数,函数功能返回数字0-9的平方数
    # 生成器函数,功能返回数字0-9的平方数
    >>> def squares():
            for i in range(10):
                yield i**2
    
    # 使用return关键字是普通函数,使用yield关键字函数变成了生成器函数
    >>> g = squares()
    
    #查看squares对象类型
    >>> squares
    <function squares at 0x035950C0>
    
    #查看g对象类型
    >>> g
    <generator object squares at 0x0358A930>
    从上面可以看出变量squares是函数类型,变量g是generator类型对象,generator从字面的理解上就是生成器类型。根据上一节迭代器中提到的知识,从collection模块引入Iterator的抽象基类,验证下generator类型是不是上面说的迭代器类型。
    >>> from collections import Iterator
    >>> isinstance(g,Iterator)
    True
    验证成功,说明生成器函数的执行结果确实是生成器,一种特殊的迭代器。
    >>> for i in g:
            print (i)
    
    0
    1
    4
    9
    16
    25
    36
    49
    64
    81
    • 生成器表达式

       除了使用生成器函数可以得到生成器,还可以生成器表达式得到生成器表达式。生成器表达式本身看起来像列表推到, 但不是用方括号而是用圆括号包围起来:
    >>> g2 = (x**2 for x in range(10))
    >>> g2
    <generator object <genexpr> at 0x0359AFC0>
    
    >>> t = (1,2,3,4,5)
    >>> g3 = (x**2 for x in t)
    >>> g3
    <generator object <genexpr> at 0x007F6180>
    # 验证
    >>> isinstance(g2,Iterator)
    True
    >>> isinstance(g3,Iterator)
    True
    
    #使用
    >>> for i in g2:
            print(i)
    
    0
    1
    4
    9
    16
    25
    36
    49
    64
    81
    
    >>> for i in g3:
            print(i)
    
    1
    4
    9
    16
    25
    和普通迭代器相比,生成器不单简化了迭代器的定义,还在使用效率上有提升。因为生成器在循环时,生成器函数每次只会返回一个结果,然后保持内部状态,所以生成器占用的内存是很小的。以下两个测试结果,第一个直接抛出MemoryError异常,第二个只能正确计算出结果。
    # 全部数据先加载在1个列表上面,内存占用高
    >>> s1 = sum([i for i in range(100000000)])
    Traceback (most recent call last):
      File "<pyshell#6>", line 1, in <module>
        s1 = sum([i for i in range(100000000)])
      File "<pyshell#6>", line 1, in <listcomp>
        s1 = sum([i for i in range(100000000)])
    MemoryError
    
    # 数据几乎不占内存
    >>> s2 = sum((i for i in range(100000000)))
    >>> s2
    4999999950000000
  • 相关阅读:
    php中的int参数
    php中parse_url函数的源码及分析
    记一次对python反弹shell的分析
    系统管理常用命令
    Linux内核参数注释与优化
    常见/dev/mapper/centos-root扩容
    使用Hbase快照将数据输出到互联网区测试环境的临时Hbase集群
    Postgres安装详解
    CentOS6.5生产环境系统安装
    Kafka跨网络访问设置
  • 原文地址:https://www.cnblogs.com/daofaziran/p/12179059.html
Copyright © 2011-2022 走看看