zoukankan      html  css  js  c++  java
  • (十二)生成器和生成器函数,推导式和表达式

    . ⽣成器

        什么是⽣成器, ⽣成器实质就是迭代器。python中有三种⽅式来获取⽣成器:

     1. 通过⽣成器函数

       2. 通过各种推导式来实现⽣成器

       3. 通过数据的转换也可以获取⽣成器

     ⾸先, 我们先看⼀个很简单的函数:

    def func():
     	print("111")
     	return 222
    ret = func()
    print(ret)
    结果: 
    111
    222
    

     

     将函数中的return换成yield就是⽣成器。

    def func():
         print("111")
         yield 222
    ret = func()
    print(ret)
    结果: 
    <generator object func at 0x10567ff68>
    

      

      运⾏的结果和上⾯不⼀样. 为什么呢. 由于函数中存在了yield. 那么这个函数就是⼀个⽣成器函数. 这个时候. 我们再执⾏这个函数的时候. 就不再是函数的执⾏了. ⽽是获取这个⽣成器.如何使⽤呢? 想想迭代器. ⽣成器的本质是迭代器. 所以. 我们可以直接执⾏__next__()来执⾏以下⽣成器

    def func():
     	print("111")
     	yield 222
    gener = func() # 这个时候函数不会执⾏. ⽽是获取到⽣成器
    ret = gener.__next__() # 这个时候函数才会执⾏. yield的作⽤和return⼀样. 也是返回
    数据
    print(ret)
    结果: 
    111
    222
    

      

      那么我们可以看到, yieldreturn的效果是⼀样的有什么区别呢? yield是分段来执⾏⼀个函数; return? 直接停⽌执⾏函数当程序运⾏完最后⼀个yield,那么后⾯继续进⾏__next__()程序会报错StopIteration

        yield说了一部分了,那它有什么用呢?假设,某个工厂要为员工做工服,总数是10000套。

    def doCloth():
        lst = []
        for i in range(1,10001):
            lst.append(‘工服%s’ % i)
        return lst    
    

      

           这种方式就是一次把所有的衣服都制作出来了,但是以实际考虑的话,全部做出来,这样有个弊端,这么多衣服不可能一次性全部使用了,那么在存放的过程中,很有可能被老鼠或者虫子咬破了。但是,看一下下面代码:

    def doCloth():
        for i in range(1,10001):
            yield '衣服%s' % i
    g = doCloth()
    print(g.__next__())#衣服1
    print(g.__next__())#衣服2
    print(g.__next__())#衣服3
    

      

         可以看到,我需要一套,我就跟工厂说,给我做一套,这样就避免了自己长期储存了。

      可以看出来,returnyield的区别就是,return会把所有的一次性都做出来,占用很大内存,而yield只有需要的时候才会取一次值,不占用太大内存。还有一点,当函数遇到return时,这个函数就停止了,但是遇到yield,不会停止,还会继续执行下去。

      接下来我们来看send⽅法, send__next__()⼀样都可以让⽣成器执⾏到下⼀个yield. 

    def eat():
        print("我吃什么啊")
        a = yield "馒头"
        print("a=",a)
        b = yield "⼤饼"
        print("b=",b)
        c = yield "⾲菜盒⼦"
        print("c=",c)
        yield "GAME OVER"
    gen = eat() # 获取⽣成器
    ret1 = gen.__next__()
    print(ret1)
    ret2 = gen.send("胡辣汤")
    print(ret2)
    ret3 = gen.send("狗粮")
    print(ret3)
    ret4 = gen.send("猫粮")
    print(ret4)
    

      

            send__next__()区别:

            1. sendnext()都是让⽣成器向下走⼀次

            2. send可以给上⼀个yield的位置传递值, 不能给最后⼀个yield发送值. 在第⼀次执⾏⽣成器代码的时候不能使⽤send()

    ⽣成器可以使⽤for循环来循环获取内部的元素:

    def func():
     	print(111)
     	yield 222
     	print(333)
     	yield 444
     	print(555)
     	yield 666
    gen = func()
    for i in gen:
     	print(i)
    结果:
    111
    222
    333
    444
    555
    666
    

      

    . 列表推导式, ⽣成器表达式以及其他推导式

        1.列表推导式

         列表推导式的结构:[结果 for循环 if条件]

      给出⼀个列表, 通过循环, 向列表中添加1-15 : 

    lst = []
    for i in range(1, 15):
     	lst.append(i)
    print(lst)
     替换成列表推导式: 
    lst = [i for i in range(1, 15)]
    print(lst)
    

      

          列表推导式,把多行代码给简化成了一行,代码看着是简单了,但是这种方式出错后,不易排查,如果没有特别需要或者十足的把握,感觉还是不要用。

          2.生成器表达式

       ⽣成器表达式和列表推导式的语法基本上是⼀样的,只是把[]替换成()

       格式:(结果 for循环 if条件)

    gen = (i for i in range(10))
    print(gen)
    结果: 
    <generator object <genexpr> at 0x106768f10>

      打印的结果就是一个生成器在内存中的地址。我们可以使用for循环来循环这个生成器:

    gen = (i for i in range(10))
    for j in gen:
        print(j)
    

    另一种方式创建一个生成器:

    def fun(arg):
        print(arg)
    fun(i for i in range(10))
    类似的:print(i for i in range(10))

      

      

        3.列表推导式和生成器表达式的对比

      ⽣成器表达式和列表推导式的区别:

         1) 列表推导式比较耗内存. ⼀次性加载. ⽣成器表达式⼏乎不占⽤内存. 使⽤的时候才分、配和使⽤内存

         2) 得到的值不⼀样. 列表推导式得到的是⼀个列表. ⽣成器表达式获取的是⼀个⽣成器.

      ⽣成器的惰性机制: ⽣成器只有在访问的时候才取值。说⽩了你找他要他才给你值,不找他要,他是不会执⾏的。

    def func():
     	print(111)
     	yield 222
    g = func() # ⽣成器g,这里并没有执行括号里的代码
    g1 = (i for i in g) # ⽣成器g1,但是g1的数据来源于g,这里并没有执行括号里的代码
    g2 = (i for i in g1) # ⽣成器g2,数据来源g1,这里并没有执行括号里的代码
    
    print(list(g)) # 获取g中的数据,这时func()才会被执⾏,打印111.获取到222,g完毕。
    print(list(g1)) # 获取g1中中的数据,g1的数据来源是g,但是g已经取完了,g1 也就没有数据了。
    print(list(g2)) # 和g1同理

    #可以运行一下看看结果。

         4.字典推导式

      字典推导式格式 {k:v  for循环 if条件}

         # 把字典中的keyvalue互换

    dic = {'a': 1, 'b': '2'}
    new_dic = {dic[key]: key for key in dic}
    print(new_dic)
    

      

         5.集合推导式

       集合推导式格式 {结果  for 循环  if条件},集合自带去重的效果,而且它里面是没有顺序的。代码:

    lst = [2,2,3,4,'a','d','sd','we','a']
    s = {el for el in lst}
    print(s)
    结果:
    {2, 3, 4, 'we', 'sd', 'd', 'a'}
    

      

        6.yieldfrom

    先看代码:

    lst = [1,2,3]
    def do():
        yield from lst
    g = do()
    print(g.__next__())
    print(g.__next__())
    print(g.__next__())
    
    def do(a):
        for i in lst:
            yield i
    g = do(1)
    print(g.__next__())
    print(g.__next__())
    print(g.__next__())
    

      

    下面代码中也可以看出来from替代了for循环。
    def reader():
        """A generator that fakes a read from a file, socket, etc."""
        for i in range(4):
            yield '<< %s' % i
    #
    # def reader_wrapper(g):
    #     # Manually iterate over data produced by reader
    #     for v in g:
    #         yield v
    
    def reader_wrapper(g):
        yield from g
    
    wrap = reader_wrapper(reader())
    for i in wrap:
        print(i)
    

      

      从上面代码可以看出来,from类似于for循环,又是一个简化代码的方式。

       分析生成器原理很好的一片文章:https://www.jianshu.com/p/98fd8cd0094a

      总结: 推导式有, 列表推导式, 字典推导式, 集合推导式, 没有元组推导式(因为元组不能增删改,只能查看)

         ⽣成器表达式: (结果 for 变量 in 可迭代对象 if 条件筛选)

         ⽣成器表达式可以直接获取到⽣成器对象. ⽣成器对象可以直接进⾏for循环. ⽣成器具有惰性机制.

  • 相关阅读:
    使用vim + cscope/ctags
    python类库32[序列化和反序列化之pickle]
    Perforce2012新特征=20个用户免费+云
    Linux进程的uid和euid
    perl安装模块到自己的home ( install perl module without root)
    Python分布式+云计算
    Linux命令xargs+cut
    python实例32[简单的HttpServer]
    Python转载[编码规范]
    Linux命令lsof
  • 原文地址:https://www.cnblogs.com/asia-yang/p/10103702.html
Copyright © 2011-2022 走看看