zoukankan      html  css  js  c++  java
  • Python并发实践_02_通过yield实现协程

    python中实现并发的方式有很多种,通过多进程并发可以真正利用多核资源,而多线程并发则实现了进程内资源的共享,然而Python中由于GIL的存在,多线程是没有办法真正实现多核资源的。

    对于计算密集型程序,应该使用多进程并发充分利用多核资源,而在IO密集型程序中,多核优势并不明显,甚至由于大多数时间都是在IO堵塞状态,多进程的切换消耗反而让程序效率更加低下。

    而当需要并发处理IO密集型任务时,就需要用到协程(Coroutine)。协程并没有系统级的调度,而是用户级的调度方式,避免了系统调用的开销,虽然协程最终是串行工作,但是却可以实现非常大的并发量。通过多进程+协程的方式,可以有效均衡多核计算和请求等待。

    参考文章:

    https://blog.tonyseek.com/post/event-manage-with-greenlet/

    producer-consumer

    利用yield生成器,可以简单展现协程的工作方式:

    import time
    def consumer():
        print "Ready to receive"
        while True:
            y = (yield )
            time.sleep(1)
            print "Receive %s from producer”%y
    def producer():
        c = consumer()
        c.next()
        i = 1
        while i > 0 and i < 11:
            time.sleep(1)
            print "Send %s to consumer"%i
            c.send(i)
            i += 1
    if __name__ == '__main__':
        producer()

    上述过程展示了基本的生产者-消费者模型,消费者consumer是一个生成器;

    当第一次在producer中调用c.next()时,激活consumer,并且运行到yield时协程(consumer)被挂起,等待生成器被调用next或者send。

    producer进行后续操作,并进入一个循环,每次暂停1s后,向生成器send一个消息,消费者yield获取到该消息,并进行后续的工作。

    可以看到,每次yield都需要等待send传入的消息之后才会继续执行之后的任务。

    通过yield实现协程

    现在要来用yield真正创建一个协程了。

    可以想象这样一个模型,一个工地里有很多相似的任务(jobs),并且会源源不断产生这些任务,工地里有一个工头(foreman)负责,工头为了分配任务给工人(worker),会制定一套流程(pipeline)来方便管理:分配工人,验收工作(accept),由于工人工作(work)的时间远远大于分配任务的时间,将这些工人的工作(简单枯燥的重复劳动)看成IO操作的话,这就是一个IO密集型的任务。下面看看python是如何通过yield来实现协程完成真个工作的:

     1 def main():
     2     foreman(args_of_overall,worker_num)
     3 
     4 def foreman(args_of_overall,worker_num):
     5     pipeline = create_pipeline(args_of_pipeline,worker_num)
     6     for i,job in enumerate(get_jobs(args_of_ceate_jobs)):
     7         worker_id  = i % worker_num
     8         pipeline.send((job,worker_id))
     9 
    10 @coroutine
    11 def worker(pipeline,accepting,job,my_id):
    12     while True:
    13         args_of_job, worker_id = (yield )
    14         if worker_id == my_id:
    15             result = work(args_of_job)
    16             accepting.send(result)
    17         elif pipeline is not None:
    18             pipeline.send((job,worker_id))
    19 
    20 @coroutine
    21 def accept():
    22     while True:
    23         result = (yield )
    24         #do_some_accepting
    25 
    26 def create_pipeline(args_of_pipeline,worker_num):
    27     pipeline = None
    28     accepting = accept()
    29     for work_id in range(work_num):
    30         pipeline = worker(pipeline,accepting,job,work_id)
    31     return pipeline
    32 
    33 def get_jobs(args_of_ceate_jobs):
    34     for job in job_source:
    35         yield job
    36 
    37 def coroutine(func):
    38     def warper(*args):
    39         f = func(*args)
    40         f.next()
    41         return f
    42     return warper
    43 
    44 def work(args_of_job):
    45     pass
    46     #do_some_work
    47 
    48 if __name__ == '__main__':
    49     main()

     上述过程中,工人和验收工作都是协程,而get_jobs()函数是一个生成器,当job是动态添加时,就可以改写成一个协程。

    上述所有的工作都是串行完成,虽然有很多工人,工人之间的工作是并发的(IO等待时间),但是工作一直是从第一个开始一个一个分配任务。

  • 相关阅读:
    sql 变量赋值
    mysql 行号 获取指定行数据
    SQL Server获取指定行的数据
    sql server 创建内联表值函数
    sql server 表变量存储临时查询数据
    sql server 循环操作
    oracle for in 学习
    oracle C# 访问
    sql server insert values 多值 与oracle 的不同
    mysql 如何选择随机行
  • 原文地址:https://www.cnblogs.com/lyon2014/p/4596483.html
Copyright © 2011-2022 走看看