zoukankan      html  css  js  c++  java
  • 【LemonCK】Python协程并发的优缺点

    协程

    协程是一种用户态的轻量级线程,又称微线程。

    协程拥有自己的寄存器上下文和栈,调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。

    因此:协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置。

    优点:

    1.无需线程上下文切换的开销
    2.无需原子操作锁定及同步的开销
    3.方便切换控制流,简化编程模型
    4.高并发+高扩展性+低成本:一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。

    所谓原子操作是指不会被线程调度机制打断的操作;这种操作一旦开始,就一直运行到结束,中间不会有任何 context switch (切换到另一个线程)。

    原子操作可以是一个步骤,也可以是多个操作步骤,但是其顺序是不可以被打乱,或者切割掉只执行部分。视作整体是原子性的核心。

    缺点:

    1.无法利用多核资源:协程的本质是个单线程,它不能同时将 单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上.当然我们日常所编写的绝大部分应用都没有这个必要,除非是cpu密集型应用。
    2.进行阻塞(Blocking)操作(如IO时)会阻塞掉整个程序

    使用gevent

    gevent是python的一个并发框架,以微线程greenlet为核心,使用了epoll事件监听机制以及诸多其他优化而变得高效。

    简单示例

    gevent的sleep可以交出控制权,当我们在受限于网络或IO的函数中使用gevent,这些函数会被协作式的调度, gevent的真正能力会得到发挥。

    gevent处理了所有的细节, 来保证你的网络库会在可能的时候,隐式交出greenlet上下文的执行权。

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    """
    @File:CoroutineDemo3.py    
    @E-mail:364942727@qq.com
    @Time:2020/10/1 10:24 下午 
    @Author:Charseki  
    @Version:1.0   
    @Desciption:协程二(gevent模块)
    """
    
    """
    协程gevent模块
    协程存在于线程之中,线程默认不会等待协程执行
    
    spawn:开启协程(第一个参数:协程要执行的任务)
    join:让线程等待协程执行
    
    协程之间切换的条件:
    gevent.sleep():耗时等待的情况下才会切换
    
    gevent的程序补丁:
    gevent.monkey.patch_all()  # 导入这个后,就可以不需要用gevent.sleep()了,只要是耗时,就能切换任务。
    
    首先考虑:协程 > 线程 > 进程
    
    """
    
    import gevent
    import time
    # from gevent import monkey
    
    # gevent.monkey.patch_all()
    
    
    def task_1():
        for i in range(10):
            print("--This is task 1!--执行次数:{}".format(i))
            # time.sleep(0.01)
            gevent.sleep(0.3)
    
    
    def task_2():
        for i in range(10):
            print("--This is task 2!--执行次数:{}".format(i))
            # time.sleep(0.01)
            gevent.sleep(0.3)
    
    
    if __name__ == '__main__':
        # 创建两个协程
        g1 = gevent.spawn(task_1)
        g2 = gevent.spawn(task_2)
        g1.join()
        g2.join()

    执行结果:

    --This is task 1!--执行次数:0
    --This is task 2!--执行次数:0
    --This is task 1!--执行次数:1
    --This is task 2!--执行次数:1
    --This is task 1!--执行次数:2
    --This is task 2!--执行次数:2
    --This is task 1!--执行次数:3
    --This is task 2!--执行次数:3
    --This is task 1!--执行次数:4
    --This is task 2!--执行次数:4
    --This is task 1!--执行次数:5
    --This is task 2!--执行次数:5
    --This is task 1!--执行次数:6
    --This is task 2!--执行次数:6
    --This is task 1!--执行次数:7
    --This is task 2!--执行次数:7
    --This is task 1!--执行次数:8
    --This is task 2!--执行次数:8
    --This is task 1!--执行次数:9
    --This is task 2!--执行次数:9

    同步异步

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    """
    @File:CoroutineDemo4.py    
    @E-mail:364942727@qq.com
    @Time:2020/10/2 1:11 上午 
    @Author:Charseki  
    @Version:1.0   
    @Desciption:协程-同步异步
    """
    
    import random
    import gevent
    
    
    def task(pid):
        gevent.sleep(random.randint(0, 2) * 0.001)
        print('Task %s done' % pid)
    
    
    def synchronous():
        for i in range(1, 10):
            task(i)
    
    
    def asynchronous():
        threads = [gevent.spawn(task, i) for i in range(10)]
        gevent.joinall(threads)
    
    
    if __name__ == '__main__':
        print('Synchronous:')
        synchronous()
        print('Asynchronous:')
        asynchronous()

    执行结果:

    Synchronous:
    Task 1 done
    Task 2 done
    Task 3 done
    Task 4 done
    Task 5 done
    Task 6 done
    Task 7 done
    Task 8 done
    Task 9 done
    Asynchronous:
    Task 5 done
    Task 9 done
    Task 1 done
    Task 2 done
    Task 3 done
    Task 4 done
    Task 6 done
    Task 0 done
    Task 7 done
    Task 8 done

    以子类的方法使用协程

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    """
    @File:CoroutineDemo4.py    
    @E-mail:364942727@qq.com
    @Time:2020/10/2 1:11 上午 
    @Author:Charseki  
    @Version:1.0   
    @Desciption:协程-子类化Greenlet类,重载它的_run方法
    """
    
    import gevent
    from gevent import Greenlet
    
    
    class Test(Greenlet):
        """可以子类化Greenlet类,重载它的_run方法,类似多线线程和多进程模块"""
    
        def __init__(self, message, n):
            Greenlet.__init__(self)
            self.message = message
            self.n = n
    
        def _run(self):
            print(self.message, 'start')
            gevent.sleep(self.n)
            print(self.message, 'end')
    
    
    tests = [
        Test("hello", 3),
        Test("world", 2),
    ]
    for test in tests:
        test.start()  # 启动
    for test in tests:
        test.join()  # 等待执行结束

    使用monkey patch修改系统标准库(自动切换协程)

    当一个greenlet遇到IO操作时,比如访问网络,就自动切换到其他的greenlet,等到IO操作完成,再在适当的时候切换回来继续执行。

    由于IO操作非常耗时,经常使程序处于等待状态,有了gevent为我们自动切换协程,就保证总有greenlet在运行,而不是等待IO。

    由于切换是在IO操作时自动完成,所以gevent需要修改Python自带的一些标准库,这一过程在启动时通过monkey patch完成

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    """
    @File:CoroutineDemo4.py    
    @E-mail:364942727@qq.com
    @Time:2020/10/2 1:11 上午 
    @Author:Charseki  
    @Version:1.0   
    @Desciption:协程-monkey patch自动切换协程
    """
    
    import gevent
    import requests
    from gevent import monkey
    
    monkey.patch_socket()
    
    
    def task(url):
        r = requests.get(url)
        print('%s bytes received from %s' % (len(r.text), url))
    
    
    if __name__ == '__main__':
        for i in range(3):
            gevent.joinall([
                gevent.spawn(task, 'https://www.baidu.com/'),
                gevent.spawn(task, 'https://www.qq.com/'),
                gevent.spawn(task, 'https://www.jd.com/'),
            ])

    执行结果:

    107822 bytes received from https://www.jd.com/
    2443 bytes received from https://www.baidu.com/
    99692 bytes received from https://www.qq.com/
    2443 bytes received from https://www.baidu.com/
    107822 bytes received from https://www.jd.com/
    99692 bytes received from https://www.qq.com/
    107822 bytes received from https://www.jd.com/
    2443 bytes received from https://www.baidu.com/
    99692 bytes received from https://www.qq.com/
    
    Process finished with exit code 0

    可以看出3个网络操作是并发执行的,而且结束顺序不同。

  • 相关阅读:
    阿里云观察——阿里云总裁王坚专访
    追寻凌云梦——对话阿里云总裁王坚
    四维的王坚和三维的阿里互联网汽车
    [2011移动者开发大会]王坚:互联网最革命的事是所有事情从离线到在线
    2013年8月,阿里云飞天5K集群成功上线,所有的服务对应的都是同一个系统内核、同一套分布式文件系统
    [搜索引擎大会]谷歌CEO Eric Schmit第一次高调用云和云计算的概念来描述谷歌所提供的互联网服务
    热门搜索引擎的TOP-K算法的python实现(回溯算法遍历trie树)
    海量日志数据提取出访问次数最多的那个IP python实现 总结
    Web数据挖掘 第十二章 Web使用挖掘的读书笔记
    Web数据挖掘 第十一章 观点挖掘和情感分析的读书笔记
  • 原文地址:https://www.cnblogs.com/chenshengkai/p/13759708.html
Copyright © 2011-2022 走看看