zoukankan      html  css  js  c++  java
  • python异步并发模块concurrent.futures入门详解

    concurrent.futures模块详解

    Executor对象

    class concurrent.futures.Executor

    Executor是一个抽象类,它提供了异步执行调用的方法。它不能直接使用,但可以通过它的两个子类ThreadPoolExecutor或者ProcessPoolExecutor进行调用。

    我们可以将相应的tasks直接放入线程池/进程池,不需要维护Queue来操心死锁的问题,线程池/进程池会自动帮我们调度。

    Future可以把它理解为一个在未来完成的操作,这是异步编程的基础,传统编程模式下比如我们操作queue.get的时候,在等待返回结果之前会产生阻塞,cpu不能让出来做其他事情,而Future的引入帮助我们在等待的这段时间可以完成其他的操作

    2.1.1 Executor.submit(fn, *args, **kwargs)

    submit(fn,*args,**kwargs) 异步提交任务

    fn:需要异步执行的函数

    *args, **kwargs:fn参数

    使用submit函数来提交线程需要执行的任务(函数名和参数)到线程池中,并返回该任务的句柄(类似于文件、画图),注意submit()不是阻塞的,而是立即返回。

    通过submit函数返回的任务句柄,能够使用done()方法判断该任务是否结束。

    使用cancel()方法可以取消提交的任务,如果任务已经在线程池中运行了,就取消不了。

    2.1.2 Executor.map(func, *iterables, timeout=None)

    相当于map(func, *iterables),但是func是异步执行。timeout的值可以是int或float,如果操作超时,会返回raisesTimeoutError;如果不指定timeout参数,则不设置超时间。

    func:需要异步执行的函数

    *iterables:可迭代对象,如列表等。每一次func执行,都会从iterables中取参数。

    timeout:设置每次异步操作的超时时间

    2.1.3 Executor.shutdown(wait=True)

    释放系统资源,在Executor.submit()或 Executor.map()等异步操作后调用。使用with语句可以避免显式调用此方法

    shutdown(wait=True) 相当于进程池的pool.close()+pool.join()操作
    wait=True,等待池内所有任务执行完毕回收完资源后才继续,--------》默认
    wait=False,立即返回,并不会等待池内的任务执行完毕
    但不管wait参数为何值,整个程序都会等到所有任务执行完毕
    submit和map必须在shutdown之前

    2.3 ThreadPoolExecutor对象

    ThreadPoolExecutor类是Executor子类,使用线程池执行异步调用.

    class concurrent.futures.ThreadPoolExecutor(max_workers)

    使用max_workers数目的线程池执行异步调用

    executor = ThreadPoolExecutor(concurrent_size)

    2.4 ProcessPoolExecutor对象

    ThreadPoolExecutor类是Executor子类,使用进程池执行异步调用.

    class concurrent.futures.ProcessPoolExecutor(max_workers=None)

    使用max_workers数目的进程池执行异步调用,如果max_workers为None则使用机器的处理器数目(如4核机器max_worker配置为None时,则使用4个进程进行异步并发)。

    executor = ProcessPoolExecutor(concurrent_size)
    ProcessPoolExecutor(n):n表示池里面存放多少个进程,之后的连接最大就是n的值


    as_completed

    as_completed()方法是一个生成器,在没有任务完成的时候,会阻塞,在有某个任务完成的时候,会yield这个任务,就能执行for循环下面的语句,然后继续阻塞住,循环到所有的任务结束。从结果也可以看出,先完成的任务会先通知主线程。

    参数是任务(submit的返回值)列表

    wait

    wait方法可以让主线程阻塞,直到满足设定的要求。

    wait方法接收3个参数,等待的任务序列、超时时间以及等待条件。等待条件return_when默认为ALL_COMPLETED,表明要等待所有的任务都结束。等待条件还可以设置为FIRST_COMPLETED,表示第一个任务完成就停止等待。



     

    要想利用多核系统,Python必须支持多线程运行。作为解释型语言,Python的解释器必须做到既安全又高效。我们都知道多线程编程会遇到的问题,解释器要留意的是避免在不同的线程操作内部共享的数据,同时它还要保证在管理用户线程时保证总是有最大化的计算资源。

    那么,不同线程同时访问时,数据的保护机制是怎样的呢?答案是解释器全局锁。从名字上看能告诉我们很多东西,很显然,这是一个加在解释器上的全局(从解释器的角度看)锁(从互斥或者类似角度看)。这种方式当然很安全,但是它有一层隐含的意思(Python初学者需要了解这个):对于任何Python程序,不管有多少的处理器,任何时候都总是只有一个线程在执行。

    ”为什么我全新的多线程Python程序运行得比其只有一个线程的时候还要慢?“许多人在问这个问题时还是非常犯晕的,因为显然一个具有两个线程的程序要比其只有一个线程时要快(假设该程序确实是可并行的)。事实上,这个问题被问得如此频繁以至于Python的专家们精心制作了一个标准答案:”不要使用多线程,请使用多进程”。

    Python 多线程安全

    进程是资源分布的单元

    线程是进程中真正执行代码的

    进程运行起来,会有一个主线程进行运行 

    父子线程:相互独立运行,当所有的子线程执行完后,主线程才执行完

    多进程中,每个进程中所有数据(包括全局变量)都各有拥有一份,互不影响

    在一个进程内的所有线程共享全局变量,能够在不适用其他方式的前提下完成多线程之间的数据共享(但是局部变量是自己的)

    字典,列表当做参数传递给线程,会当做全局变量

    使用 copy.deepcopy(x) 来实现对象的深拷贝来实现值传递

    #创建锁
    mutex = threading.Lock()
    #锁定
    mutex.acquire([blocking])
    #释放
    mutex.release()

    锁的好处:

    • 确保了某段关键代码只能由一个线程从头到尾完整地执行

    锁的坏处:

    • 阻止了多线程并发执行,包含锁的某段代码实际上只能以单线程模式执行,效率就大大地下降了
    • 由于可以存在多个锁,不同的线程持有不同的锁,并试图获取对方持有的锁时,可能会造成死锁(死锁可以通过银行家算法解决)
  • 相关阅读:
    解决 Response GZIP Chunked 引发的异常
    已知Random.Next(1,10),产生1至100不重复的随机数据
    EntLib Validation Application Block 01 通过配置文件,自行指定对象自身方法进行验证
    梅花雪日历限制只可以小于等于当前日期的功能
    缓存Linq的mappingSource,提高Linq To SQL的性能,(20%的性能都不至哟)
    系统数据源连接对话框
    新浪还是明码保存密码?
    MVVM:ViewModel片段
    利用Microsoft.ReportingServices.RdlObjectModel.dll文件对rdl进行动态更改
    《软件架构师应该知道的97件事》
  • 原文地址:https://www.cnblogs.com/DSKer/p/10603441.html
Copyright © 2011-2022 走看看