zoukankan      html  css  js  c++  java
  • python的进程

    多进程概念:  

       由于GIL的存在,python中的多线程其实并不是真正的多线程,如果想要充分地使用多核CPU的资源,在python中大部分情况需要使用多进程。python提供了非常好用的多线程包(multiprocessing),只需要定义一个函数,Python会完成其他所有事情。借助这个包,可以轻松完成从单进程到并发执行的转换。multiprocessing支持子进程、通信和共享数据、执行不同形式的同步,提供了Process、Queue、Pipe、Lock等组件。

      multiprocessing包是Python中的多进程管理包。与threading.Thread类似,它可以利用multiprocessing.Process对象来创建一个进程。该进程可以运行在Python程序内部编写的函数。该Process对象与Thread对象的用法相同,也有start(), run(), join()的方法。此外multiprocessing包中也有Lock/Event/Semaphore/Condition类 (这些对象可以像多线程那样,通过参数传递给各个进程),用以同步进程,其用法与threading包中的同名类一致。所以,multiprocessing的很大一部份与threading使用同一套API,只不过换到了多进程的情境。

    但在使用这些共享API的时候,我们要注意以下几点:

    • 在UNIX平台上,当某个进程终结之后,该进程需要被其父进程调用wait,否则进程成为僵尸进程(Zombie)。所以,有必要对每个Process对象调用join()方法 (实际上等同于wait)。对于多线程来说,由于只有一个进程,所以不存在此必要性。
    • multiprocessing提供了threading包中没有的IPC(比如Pipe和Queue),效率上更高。应优先考虑Pipe和Queue,避免使用Lock/Event/Semaphore/Condition等同步方式 (因为它们占据的不是用户进程的资源)。
    • 多进程应该避免共享资源。在多线程中,我们可以比较容易地共享资源,比如使用全局变量或者传递参数。在多进程情况下,由于每个进程有自己独立的内存空间,以上方法并不合适。此时我们可以通过共享内存和Manager的方法来共享资源。但这样做提高了程序的复杂度,并因为同步的需要而降低了程序的效率。

    Process.PID中保存有PID,如果进程还没有start(),则PID为None。

    window系统下,需要注意的是要想启动一个子进程,必须加上那句if __name__ == "main",进程相关的要写在这句下面。

     1 from multiprocessing import Process
     2 import time,os
     3 
     4 
     5 def f(name):
     6     time.sleep(1)
     7     print('%s,父进程:%s;子进程:%s'%(name,os.getppid(),os.getpid()))
     8 
     9 if __name__ == "__main__":
    10     p_list=[]
    11     for i in range(8):  # 若进程数超过系统本身CPU的核数,就会发生进程的切换
    12         p=Process(target=f,args=('Adair',))
    13         p_list.append(p)
    14         p.start()
    15     for i in p_list:
    16         p.join()  # 防止出现僵尸进程
    17 
    18     print("父进程执行结束!")

    类式调用:

     1 from multiprocessing import Process
     2 import time,os
     3 
     4 class MyProcess(Process):
     5     def __init__(self):
     6         super(MyProcess,self).__init__()
     7 
     8     def run(self):
     9         time.sleep(1)
    10         print('%s,父进程:%s;子进程:%s'%(self.name,os.getppid(),os.getpid()))
    11 
    12 if __name__ == "__main__":
    13     p_list=[]
    14     for i in range(3):
    15         p = MyProcess()
    16         p.start()
    17         p_list.append(p)
    18 
    19     for i in p_list:
    20         i.join()
    21 
    22     print("父进程结束!")

     Process类:

      构造方法:

      Process([group [,target [,name[,args[,kwarge]]]])

        group:线程组,目前还没实现,库引用中提示必须是None

        target:要执行的方法

        name:进程名

        args / kwargs:要传入方法的参数

      实例方法:

        is_alive():返回进程是否在运行

        join([timeout]):阻塞当前上下文环境的进程,直到调用此方法的进程终止或者达到指定的timeout(可选参数)

        start():进程准备就绪,等待CPU调度

        run():start()调用run方法,如果实例进程时未指定传入的target,这start执行默认run()方法

        terminate():不管任务是否完成,立即停止工作进程

      属性:

        authkey

        daemon:和进程的setDeamon功能一样

        exitcode(进程在运行时为None、如果为-N,表示被信号N结束)

        name:进程名

        pid:进程号

    进程间通讯:

      不同进程间内存是不共享的,要想实现两个进程间的数据交换,可以用一下方法:

      Queues

      使用方法跟threading里的queue类似:

     1 from multiprocessing import Process,Queue
     2 
     3 def foo(q,n):
     4     q.put([42,n,"Adair."])
     5 
     6 if __name__ == "__main__":
     7     q = Queue()
     8     # print("q:",q)
     9     p_list=[]
    10     for i in range(3):
    11         p = Process(target=foo,args=(q,i))
    12         p_list.append(p)
    13         p.start()
    14         print(p.pid)
    15     print(q.get())
    16     print(q.get())
    17     print(q.get())
    18 
    19     for i in p_list:
    20         i.join()
  • 相关阅读:
    MARTIN FOWLER谈敏捷开发
    精益创业
    DEVOPS基础
    测试驱动开发
    持续集成(CONTINUOUS INTEGRATION)
    极限编程
    回归测试
    敏捷开发十二原则
    敏捷开发宣言
    敏捷开发简史
  • 原文地址:https://www.cnblogs.com/Adairye/p/10188126.html
Copyright © 2011-2022 走看看