zoukankan      html  css  js  c++  java
  • Python多进程

    在Python中如果想创建多进程需要用到multiprrocessing中的Prrocess方法。

    在进程之间全局变量是不共享的,如果要对进程的全局变量进行使用的话就需要用到multiprrocessing的Queue方法

    首先我们先创建一个多进程

    import time
    from multiprocessing import Process
    # 进程之间全局变量不共享
    
    
    def work_1():
        for i in range(10):
            print('任务1')
            time.sleep(0.5)
    
    
    def work_2():
        for i in range(10):
            print('任务2')
            time.sleep(0.5)
    
    
    # 进程执行的时候不加main 为什么会报错:
    # 在执行过程中相当于在另外一个py文件中导入这个模块并运行函数,由于是导入模块所以
    # 创建多进程的代码也会被导入,然后就又去开了线程,陷入无限递归的状态
    if __name__ == '__main__':
        # 创建两个进程
        p1 = Process(target=work_1)
        p2 = Process(target=work_2)
        p1.start()
        p2.start()

    看过我之前写的关于线程的那么上面这段代码一定可以看懂,如果不明白可以回去看看关于线程的。

    我们在多进程之间通讯需要用到队列,但是这个队列不是Queue.queue() 而是multiprrocessing中的Queue

    queue.Queue 是进程内非阻塞队列

    multiprocessing.Queue 是跨进程通信队列

    
    
    import requests
    from multiprocessing import Process, Queue

    def
    work_1(q): while q.qsize() > 0: url = q.get() requests.get(url) print('任务1') def work_2(q): while q.qsize() > 0: url = q.get() requests.get(url) print('任务2') if __name__ == '__main__': q = Queue() for i in range(10): q.put('http://localhost:3000/login') # 将q 这个实例化对象当作参数传入函数中(不同的进程中),可以实现多进程共享变量,把这个队列放到一个公共区间内 p1 = Process(target=work_1, args=(q,)) p2 = Process(target=work_2, args=(q,)) p1.start() p2.start()

    下面来聊一聊进程池:

    Pool可以提供指定数量的进程供用户调用,当有新的请求提交到pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求;但如果池中的进程数已经达到规定最大值,那么该请求就会等待,直到池中有进程结束,才会创建新的进程来它。

    
    
    import requests
    from multiprocessing import Pool, Manager # 进程池Pool Manager().Queue() # 进程池中的队列
    import time
    import os # 查看进程的pid
    # a = Manager().Queue() # 进程池中的队列


    def work(q):
    # 判断队列是否有任务
    while q.qsize() > 0:
    # 获取任务
    url = q.get()
    requests.get(url)
    print('任务1{}'.format(os.getpid()))


    if __name__ == '__main__':
    # 进程池中的队列
    q = Manager().Queue()
    for i in range(10):
    # 增加任务
    q.put('http://localhost:3000/login')
    # 创建进程池 最大进程数为3
    p = Pool(3)
    for i in range(10):
    # 开启进程执行任务 在进程池中,初始化几个进程,轮询执行任务,当一个任务执行完毕后这个进程会去执行另一个任务,直到所有任务完成
    if q.qsize() > 0:
            # 每次循环将会用空闲出来的子进程去调用目标
    p.apply_async(work, args=(q,)) # 异步的效率,也就是池中的进程一次性都去执行任务. 进程中有3个进程,一下就处理3个任务,接下来哪个进程处理完任务了,就马上去接收下一个任务

    p.close() # 进程池使用完毕一定要关闭进程池:停止往进程池中添加新的任务
    p.join() # 等待po中所有子进程执行完成,必须在close之后 等待线程池中的所有任务都执行完了之后再往下执行
    # 异步处理任务时 : 必须要加上close和join. 进程池的所有进程都是守护进程(主进程代码执行结束,守护进程就结束). 
    
    
  • 相关阅读:
    30.3 Collections 集合体系的工具类
    30.2 案例:ArrayList本身数据可以重复,写出去重的方法
    30 HashSet
    29.3 ArrayList、List、LinkedList(链表)优缺点
    foreach-- for循环的增强型:for(类型 变量 : 数组对象) { 使用变量 }
    <E> 泛型
    29.2 Iterator 迭代器ConcurrentModificationException:并发修改异常处理
    29.2 Iterator 迭代器
    29.1 collection层次结构 中的根接口
    29 collection 集合体系结构
  • 原文地址:https://www.cnblogs.com/congyiwei/p/12735298.html
Copyright © 2011-2022 走看看