zoukankan      html  css  js  c++  java
  • python并发编程之守护进程、互斥锁以及生产者和消费者模型

    一、守护进程

    主进程创建守护进程
    守护进程其实就是'子进程'
    一、守护进程内无法在开启子进程,否则会报错
    二、进程之间代码是相互独立的,主进程代码运行完毕,守护进程也会随机结束

    守护进程简单实例:
    from multiprocessing import Process
    import time
    def task(name):                       #此时的task为守护进程
        print('%s is running' % name)     #该行并不会被打印,因为主进程结束,守护进程会随之结束
        time.sleep(3)
    
    if __name__ == '__main__':
        obj = Process(target=task, args=('egon',))
        obj.daemon=True           #一定要在obj.start()开启之前,将obj设置为守护进程,禁止obj创建子进程,否则就会报错
        obj.start()               # 发送信号给操作系统开启一个进程(守护进程)
        print('')               #并且主进程结束,守护进程也会随之结束

    为什么要用守护进程:

    两方面理解:

    一、进程:为了让父进程的任务能够并发的执行,需要将该任务放到子进程中去

    二、守护:是因为子进程中执行的任务,在父进程运行完就没有存在的意义了,就设置成守护进程,会在父进程结束后,守护进程也随之结束

    由于计算机的性能的原因,进程打印出的结果可能会有不同的结果:

    from multiprocessing import Process
    import time
    def foo():                      #主进程结束,守护进程就会结束
        print(123)
        time.sleep(1)
        print("end123")
    
    def bar():                      #正常的子进程,父进程会等正常的子进程结束才会结束(父进程可以看到子进程的pid)
        print(456)
        time.sleep(3)
        print("end456")
    
    if __name__ == '__main__':
    
        p1=Process(target=foo)                #把p1做成守护进程
        p2=Process(target=bar)                #正常的子进程
    
        p1.daemon=True                #一定要在开启子进程之前,否则会报错,守护进程会伴随主进程的代码的运行完毕而死掉
        p1.start()
        p2.start()
        print("main-------")         #主进程结束,守护进程也随之结束
    
    #正常机器
    '''
    main-------
    456
    end456
    '''
    
    #快一点机器
    '''
    main-------     #申请一个内存空间,然后调用操作系统,将其打印到终端
    123             #机器性能好的话,可能在打印的时候,p1进程已经起来了,即向操作系统发送请求后,很快就做出回应开启了子进程
    456
    end456
    '''
    
    # 机器更快
    '''
    123          #当机器的性能在好一点,有可能会出现,p1向操作系统发起开启子进程的请求,迅速做出回应,然后开启子进程,那么123就会优先main先被打印出来
    main-------
    456
    end456
    '''
    了解知识点

    二、互斥锁

    进程之间数据不共享,但是共享同一套文件系统,所以访问同一套文件,或同一个打印终端是没问题的

    然而共享带来的是竞争,竞争带来的就是错乱无序,所以我们要加锁进行处理

    多个进程共享同一个打印终端

    '''能不自己处理锁,就尽量不用锁,'''
    #进程间通信,一个进程修改后,其他进程能看到修改后的结果
    '''互斥所就是把并发变成串行,保证了数据安全,但是牺牲了效率'''
    '''锁同一时间锁只能被一个子进程抢,用完了再释放掉,才能被其他进程抢到再用'''
    """互斥锁可以将要执行代码的(部分共享的数据)变成串行,而join是将要执行代码所有部分变成串行"""
    
    # 互斥锁:
    #强调:必须是lock.acquire()一次,然后 lock.release()释放一次,才能继续lock.acquire(),不能连续的lock.acquire()
    
    # 互斥锁vs join的区别一:
    # 大前提:二者的原理都是一样,都是将并发变成串行,从而保证有序
    # 区别:join是按照人为指定的顺序执行,而互斥锁是所以进程平等地竞争,谁先抢到谁执行
    
    # 没加锁之前,打印会变的错乱
    # 并发运行,效率高,但竞争同一打印终端,带来了打印错乱
    from multiprocessing import Process
    import time,random
    
    def task1():               #为每一个进程加上一把锁,这样就会有和join一样的效果,变成了串行
        print('task1:名字是egon')
        time.sleep(random.randint(1,3))
        print('task1:性别是male')
        time.sleep(random.randint(1,3))
        print('task1:年龄是18')
    
    def task2():
        print('task2:名字是alex')
        time.sleep(random.randint(1,3))
        print('task2:性别是male')
        time.sleep(random.randint(1,3))
        print('task2:年龄是78')
    
    def task3():
        print('task3:名字是lxx')
        time.sleep(random.randint(1,3))
        print('task3:性别是female')
        time.sleep(random.randint(1,3))
        print('task3:年龄是30')
    
    if __name__ == '__main__':
        p1=Process(target=task1)
        p2=Process(target=task2)
        p3=Process(target=task3)
    
        p1.start()
        p2.start()
        p3.start()
    
    '''
    运行结果:
    task1:名字是egon
    task3:名字是lxx
    task2:名字是alex
    task1:性别是male
    task3:性别是female
    task2:性别是male
    task1:年龄是18
    task3:年龄是30
    task2:年龄是78
    '''
    并发运行,提升了效率,但是共享同一个打印终端,造成打印错乱
    from multiprocessing import Process,Lock
    import time,random
    mutex=Lock()
    # 为每一个进程加锁,就可以让其变为串行,牺牲了效率,但保证了数据安全
    def task1(lock):               #为每一个进程加上一把锁,这样就会有和join一样的效果,变成了串行
        lock.acquire() #
        print('task1:名字是egon')
        time.sleep(random.randint(1,3))
        print('task1:性别是male')
        time.sleep(random.randint(1,3))
        print('task1:年龄是18')
        lock.release()
    
    def task2(lock):
        lock.acquire()
        print('task2:名字是alex')
        time.sleep(random.randint(1,3))
        print('task2:性别是male')
        time.sleep(random.randint(1,3))
        print('task2:年龄是78')
        lock.release()
    
    
    def task3(lock):
        lock.acquire()
        print('task3:名字是lxx')
        time.sleep(random.randint(1,3))
        print('task3:性别是female')
        time.sleep(random.randint(1,3))
        print('task3:年龄是30')
        lock.release()
    
    
    if __name__ == '__main__':
        p1=Process(target=task1,args=(mutex,))
        p2=Process(target=task2,args=(mutex,))
        p3=Process(target=task3,args=(mutex,))
    
        # p1.start()
        # p1.join()
        # p2.start()
        # p2.join()
        # p3.start()
        # p3.join()
    
        p1.start()
        p2.start()
        p3.start()
    加锁:牺牲了效率,但是避免了竞争,打印到同一个终端不会错乱

    多个进程共享同一份文件--------模拟抢票

    通过文件:db.json来模拟数据库

    文件内容:

    {"count":1}

    # 共享一份数据
    # 文件db.json内容:
    # {'count':1}
    import json
    import time
    import random
    import os
    from multiprocessing import Process
    '''大家抢的是同一份数据,先有查票,然后购票,先在客户端减1,在发送到服务端减1'''
    # 查票应该并发
    def search():
        time.sleep(random.randint(1,3))        #模拟网络延时
        with open('db.json','r',encoding='utf-8') as f:
            dic=json.load(f)
            print('%s 剩余票数:%s' %(os.getpid(),dic['count']))  #用pi进行标识
    
    # 购票应该一个一个来,才不至于购票时所有人都减1
    def get():
        with open('db.json','r',encoding='utf-8') as f:   #之前查看的可能不准确,所以再打开一次
            dic=json.load(f)
        time.sleep(random.randint(1, 3))
        if dic['count'] > 0:
            dic['count']-=1       #在客户端的内存里减1,但要把他刷新到服务端的文件中去
            time.sleep(random.randint(1,3))        #往文件中刷也要有一个网络延迟
            with open('db.json','w',encoding='utf-8') as f:
                json.dump(dic,f)
            print('%s 购票成功' %os.getpid())
    
    def task():
        search()             #先查票,
        get()                #在购票
    
    if __name__ == '__main__':
        for i in range(10):                  #网络延迟已经够把10个进程都创建完
            p=Process(target=task)
            p.start()
            # p.join()                       #加上join后变为串行,但是此时的问题是大家要排队来查票,保证了数据安全,但是效率变低了,因为查票和购票都变成了串行
    
    
    # 打印结果:
    '''
    12888 剩余票数:1
    10352 剩余票数:1
    10440 剩余票数:1
    228 剩余票数:1
    10736 剩余票数:1
    7032 剩余票数:1
    8580 剩余票数:1
    2712 剩余票数:1
    4248 剩余票数:1
    2332 剩余票数:1
    12888 购票成功
    10736 购票成功
    228 购票成功
    10352 购票成功
    10440 购票成功
    4248 购票成功
    8580 购票成功
    2332 购票成功
    7032 购票成功
    2712 购票成功
    
    '''
    并发运行效率高,但是共享同一份文件,写入数据库是错乱
    """
    抢票的正确思路是:
    查看票数应该是并发进行,提升效率
    购票时应加锁,让其串行,虽然降低了效率,但是保证了数据安全即修改时不会导致错乱
    """
    import json
    import time
    import random
    import os
    from multiprocessing import Process,Lock
    '''大家抢的是同一份数据,先有查票,然后购票,先在客户端减1,在发送到服务端减1'''
    mutex=Lock()
    # 互斥锁vs join的区别一:
    # 互斥锁可以让一部分代码(只修改共享数据的代码)变成串行,而join只能将代码整体串行
    #查票
    def search():
        time.sleep(random.randint(1,3))        #模拟网络延时
        with open('db.json','r',encoding='utf-8') as f:
            dic=json.load(f)
            print('%s 剩余票数:%s' %(os.getpid(),dic['count']))  #用pi进行标识
    #购票
    def get():
        with open('db.json','r',encoding='utf-8') as f:   #之前查看的可能不准确,所以再打开一次
            dic=json.load(f)
        time.sleep(random.randint(1, 3))
        if dic['count'] > 0:
            dic['count']-=1       #在客户端的内存里减1,但要把他刷新到服务端的文件中去
            time.sleep(random.randint(1,3))        #往文件中刷也要有一个网络延迟
            with open('db.json','w',encoding='utf-8') as f:
                json.dump(dic,f)
            print('%s 购票成功' %os.getpid())
    
    def task(lock):
        search()             #先查票,(是一个单独的行为,等你查完票在取购票的时候,可能票已经被抢完了)
    
        # 购票变成串行,对get即购票进行加锁处理
        lock.acquire()       #mutex=Lock().acquire()---------互斥所不能连续的acquire,必须释放掉才能在acquire,(有种独享的感觉)
        get()                #在购票
        lock.release()       #mutex=Lock().release()--------(释放掉锁,这把锁可以在被其他人抢到)
    
    if __name__ == '__main__':
        for i in range(10):                  #网络延迟已经够把10个进程都创建完
            p=Process(target=task,args=(mutex,))
            p.start()
            # p.join()
    加锁:购票行为由并发变为串行,降低了效率,但是保证了数据安全

     总结:

    #加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,即串行的修改,没错,速度是慢了,但牺牲了速度却保证了数据安全。
    虽然可以用文件共享数据实现进程间通信,但问题是:
    1.效率低(共享数据基于文件,而文件是硬盘上的数据)
    2.需要自己加锁处理
    
    
    
    #因此我们最好找寻一种解决方案能够兼顾:1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。这就是mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。
    队列和管道都是将数据存放于内存中
    队列又是基于(管道+锁)实现的,可以让我们从复杂的锁问题中解脱出来,
    我们应该尽量避免使用共享数据,尽可能使用消息传递和队列,避免处理复杂的同步和锁问题,而且在进程数目增多时,往往可以获得更好的可获展性。

    三、IPC通信机制

    进程间的通信就是通过队列或管道来实现的,而队列本质就是管道+锁,所以在这我们只研究队列

    进程之间通信必须找到一种介质,该介质必须满足
    1、是所有进程共享的
    2、必须是内存空间
    附加:帮我们自动处理好锁的问题
    """
    对列:是管道+锁实现的(管道本身就是一个共享的数据,但是管道没有加锁的处理,)----为了实现进程间通信的
    1、队列是共享的空间
    2、占用的是内存空间
    3、自动帮我们处理好锁定问题
    """
    from multiprocessing import Queue
    '''参数是3表明队列最多只能放三次数据。我们通过put放数据,通过get取数据'''
    q=Queue(3) #队列占用的是内存空间。-1代表队列没有限制,但是不能放大数据,应该往队列中放数据量比较小的消息数据
    q.put('first')          #firs是放的对象
    q.put({'second':None})
    q.put('')
    #
    # # q.put(4) #阻塞,------放满了就不能再放了,再放就会出现阻塞状态,这是因为有自动加锁的处理机制导致阻塞的,要想在放需取出数据才可继续再放
    print(q.get())         #取数据,先进先出,先放进去的先被取出来
    print(q.get())
    print(q.get())
    print(q.get())        #第四次在取会处于阻塞状态,这是因为队列自带锁处理机制,要想再取数据,需要向队列中放数据,否则一直处于阻塞状态

    队列主要方法:

    q.put方法用以插入数据到队列中,put方法还有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,该方法会阻塞timeout指定的时间,直到该队列有剩余的空间。如果超时,会抛出Queue.Full异常。如果blocked为False,但该Queue已满,会立即抛出Queue.Full异常。
    
    q.get方法可以从队列读取并且删除一个元素。同样,get方法有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,那么在等待时间内没有取到任何元素,会抛出Queue.Empty异常。如果blocked为False,有两种情况存在,如果Queue有一个值可用,则立即返回该值,否则,如果队列为空,则立即抛出Queue.Empty异常.
     
    q.get_nowait():同q.get(False)
    q.put_nowait():同q.put(False)
    
    q.empty():调用此方法时q为空则返回True,该结果不可靠,比如在返回True的过程中,如果队列中又加入了项目。
    q.full():调用此方法时q已满则返回True,该结果不可靠,比如在返回True的过程中,如果队列中的项目被取走。
    q.qsize():返回队列中目前项目的正确数量,结果也不可靠,理由同q.empty()和q.full()一样
    # 先进先出
    from multiprocessing import Queue
    q=Queue(5)
    q.put('first',block=False)     #等价于:q.put_nowait('first)---------block=False,加超时时间没有意义,以为满了或者去空就会报错,此时和超时时间已经没有关系,无论超时时间等于多少,都会立刻报错,没有等的过程
    q.put('second',block=False)
    q.put('third',block=False)
    q.put('fourth',block=False)    #不加锁,第四次队列放满了,不会被阻塞,而是直接抛出异常
    
    q.put('first',block=True)      #默认锁,满了就不让往里面放了
    q.put('second',block=True)     #超时时间只在block=True才有意义
    q.put('third',block=True)
    q.put('fourth',block=True,timeout=3) #加锁,timeout超时时间,第四次放已经满了,在放3秒后将抛出异常,如果没有放满,3秒后不会抛出异常
    
    
    print(q.get(block=False))            #等价于:q.get_nowait()
    print(q.get(block=False))
    print(q.get(block=False))
    print(q.get(block=False))            #不加锁,第四次队列取空了,不会被阻塞,而是直接抛出异常
    
    print(q.get(block=True))
    print(q.get(block=True))
    print(q.get(block=True))              #超时时间只在block=True才有意义
    print(q.get(block=True,timeout=2))    #加锁,第四次取已经去空,2秒后将抛出异常,如果没有取空,2秒后不会抛出异常
    队列其他方法应用

    四、生产者和消费者模型

    # # 终极版:
    import time
    import random
    from multiprocessing import Process,JoinableQueue   #(队列空了就就执行join操作)
    
    def consumer(name,q):           #
        while True:                 #源源不断的取是一个循环的过程
            res=q.get()
            time.sleep(random.randint(1,3))   #模拟经过一段时间处理完数据
            print('33[46m消费者===》%s 吃了 %s33[0m' %(name,res))
            q.task_done()
    
    def producer(name,q,food):
        for i in range(5):
            time.sleep(random.randint(1,2))      #模拟生产者生产数据的时间
            res='%s%s' %(food,i)
            q.put(res)          #数据生产好了,不断的往队列里面放,供消费者消费
            print('33[45m生产者者===》%s 生产了 %s33[0m' %(name,res))
    
    
    if __name__ == '__main__':
        #1、共享的盆
        q=JoinableQueue()         #中间的介质,不知道放多少个,所以不用写限制
    
        '''生产者和消费者都可以有多个'''
        #2、生产者们
        p1=Process(target=producer,args=('egon',q,'包子'))
        p2=Process(target=producer,args=('刘清政',q,'泔水'))
        p3=Process(target=producer,args=('杨军',q,'米饭'))
    
        #3、消费者们,消费者还没结束,,设置为守护进程
        c1=Process(target=consumer,args=('alex',q))
        c2=Process(target=consumer,args=('梁书东',q))
        c1.daemon=True       #一定要在进程开启之前设置
        c2.daemon=True
    
    
        p1.start()
        p2.start()
        p3.start()
        c1.start()
        c2.start()
    
        p1.join()
        p2.join()
        p3.join()
    
        q.join()    #等待队列被取干净
        #主进程代码运行完毕-----队列中的数据被取干净----消费者没有存在的意义了----设置为守护进程
        print('')
  • 相关阅读:
    java反射笔记
    Java常见异常类型
    找了这么多毕业设计题目,反而不知道选什么了
    C#中Trim()、TrimStart()、TrimEnd()的用法
    JS bom对象
    HTML随笔
    Sublim text3汉化
    11G RAC ORA-32701
    DB_LINK
    ORA-16957: SQL Analyze time limit interrupt
  • 原文地址:https://www.cnblogs.com/sui776265233/p/9300203.html
Copyright © 2011-2022 走看看