一、进程对象及其他方法
1.1、进程的查看方法
分别是使用cmd查询以及程序中查询
1.2、cmd查询进程
Windows:进入cmd后输入tasklist即可查询,tasklist |findstr PID可以查询具体进程
MSC:进入终端后输入ps aux即可查询,输入ps aux|grep PID可以查询具体进程
1.3、程序中查询
from multiprocessing import Process, current_process current_process().pid # 查看当前进程的进程号 import os os.getpid() # 查看当前进程进程号 os.getppid() # 查看当前进程的父进程进程号 p.terminate() # 杀死当前进程 # 是告诉操作系统帮你去杀死当前进程 但是需要一定的时间 而代码的运行速度极快 time.sleep(0.1) print(p.is_alive()) # 判断当前进程是否存活
二、僵尸进程和孤儿进程
僵尸进程:所有的进程都具备僵尸进程,子进程在结束后需要过一段时间才会结束进程,因为父进程需要查看子进程的pid号运行时间等等,
坏处:当父进程不断的产生子进程,并且子进程也在不断运行,这就会造成内存的溢出
回收子进程的方法:父进程可以直接等待子进程运行结束直接回收,或者父进程调用join的方法,先运行子进程,再运行父进程。
孤儿进程:即子进程活着,父进程被回收
系统会设置一个回收机制,回收子进程
三、守护进程
在start前面使用daemon,可以将主进程设置成守护进程,即主进程回收时,也会回收子进程
from multiprocessing import Process import time def task(name): print('%s总管正在活着'% name) time.sleep(3) print('%s总管正在死亡' % name) if __name__ == '__main__': p = Process(target=task,args=('egon',)) # p = Process(target=task,kwargs={'name':'egon'}) p.daemon = True # 将进程p设置成守护进程 这一句一定要放在start方法上面才有效否则会直接报错 p.start() print('皇帝jason寿终正寝')
四、互斥锁
当一个数据同时有多个线程在操作时,会造成数据错乱
因此,为解决这个问题,python的解决方案是加锁处理,即将并发改成串行,牺牲了效率,但是保护了安全性
将主进程设置成设置成一把锁,子进程谁抢到就执行谁的
from multiprocessing import Process, Lock import json import time import random # 查票 def search(i): # 文件操作读取票数 with open('data','r',encoding='utf8') as f: dic = json.load(f) print('用户%s查询余票:%s'%(i, dic.get('ticket_num'))) # 字典取值不要用[]的形式 推荐使用get 你写的代码打死都不能报错!!! # 买票 1.先查 2.再买 def buy(i): # 先查票 with open('data','r',encoding='utf8') as f: dic = json.load(f) # 模拟网络延迟 time.sleep(random.randint(1,3)) # 判断当前是否有票 if dic.get('ticket_num') > 0: # 修改数据库 买票 dic['ticket_num'] -= 1 # 写入数据库 with open('data','w',encoding='utf8') as f: json.dump(dic,f) print('用户%s买票成功'%i) else: print('用户%s买票失败'%i) # 整合上面两个函数 def run(i, mutex): search(i) # 给买票环节加锁处理 # 抢锁 mutex.acquire() buy(i) # 释放锁 mutex.release() if __name__ == '__main__': # 在主进程中生成一把锁 让所有的子进程抢 谁先抢到谁先买票 mutex = Lock() for i in range(1,11): p = Process(target=run, args=(i, mutex)) p.start()
五、进程间通信
队列queue模块
Queue():设置一个队列里面可以容纳的最大数值,多了会报错
当存入时数据多于设定值,会报错
当读取时数据不管多余数据值还是少于数据值都会报错
get_nowait:没有直接报错
q.full():判断队列是否满了
q.empty():判断队列是否空了
get(timeout=3):三秒后报错
from multiprocessing import Queue # 创建一个队列 q = Queue(5) # 括号内可以传数字 标示生成的队列最大可以同时存放的数据量 # 往队列中存数据 q.put(111) q.put(222) q.put(333) # print(q.full()) # 判断当前队列是否满了 # print(q.empty()) # 判断当前队列是否空了 q.put(444) q.put(555) # print(q.full()) # 判断当前队列是否满了 # q.put(666) # 当队列数据放满了之后 如果还有数据要放程序会阻塞 直到有位置让出来 不会报错 """ 存取数据 存是为了更好的取 千方百计的存、简单快捷的取 同在一个屋檐下 差距为何那么大 """ # 去队列中取数据 v1 = q.get() v2 = q.get() v3 = q.get() v4 = q.get() v5 = q.get() # print(q.empty()) # V6 = q.get_nowait() # 没有数据直接报错queue.Empty # v6 = q.get(timeout=3) # 没有数据之后原地等待三秒之后再报错 queue.Empty try: v6 = q.get(timeout=3) print(v6) except Exception as e: print('一滴都没有了!') # # v6 = q.get() # 队列中如果已经没有数据的话 get方法会原地阻塞 # print(v1, v2, v3, v4, v5, v6) """ q.full() q.empty() q.get_nowait() 在多进程的情况下是不精确 """
六、IPC机制
父进程使用子进程的队列通信
子进程使用子进程的队列通信
from multiprocessing import Queue, Process def producer(q): q.put('我是23号技师 很高兴为您服务') def consumer(q): print(q.get()) if __name__ == '__main__': q = Queue() p = Process(target=producer,args=(q,)) p1 = Process(target=consumer,args=(q,)) p.start() p1.start()
七、生产消费模型
生产者(设计者)+服务员(传递信息)+消费者(使用者)
from multiprocessing import Process, Queue, JoinableQueue import time import random def producer(name,food,q): for i in range(5): data = '%s生产了%s%s'%(name,food,i) # 模拟延迟 time.sleep(random.randint(1,3)) print(data) # 将数据放入 队列中 q.put(data) def consumer(name,q): # 消费者胃口很大 光盘行动 while True: food = q.get() # 没有数据就会卡住 # 判断当前是否有结束的标识 # if food is None:break time.sleep(random.randint(1,3)) print('%s吃了%s'%(name,food)) q.task_done() # 告诉队列你已经从里面取出了一个数据并且处理完毕了 if __name__ == '__main__': # q = Queue() q = JoinableQueue() p1 = Process(target=producer,args=('大厨egon','包子',q)) p2 = Process(target=producer,args=('马叉虫tank','泔水',q)) c1 = Process(target=consumer,args=('春哥',q)) c2 = Process(target=consumer,args=('新哥',q)) p1.start() p2.start() # 将消费者设置成守护进程 c1.daemon = True c2.daemon = True c1.start() c2.start() p1.join() p2.join() # 等待生产者生产完毕之后 往队列中添加特定的结束符号 # q.put(None) # 肯定在所有生产者生产的数据的末尾 # q.put(None) # 肯定在所有生产者生产的数据的末尾 q.join() # 等待队列中所有的数据被取完再执行往下执行代码 """ JoinableQueue 每当你往该队列中存入数据的时候 内部会有一个计数器+1 没当你调用task_done的时候 计数器-1 q.join() 当计数器为0的时候 才往后运行 """ # 只要q.join执行完毕 说明消费者已经处理完数据了 消费者就没有存在的必要了
八、线程理论
8.1、什么是线程
进程:资源单位:相当于一个工厂里面的车间,里面已经备好了各种材料(在内存中生成一个空间)
线程:执行单位:相当于车间里面的流水线,可以从车间里面拿材料,但是需要生产产品(CPU执行的就是线程,是代码的执行过程)
进程和线程都是虚拟单位,只是为了更好的描述
8.2、为什么要有线程
开设进程需要消耗大量的空间,而开设线程则是在使用进程内的资源
当使用的资源相同时,可以在进程内开设多条线程