1、各种队列
我们已经学习了队列这种存取值的方法,我们以前使用的队列是可以进行进程间通信的(IPC),但是今天学习的这两种队列是不能进行进程间通信的,只能进行线程间的通信
这两种队列分别是先进后出式队列Lifoqueue
、优先级队列PriorityQueue
from queue import LifoQueue lf = LifoQueue() lf.put(111) lf.put(222) lf.put(333) print(lf.get()) print(lf.get()) print(lf.get()) # 333 # 222 # 111 # 取值规则为先进后出 from queue import PriorityQueue pq = PriorityQueue() pq.put((1,2)) pq.put((1,3)) pq.put((1,4)) print(pq.get()) print(pq.get()) print(pq.get()) # (1,2) # (1,3) # (1,4) # 规则是按照优先级进行对比,会先对比容器中的第一个元素,如果第一个一样则对比第二个元素,直至排出优先级 # 最高的那个元素
扩展知识: 大小比较的本质
关于为什么有的对象可以进行大小的比较,有的对象不能进行大小的比较
https://blog.csdn.net/zhangshuaijun123/article/details/82149056
2、Event事件
import time from threading import Event, Thread event = Event() flag = False def sever(): print("正在开启服务器...") time.sleep(3) print("服务器开启成功") # global flag # flag = True event.set() def client(): # print("正在连接...") # if flag: event.wait() print("连接成功") # else: # print("连接失败") # 假如我们想要在 服务器开启成功后在进行连接,用这种办法肯定不行,那么就需要在开启成功后添加一个标志, # 只有在标志修改后直接进行后续步骤 # event就可以创建这种标志 t = Thread(target=sever) t1 = Thread(target=client) t.start() t1.start() print("over")
Event事件的作用是进行进程间通讯,将进程间进行状态的同步,我们可以在某个点设置event.set(),那么当其前方代码执行完毕后,就会发出一个信号,使得event.wait()方法不再阻塞,进而执行wait()之后的代码
3、协程
在我们使用多线程实现并发的过程中,如果并发量比较大,那么我们应该如何处理?
此时你可能会说开启多线程,但是如果并发量达到了百万或者千万级别,那应该如何呢?
此时使用多线程不可能实现,但是如果使用多进程+多线程可以进行处理,但是如果更多呢?
因为进程以及线程的开启数量是有限的,如果开启过多可能会造成系统不稳定,那么此时可以使用我们今天使用的内容 —— 协程
学习协程之前我们首先需要复习一下什么是并发,并发指的是在同一个时间段,看起来有几个进程在同时运行,但是实际上同一时间只有一个线程在执行,我们以前学了多线程实现并发,那么一个线程可不可以实现并发呢?
首先来看一下我们已经学过的生成器
import time def func(): a = 1 for i in range(100000000): a += 1 # yield def func2(): # s = func() a = 1 for i in range(100000000): a += 1 # next(s) st = time.time() func() func2() print(time.time() - st) # 在使用串行执行时,耗时为15秒,在使用生成器时,耗时为30秒
我们通过上述生成器的例子可以看出,在同一个进程中可以同时并发的执行两个函数,这已经实现了并发,但是,在上述例子中,并发虽然实现了,但是程序的执行效率却一点都没有提高,反而执行效率都降低了,
上述的例子,我们进行的都是数据的计算,那么如果我们将数据的计算换成IO操作呢?
可能你会想,实现IO操作也不行啊,因为即使达到了并行的效果,但是我们的程序在执行到IO操作时,还是会等待,只有在IO操作执行完毕才会进行后续的取值工作,这时候还是在进行等待,而且我们在进行多个函数之间的切换时,要写好多next取值的代码,整体逻辑也不清晰,那么有没有一种方法对这些进行了改变呢?
我们烦恼的问题,前人也遇到了,而且他们也进行了处理,有一个包叫做gevent
,他可以帮我们处理这些烦人的问题
from gevent import monkey monkey.patch_all() import time import gevent def func(): print("func1 run") time.sleep(3) print("func1 over") def func2(): print("func2 run") time.sleep(5) print("func2 over") g1 = gevent.spawn(func) g2 = gevent.spawn(func2) gevent.joinall([g1,g2])
使用这个包可以将我们烦恼的问题全部解决,首先是进行等待的问题,在使用这个包进行单线程并发时,当一个函数遇到了IO操作,这个方法不会进行等待,而是直接切换到其他方法继续执行,因为对于操作系统来说最小的执行单位是线程,所以一个线程如果不进行IO操作,那么只有在这个时间片用完之后在进行进行切换,直接提高了我们使用CPU的时间,当我们使用gevent进行单线程并发时,如果遇到IO就切换到同线程下的其它函数进行执行,那么操作系统就不会将CPU切走,进而提高我们的程序对于CPU的使用
那么这个模块是如何实现这个不等待直接切换执行呢?
因为在这些IO操作中大部分都封装了不等待的方法,当时这些方法默认时开启的,如果设置为False,那么这些模块在进行执行时如果遇到了这些要进行IO操作,如果没有值就会报错,那么再将这些错误进行捕捉,再在except中进行切换就可以了
与此同时,新的疑问出现了,他是怎么将系统中的错误进行捕捉的呢?在我们的代码中并没有对这些错误进行处理,而且我们只是将这些函数作为参数传递给了这个模块进行执行
当我们将其中的monkey.patch_all()
代码进行删除后,这些代码又会按照原来的执行方式进行执行了,这是因为这个monkey方法对这些产生阻塞的方法进行了偷梁换柱,已经将这些阻塞的方法换成了自己的代码,所以要将这段代码放在最上方,先导入其中的方法
4、猴子补丁
猴子补丁的原理是重新写带有阻塞的类中的方法,我们在使用猴子补丁时实际上已经把这些方法进行了覆盖
import json import gevent from gevent import monkey monkey.patch_all() def func(args): print("这是一个假的方法") def func1(args): print("这是一个假的方法") def my_patch(): json.load = func json.loads = func1 my_patch() json.loads("aaa") json.load("aaa") # 这是一个假的方法 # 这是一个假的方法