一、线程queue
Python中,队列是线程间最常用的交换数据的形式。Queue模块是提供队列操作的模块
import queue
q = queue.Queue()
q.put('123')
q.put('qwe')
print(q.get())
print(q.get())
print(q.get())
q.task_done()
q.join()
q = queue.LifoQueue() # 堆栈 先进后出
q.put('123')
q.put('456')
q.put('789')
print(q.get())
print(q.get())
print(q.get())
# 789 456 123
q = queue.PriorityQueue() # 可以根据优先级取数据
# 通常这个元组的第一个值是int类型
q.put((50, 'x'))
q.put((80, 'y'))
q.put((1, 'z'))
print(q.get())
print(q.get())
print(q.get())
二、线程定时器
from threading import Thread, Timer
import time
def task():
print('线程执行了')
time.sleep(2)
print('线程结束了')
t = Timer(4, task) # 过了4s后开启了一个线程
t.start()
三、进程池和线程池
进程池线程池:
-
池的功能:限制进程数或线程数
-
什么时候限制:当并发的任务数量远远大于计算机所能承受的范围,即无法一次性开启过多的任务数量(我就应该考虑去限制我进程数或线程数,从而保证服务器不崩)
同步:提交了一个任务,必须等任务执行完了(拿到返回值),才能执行下一行代码
异步:提交了一个任务,不要等执行完了,可以直接执行下一行代码
from concurrent.futures import ProcessPoolExecutor, ThreadPoolExecutor
from threading import currentThread
from multiprocessing import current_process
import time
def task(i):
print(f'{currentThread().name} 在执行任务 {i}')
# print(f'进程 {current_process().name} 在执行任务 {i}')
time.sleep(1)
return i**2
if __name__ == '__main__':
pool = ThreadPoolExecutor(4) # 池子里只有4个线程
# pool = ProcessPoolExecutor(4) # 池子里只有4个线程
fu_list = []
for i in range(20):
# pool.submit(task,i) # task任务要做20次,4个线程负责做这个事
future = pool.submit(task,i) # task任务要做20次,4个进程负责做这个事
# print(future.result()) # 如果没有结果一直等待拿到结果,导致了所有的任务都在串行
fu_list.append(future)
pool.shutdown() # 关闭了池的入口,会等待所有的任务执行完,结束阻塞.
for fu in fu_list:
print(fu.result())
from concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor
from threading import currentThread
from multiprocessing import current_process
import time
def task(i):
print(f'{currentThread().name} 在执行任务 {i}')
# print(f'进程 {current_process().name} 在执行任务 {i}')
time.sleep(1)
return i**2
def parse(future):
# 处理拿到的结果
print(future.result())
if __name__ == '__main__':
pool = ThreadPoolExecutor(4) # 池子里只有4个线程
# pool = ProcessPoolExecutor(4) # 池子里只有4个线程
fu_list = []
for i in range(20):
# pool.submit(task,i) # task任务要做20次,4个线程负责做这个事
future = pool.submit(task,i) # task任务要做20次,4个进程负责做这个事
future.add_done_callback(parse)
# 为当前任务绑定了一个函数,在当前任务执行结束的时候会触发这个函数,
# 会把future对象作为参数传给函数
# 这个称之为回调函数,处理完了回来就调用这个函数.
# print(future.result()) # 如果没有结果一直等待拿到结果,导致了所有的任务都在串行
# pool.shutdown() # 关闭了池的入口,会等待所有的任务执行完,结束阻塞.
# for fu in fu_list:
# print(fu.result())
四、协程
Python的线程用的是操作系统原生的线程
协程:单线程下实现并发
-并发:切换+保存状态
-多线程:操作系统帮你实现的,如果遇到io切换,执行时间过长也会切换,实现一个雨露均沾的效果。
什么样的协程是有意义的:
-遇到io切换的时候才有意义
-具体:协程概念本质是程序员抽象出来的,操作系统根本不知道协程存在,也就是说来了一个线程我自己遇到io,我自己线程内部直接切到自己的别的任务上了,操作系统根本发现不了,也就是实现了单线程下效率最高.
-优点:自己控制切换要比操作系统切换快的多
-缺点:对比多线程:自己要检测所有的io,但凡有一个阻塞整体都跟着阻塞;
对比对进程:无法利用多核优势。
为什么要有协程(遇到io切换)?
-自己控制切换要比操作系统切换快的多,降低了单个线程的io时间。
import time
def func1():
while True:
1000000+1
yield
def func2():
g = func1()
for i in range(100000000):
i+1
next(g)
start = time.time()
func2()
stop = time.time()
print(stop - start) # 14.774465560913086
第三方模块实现协程
from gevent import monkey;monkey.patch_all() #打了一个补丁,可以实现捕获非gevent的io.
import gevent
import time
def eat():
print('eat 1')
time.sleep(2)
print('eat 2')
def play():
print('play 1')
# 疯狂的计算呢没有io
time.sleep(3)
print('play 2')
start = time.time()
g1 = gevent.spawn(eat)
g2 = gevent.spawn(play)
g1.join()
g2.join()
end = time.time()
print(end-start) # 3.0040290355682373