zoukankan html css js c++ java

协程

1.异步回调

使用场景：

爬虫（1.从目标站点下载网页数据 2.用re从字符串中提取你需要的数据）

什么式异步回调？

a 交给b一个任务， b在执行完成后回过头来调用了a的一个函数，称之为回调函数

通常异步任务都会和回调函数一起使用

使用方式：通过add_done_callback() 给 future

为什么要用异步回调

需要获取异步任务的结果，但是又不应该阻塞（降低效率）

高效的获取任务结果

'''
1.从目标站点下载网页数据 本质就是HTML格式字符串
2.用re从字符串中提取出你需要的数据
'''
import requests, re, os
from concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor
from threading import current_thread

def get_data(url):
    print("%s 正在请求%s" % (current_thread().name, url))
    response = requests.get(url)
    print("%s 请求%s成功" % (current_thread().name, url))
    return response
def parser(obj):
    res = obj.result()
    htm = res.content.decode("utf-8")
    ls = re.findall("href=.*?com", htm)
    print("%s解析完成! 共%s个连接" % (current_thread().name,len(ls)))
if __name__ == '__main__':
    urls = ["https://www.baidu.com",
            "https://www.tmall.com",
            "https://www.taobao.com",
            "https://www.jd.com",
            "https://www.python.org",
            "https://www.apple.com"]
    pool = ThreadPoolExecutor(3)
    for i in urls:
        obj = pool.submit(get_data, i)
        obj.add_done_callback(parser)

异步回调案例：爬虫>>>

2.线程队列

线程队列的本身就是一个普通容器，不能被进程共享

线程队列与进程队列的却别：

进程队列可以被多进程共享，而线程队列则本身就是一个普通容器，不能被进程共

享

先进先出队列：Queue


q = Queue(1)
q.put("a")
q.put("b",timeout=1)

print(q.get())
print(q.get(timeout=2))

后进先出队列: LifoQueue


lq = LifoQueue()
lq.put("a")
lq.put("b")
lq.put("c")

print(lq.get())
print(lq.get())
print(lq.get())

优先级队列: PriorityQueue()

取出顺序式是，由小到大，优先级可以是数字或字符，只要能够比较大小即可


pq = PriorityQueue()

pq.put((["a"],"bdslkfjdsfjd"))
pq.put((["b"],"csdlkjfksdjkfds"))
pq.put((["c"],"asd;kjfksdjfkdsf"))

print(pq.get())
print(pq.get())
print(pq.get())

线程队列

3.线程事件

什么是事件？是一种通知服务，用于协调多个线程工作，当一个线程需要执行某个操作，需要获取另外一个线程的状态时的通知服务就是事件

'''
 以TCP服务器与客户端连接为例
'''
import time
from threading import Thread
from threading import Event

# 创建一个事件
e = Event() #默认False

def start():
    print("正在启动服务器......")
    time.sleep(5)
    print("服务器启动成功!")
    e.set() # 就是把事件的值设置为True

def connect():
    # 重试3次
    for i in range(3):
        print("等待服务器启动....")
        e.wait(1) # 会阻塞 直到对方把事件设置为True
        if e.isSet():
            print("连接成功!")
            break
        else:
            print("连接失败")
    else: #如果3次都没成功 就打印这个消息
        print("服务器没有启动")
        

Thread(target=start).start()
Thread(target=connect).start()

以TCP服务器与客户端连接为例

4.单线程下实现并发效果

首先要明确定义:

　　　　　　并发:指的是多个任务同时发生,看起来好像是同时都在进行

　　　　　　并行: 指的是多个任务真正的同时进行

单线程下通过生成器完成并发>>>生成器的特点是:只要函数中出现yield该函数就变成了生成器

单线程并发是为了提高效率,对于计算密集类型任务,单线程并发会降低效率

对于IO密集型的任务,单线程并发会提高效率(在执行IO操作的时候,切换到其他计算任务,提高CPU的占用率)

import time
def task1():
    a = 1
    while True:
        print("task1 run")
        a += 1 
        print(a)
        yield
def task2():
    g = task1()
    while True:
        print('task2 run')
        time.sleep(10)
        next(g)
task2()


'''
  对于计算型任务 单线程并发效率较低
'''
import time
# def task1():
#     a = 0
#     for i in range(10000000):
#         a += i
#         yield
#
# def task2():
#     b = 0
#     g = task1()
#     for i in range(10000000):
#         b += i
#         next(g)
# s = time.time()
# task2()
# print(time.time()-s)

def task1():
    a = 0
    for i in range(10000000):
        a += i
def task2():
    b = 0
    for i in range(10000000):
        b += i
s = time.time()
task1()
task2()
print(time.time()-s)

单线程下的并发效果

5.greenlet

greenlet主要封装了生成器，使得在使用生成器是实现并发时，简化代码

该模块简化了yield复杂的代码结构,实现了单线程下多任务并发，但是无论直接使用yield还是greenlet都不能检测IO操作，遇到IO时同样进入阻塞状态，所以此时的并发是没有任何意义的。

import greenlet
import time

def task1():
    print('task1 run')
    time.sleep(10)
    g2.switch()
    print('task1 run')
def task2():
    print('task2 run')
    g1.switch()

g1 = greenlet.greenlet(task1)
g2 = greenlet.greenlet(task2)
g1.switch()

greenlet

6.协程

什么是协程?

协程是单线程下的并发，又称微线程，纤程

协程可以理解为提高线程工作效率,本质是单线程并发

协程也称之为微线程(它比线程更轻量级单线程下任务的切换比操作系统切换线程要简单的多)

为什么要有协程?

因为CPython中无法实现并行执行任务,导致效率降低,需要一种方法将效率最大化

协程的优点:

　　1.协程的切换开销更小,属于程序级别的切换,操作系统完全能感知不到,因而更加轻量级

　　2.单线程内就可以实现并发的效果,最大限度利用CPU

协程的缺点:

　　1. 协程的本质是单线程下，无法利用多核，可以是一个程序开启多个进程，每个进程内开启多个线程，每个线程内开启协程

　　2.协程指的是单个线程，因而一旦协程出现阻塞，将会阻塞整个线程

怎么使用?

Python中使用Gevent模块来实现协程其能在多个任务间进行切换而且能够自己检测IO

from gevent import monkey
monkey.patch_all()
import gevent
import time
def task1():
    print("task1 run")
    time.sleep(10)
    print("task1 run")
def task2():
    print("task2 run")
    print("task2 run")
g1 = gevent.spawn(task1)
g2 = gevent.spawn(task2)

# g1.join()
# g2.join()
gevent.joinall([g1,g2])

协程使用

学习，学习，学习！学习是为了更好的未来，不要让别人瞧不起你，加油！！！

查看全文

相关阅读:
redhat 6.7 telnet rpm 安装包
 linux下网络配置命令
 修复南尼U盘
 mac获取root权限
 ubuntu二进制包安装openresty
ubuntu18源码包安装openresty
Python监控rabbitmq的代码
 win10不能将文件拖到另外一个程序中去的解决办法
 docker配置远程管理端口
 nginx的代理配置

原文地址：https://www.cnblogs.com/yangyufeng/p/10220383.html

协程