zoukankan      html  css  js  c++  java
  • Python多线程的事件监控

    设想这样一个场景:

    你创建了10个子线程,每个子线程分别爬一个网站,一开始所有子线程都是阻塞等待。一旦某个事件发生:例如有人在网页上点了一个按钮,或者某人在命令行输入了一个命令,10个爬虫同时开始工作。

    肯定有人会想到用Redis来实现这个开关:所有子线程全部监控Redis中名为start_crawl的字符串,如果这个字符串不存在,或者为0,那么就等待1秒钟,再继续检查。如果这个字符串为1,那么就开始运行。

    代码片段可以简写为:

    import time
    
    import redis
    
     
    
    client = redis.Redis()
    
    while client.get('start_crawl') != 1:
    
    print('继续等待')
    
    time.sleep(1)

    这样做确实可以达到目的,不过每一个子线程都会频繁检查Redis。

    实际上,在Python的多线程中,有一个 Event模块,天然就是用来实现这个目的的。

    Event是一个能在多线程中共用的对象,一开始它包含一个为 False的信号标志,一旦在任一一个线程里面把这个标记改为 True,那么所有的线程都会看到这个标记变成了 True

    我们通过一段代码来说明它的使用方法:

    import threading
    
    import time
    
     
    
    class spider(threading.Thread):
    
    def __init__(self, n, event):
    
    super().__init__()
    
    self.n = n
    
    self.event = event
    
     
    
    def run(self):
    
    print(f'第{self.n}号爬虫已就位!')
    
    self.event.wait()
    
    print(f'信号标记变为True!!第{self.n}号爬虫开始运行')
    
     
    
    eve = threading.Event()
    
    for num in range(10):
    
    crawler = spider(num, eve)
    
    crawler.start()
    
     
    
    input('按下回车键,启动所有爬虫!')
    
    eve.set()
    
    time.sleep(10)

    运行效果如下图所示:

    在这段代码中,线程 spider在运行以后,会运行到 self.event.wait()这一行,然后10个子线程会全部阻塞在这里。而这里的 self.event,就是主线程中 eve=threading.Event()生成的对象传入进去的。

    在主线程里面,当执行了 eve.set()后,所有子线程的阻塞会被同时解除,于是子线程就可以继续运行了。

  • 相关阅读:
    Windows 8 Developer Preview 已经开始提供下载!!!
    5 款傻瓜式手机 APP 开发工具
    25 超棒的 HTML5 Canvas 游戏
    12 个免费在线的 Web 网站性能测试工具
    13 个强大的基于 HTML5 的 Web 应用
    《美国毒枭》的“大悔”与“大爱”
    WEB资源大全
    5 款基于 Web 浏览器的建模工具
    iPhone开发网站
    ios开发心得之一
  • 原文地址:https://www.cnblogs.com/tjp40922/p/12203663.html
Copyright © 2011-2022 走看看