zoukankan      html  css  js  c++  java
  • python 线程/线程锁/信号量

     单线程

    #常规写法

    import threading import
    time def sayhi(num): # 定义每个线程要运行的函数 print("running on number:%s" % num) time.sleep(3) if __name__ == '__main__': t1 = threading.Thread(target=sayhi, args=(1,)) # 生成一个线程实例 t2 = threading.Thread(target=sayhi, args=(2,)) # 生成另一个线程实例 t1.start() # 启动线程 t2.start() # 启动另一个线程 print(t1.getName()) # 获取线程名 print(t2.getName())

    自定义线程类 import threading import
    time class MyThread(threading.Thread): def __init__(self, num): threading.Thread.__init__(self) self.num = num def run(self): # 定义每个线程要运行的函数 print("running on number:%s" % self.num) time.sleep(3) if __name__ == '__main__': t1 = MyThread(1) t2 = MyThread(2) t1.start() t2.start()

    多线程

    import threading
    import time
    
    def sayhi(num):          # 定义每个线程要运行的函数
        print("running on number:%s" % num)
        time.sleep(3)
    
    start_time=time.time()
    if __name__ == '__main__':
        for i in range(50):                 ###多线程
            t = threading.Thread(target=sayhi, args=(i,))  # 生成一个线程实例
            t.start()
    print (start_time-time.time())            ####打印时间
    
    
    此时打印结果时间为0.0000几秒,是因为程序在执行完多线程时继续往下执行,而不会等待线程执行完在打印时间,所以打印出来的时间并不是多线程执行的时间
    
    
    join() 线程执行后,主线程会等待所有线程执行完毕后继续往下走,下面实例介绍计算多线程执行时间 import threading import
    time def sayhi(num): # 定义每个线程要运行的函数 print("running on number:%s" % num) time.sleep(3) start_time=time.time() threads = [] ####定义一个列表,将所有的线程加进去 if __name__ == '__main__': for i in range(50): ###多线程 t = threading.Thread(target=sayhi, args=(i,)) # 生成一个线程实例 t.start() threads.append(t) ####将每个线程添加到列表 for t in threads: ###循环整个列表,进行join(每个线程join完成后主线程才会继续往下走) t.join() ###等待所有线程执行结束,相当于单线程 print (start_time-time.time())

    示例二

    #!/usr/bin/env python
    #-*-coding:utf-8-*-
    
    import threading
    from time import ctime,sleep
    import time
    
    def music(func):
        for i in range(2):
            print ("Begin listening to %s. %s" %(func,ctime()))
            sleep(1)
            print("end listening %s"%ctime())
    
    def move(func):
        for i in range(2):
            print ("Begin watching at the %s! %s" %(func,ctime()))
            sleep(5)
            print('end watching %s'%ctime())
    
    threads = []
    t1 = threading.Thread(target=music,args=('music',))
    threads.append(t1)
    t2 = threading.Thread(target=move,args=('movie',))
    threads.append(t2)
    
    if __name__ == '__main__':
    
        for t in threads:
            t.start()
        print ("all over %s" %ctime())

    守护线程

    主线程不会等待守护线程结束在退出,会等待非守护线程执行完毕才退出

     

    将线程设置为Daemon线程,它做为程序主线程的守护线程,当主线程退出时,线程也会退出,由守护线程动的其它子线程会同时退出,不管是否执行完任务

    线程锁

    由于线程之间是进行随机调度,并且每个线程可能只执行n条执行之后,当多个线程同时修改同一条数据时可能会出现脏数据,所以,出现了线程锁 - 即同一时刻允许一个线程执行操作

    ###没有加锁时
    
    import threading
    import time,sys
    
    def addNum():
        global num              # 在每个线程中都获取这个全局变量
        print('--get num:', num)
        time.sleep(1)
        num -= 1                # 对此公共变量进行-1操作
    
    num = 100                   # 设定一个共享变量
    thread_list = []
    
    for i in range(100):
        t = threading.Thread(target=addNum)
        t.start()
        thread_list.append(t)
    for t in thread_list:              # 等待所有线程执行完毕
    
        t.join()
    print('final num:', num)
    
    说明:
    正常来讲,这个num结果应该是0, 但在python 2.7上多运行几次,会发现,最后打印出来的num结果不总是0,为什么每次运行的结果不一样呢? 
    假设你有A,B两个线程,此时都 要对num 进行减1操作, 由于2个线程是并发同时运行的,所以2个线程很有可能同时拿走了num=
    100这个初始变量交给cpu去运算,当A线程去处完的结果是99,但此时B线程运算完的结果也是99,两个线程同时CPU运算的结果再赋值给num变量后,结果就都是99。那怎么办呢? 很简单,每个线程在要修改公共数据时,为了避免自己在还没改完的时候别人也来修改此数据,可以给这个数据加一把锁, 这样其它线程想修改此数据时就必须等待你修改完毕并把锁释放掉后才能再访问此数据。 加锁版本: import threading import time gl_num = 0 lock = threading.RLock() ## 生成全局锁 def Func(): lock.acquire() #修改数据前加锁 global gl_num gl_num += 1 time.sleep(1) print(gl_num) lock.release() ###修改后释放 for i in range(10): t = threading.Thread(target=Func) t.start()


    递归锁(即大锁之下在加小锁)

    import threading, time
    
    def run1():
        print("grab the first part data")
        lock.acquire()
        global num
        num += 1
        lock.release()
    
        return num
    
    
    def run2():
        print("grab the second part data")
        lock.acquire()
        global num2
        num2 += 1
        lock.release()
    
        return num2
    
    
    def run3():
        lock.acquire()
        res = run1()
        print('--------between run1 and run2-----')
        res2 = run2()
        lock.release()
        print(res, res2)
    
    
    if __name__ == '__main__':
        num, num2 = 0, 0
        lock = threading.RLock()
    
        for i in range(10):
            t = threading.Thread(target=run3)
            t.start()
    
    while threading.active_count() != 1:
        print(threading.active_count())
    
    else:
    
        print('----all threads done---')
        print(num, num2)

    条件变量同步(condition)

    有一类线程需要满足条件之后才能够继续执行,Python提供了threading.Condition 对象用于条件变量线程的支持,它除了能提供RLock()或Lock()的方法外,还提供了 wait()、notify()、notifyAll()方法。

    lock_con=threading.Condition([Lock/Rlock]): 锁是可选选项,不传人锁,对象自动创建一个RLock()。

    wait():条件不满足时调用,线程会释放锁并进入等待阻塞;
    notify():条件创造后调用,通知等待池激活一个线程;
    notifyAll():条件创造后调用,通知等待池激活所有线程。

    示例

    import threading,time
    from random import randint
    
    class Producer(threading.Thread):
        def run(self):
            global L
            while True:
                val=randint(0,100)
                print('生产者',self.name,":Append"+str(val),L)
                if lock_con.acquire():
                    L.append(val)
                    lock_con.notify()
                    lock_con.release()
                time.sleep(3)
    class Consumer(threading.Thread):
        def run(self):
            global L
            while True:
                    lock_con.acquire()
                    if len(L)==0:
                        lock_con.wait()
                    print('消费者',self.name,":Delete"+str(L[0]),L)
                    del L[0]
                    lock_con.release()
                    time.sleep(0.25)
    
    if __name__=="__main__":
    
        L=[]
        lock_con=threading.Condition()
        threads=[]
        for i in range(5):
            threads.append(Producer())
        threads.append(Consumer())
        for t in threads:
            t.start()
        for t in threads:
            t.join()
    View Code

    信号量

    互斥锁,同时只允许一个线程更改数据,而Semaphore是同时允许一定数量的线程更改数据 ,比如两个水龙头,那最多只允许2个人同时使用,后面的人只能等有人用完后才能使用。

    信号量用来控制线程并发数的,BoundedSemaphore或Semaphore管理一个内置的计数 器,每当调用acquire()时-1,调用release()时+1。

          计数器不能小于0,当计数器为 0时,acquire()将阻塞线程至同步锁定状态,直到其他线程调用release()。(类似于停车位的概念)

          BoundedSemaphore与Semaphore的唯一区别在于前者将在调用release()时检查计数 器的值是否超过了计数器的初始值,如果超过了将抛出一个异常。

    实例:

    import threading, time
    
    def run(n):
        semaphore.acquire()  
        time.sleep(1)
        print("run the thread: %s" % n)
        semaphore.release()
    
    
    if __name__ == '__main__':
        num = 0
        semaphore = threading.BoundedSemaphore(5)  # 最多允许5个线程同时运行,有一个执行完毕后会执行另一个
        for i in range(20):
            t = threading.Thread(target=run, args=(i,))
            t.start()
  • 相关阅读:
    python爬虫知识点总结(二十一)Scrapy中Spiders用法
    python爬虫知识点总结(二十)Scrapy中选择器用法
    python爬虫知识点总结(十九)Scrapy命令行详解
    python爬虫知识点总结(十八)Scrapy框架基本使用
    python爬虫知识点总结(十七)Scrapy框架安装
    python爬虫知识点总结(十六)PySpider框架概述和用法详解
    python爬虫知识点总结(十五)PySpider框架基本使用以及抓取TripAdvisor
    python爬虫知识点总结(十四)使用Redis和Flask维护Cookies池
    python爬虫知识点总结(十三)使用代理处理反扒抓取微信文章
    图像识别
  • 原文地址:https://www.cnblogs.com/FRESHMANS/p/8920332.html
Copyright © 2011-2022 走看看