zoukankan      html  css  js  c++  java
  • 6-[多线程]-互斥锁、GIL、死锁、递归锁、信号量

    1、互斥锁(排他锁)

      (1)不加锁的情况下 

      并发控制问题:多个事务并发执行,可能产生操作冲突,出现下面的3种情况

    1. 丢失修改错误
    2. 不能重复读错误
    3. 读脏数据错误
    # mutex
    from threading import Thread
    import time
    
    n = 100
    
    def task():
        global n
        temp = n
        time.sleep(0.1)
        n = temp - 1
        print(n)
    
    if __name__ == '__main__':
        t_l = []
        for i in range(100):
            t = Thread(target=task)
            t_l.append(t)
            t.start()
    
        for t in t_l:
            t.join()
    
        print('主done', n)

        

    from threading import Thread,Lock
    import os,time
    def work():
        global n
        lock.acquire()
        temp=n
        time.sleep(0.1)
        n=temp-1
        lock.release()
    if __name__ == '__main__':
        lock=Lock()
        n=100
        l=[]
        for i in range(100):
            p=Thread(target=work)
            l.append(p)
            p.start()
        for p in l:
            p.join()
    
        print(n) #结果肯定为0,由原来的并发执行变成串行,牺牲了执行效率保证了数据安全,不加锁则结果可能为99

      (2)、添加互斥锁(排他锁)

    锁:  排它锁(可以修改数据)
          共享锁(只可以读数据)
    

      

    2、GIL全局解释器锁

    参考博客: http://www.cnblogs.com/venicid/p/7975892.html

    GIL本质就是一把互斥锁,既然是互斥锁,所有互斥锁的本质都一样,都是将并发运行变成串行,以此来控制同一时间内共享数据只能被一个任务所修改,进而保证数据安全。

    可以肯定的一点是:保护不同的数据的安全,就应该加不同的锁。

      

    在一个python的进程内,不仅有test.py的主线程或者由该主线程开启的其他线程,还有解释器开启的垃圾回收等解释器级别的线程,总之,所有线程都运行在这一个进程内,毫无疑问
    

      

    1、所有数据都是共享的,这其中,代码作为一种数据也是被所有线程共享的(test.py的所有代码以及Cpython解释器的所有代码)
    例如:test.py定义一个函数work(代码内容如下图),在进程内所有线程都能访问到work的代码,于是我们可以开启三个线程然后target都指向该代码,能访问到意味着就是可以执行。
    
    2、所有线程的任务,都需要将任务的代码当做参数传给解释器的代码去执行,即所有的线程要想运行自己的任务,首先需要解决的是能够访问到解释器的代码。

    3、GIL与Lock

    GIL 与Lock是两把锁,保护的数据不一样,
    前者是解释器级别的(当然保护的就是解释器级别的数据,比如垃圾回收的数据),
    后者是保护用户自己开发的应用程序的数据
    

      

    1、100个线程去抢GIL锁,即抢执行权限
    2、肯定有一个线程先抢到GIL(暂且称为线程1),然后开始执行,一旦执行就会拿到lock.acquire()
    3、极有可能线程1还未运行完毕,就有另外一个线程2抢到GIL,然后开始运行,但线程2发现互斥锁lock还未被线程1释放,于是阻塞,被迫交出执行权限,即释放GIL
    4、直到线程1重新抢到GIL,开始从上次暂停的位置继续执行,直到正常释放互斥锁lock,然后其他的线程再重复2 3 4的过程
    

      

        

    4、GIL与多线程

     

    要解决这个问题,我们需要在几个点上达成一致:
    
    1、cpu到底是用来做计算的,还是用来做I/O的?
    
    2、多cpu,意味着可以有多个核并行完成计算,所以多核提升的是计算性能
    
    3、每个cpu一旦遇到I/O阻塞,仍然需要等待,所以多核对I/O操作没什么用处

    结论:
    
    1、对计算来说,cpu越多越好,但是对于I/O来说,再多的cpu也没用
    2、当然对运行一个程序来说,随着cpu的增多执行效率肯定会有所提高(不管提高幅度多大,总会有所提高),这是因为一个程序基本上不会是纯计算或者纯I/O,
    所以我们只能相对的去看一个程序到底是计算密集型还是I/O密集型,从而进一步分析python的多线程到底有无用武之地

      

     5、多线程性能测试

    计算密集型、io密集型 

    • 如果并发的多个任务是计算密集型:多进程效率高
    # 计算密集型:多进程执行效率高
    
    from multiprocessing import Process
    from threading import Thread
    import time
    import os
    
    
    def task():
        print('子 is running')
        ret = 0
        for i in range(10000000):
            ret *= i
    
        print('子 is done')
    
    
    if __name__ == '__main__':
        print(os.cpu_count())       # 查看电脑cup内核数量:本机为4核
        start_time = time.time()
    
        # 开启四个进程
        p_list = []
        for i in range(4):    
            p = Process(target=task)   # 耗时3.21s
            # p = Thread(target=task)    耗时5.38秒
            p_list.append(p)
            p.start()
    
        # 等待4个进程执行完成
        for p in p_list:
            p.join()
    
        end_time = time.time()
        print('主done:<%s>' % (end_time-start_time))

    • 如果并发的多个任务是I/O密集型:多线程效率高
    # io密集型:多线程执行效率高
    
    from multiprocessing import Process
    from threading import Thread
    import time
    import os
    
    
    def task():
        print('子 is running')
        time.sleep(2)
        print('子 is done')
    
    
    if __name__ == '__main__':
        print(os.cpu_count())       # 查看电脑cup内核数量:本机为4核
        start_time = time.time()
    
        # 开启400个进程
        p_list = []
        for i in range(400):
            p = Process(target=task)   # 耗时56s,大部分时间浪费在创建进程上
            # p = Thread(target=task)     # 耗时2.15秒
            p_list.append(p)
            p.start()
    
    
        for p in p_list:
            p.join()
    
        end_time = time.time()
        print('主done:<%s>' % (end_time-start_time))

     

    6、死锁

    from  threading import Thread, Lock
    import time
    
    
    lockA = Lock()
    lockB = Lock()
    
    
    class Mythread(Thread):
    
        def run(self):
            self.task_a()
            self.task_b()
    
        def task_a(self):
            lockA.acquire()
            print('%s 拿到A锁1' % self.name)
    
            lockB.acquire()
            print('%s 拿到B锁1' % self.name)
            lockB.release()
    
            lockA.release()
    
        def task_b(self):
            lockB.acquire()
            print('%s 拿到B锁' % self.name)
    
            lockA.acquire()
            print('%s 拿到A锁' % self.name)
            lockA.release()
    
            lockB.release()
    
    
    if __name__ == '__main__':
        for i in range(10):
            t = Mythread()
            t.start()

     

    7、递归锁

    #一个线程拿到锁,counter加1,该线程内又碰到加锁的情况,则counter继续加1,这期间所有其他线程都只能等待,等待该线程释放所有锁,即counter递减到0为止
    

      

    from threading import Thread, RLock
    import time
    
    
    lockA = lockB = RLock()     # 递归锁
    # 递归锁可以连续acquire多次,每acquire一次计数器+1,只有计数器为0时,才能被抢到
    
    class Mythread(Thread):
    
        def run(self):
            self.task_a()
            self.task_b()
    
        def task_a(self):
            lockA.acquire()
            print('%s 拿到A锁1' % self.name)
    
            lockB.acquire()
            print('%s 拿到B锁1' % self.name)
            lockB.release()
    
            lockA.release()
    
        def task_b(self):
            lockB.acquire()
            print('%s 拿到B锁' % self.name)
    
            lockA.acquire()
            print('%s 拿到A锁' % self.name)
            lockA.release()
    
            lockB.release()
    
    
    if __name__ == '__main__':
        for i in range(10):
            t = Mythread()
            t.start()
    View Code

    8、信号量

     

  • 相关阅读:
    搭建Jfroum过程记录
    性能测试见解1
    线程与进程
    性能测试见解3需求分析
    软件功能测试的用例设计总结
    hadoop 2.x安装:不能加载本地库 解决libc.so.6 version GLIBC_2.14 not found问题
    hadoop 2.x安装:不能加载本地库 java.library.path错误
    linux使用:CentOS安装jdk
    hadoop 2.x安装:完全分布式安装
    hadoop 2.x安装:不能加载本地库 重新编译hadoop本地库
  • 原文地址:https://www.cnblogs.com/venicid/p/8910101.html
Copyright © 2011-2022 走看看