zoukankan      html  css  js  c++  java
  • Python并发编程-GIL全局解释器锁

           Python并发编程-GIL全局解释器锁

                                 作者:尹正杰

    版权声明:原创作品,谢绝转载!否则将追究法律责任。

    一.GIL全局解释器锁概述

      CPython 在解释器进程级别有一把锁,叫做GIL,即全局解释器锁。
    
      GIL保证CPython进程中,只有一个线程执行字节码。甚至是在多核CPU的情况下,也只允许同时只能有一个CPU上运行该进程的一个线程。
      CPython中:     IO密集型,某个线程阻塞,GIL会释放,就会调度其他就绪线程
        CPU密集型,当前线程可能会连续的获得GIL,导致其它线程几乎无法使用CPU
        在CPython中由于有GIL存在,IO密集型,使用多线程较为合算;CPU密集型,使用多进程,要绕开GIL。
      新版CPython正在努力优化GIL的问题,但不是移除。

      如果在意多线程的效率问题,请绕行Python,选择其它语言erlang、Go等。
      Python中绝大多数内置数据结构的读、写操作都是原子操作。

      由于GIL的存在,Python的内置数据类型在多线程编程的时候就变成了安全的了,但是实际上它们本身不是线程安全类型。
      保留GIL的原因:
        GvR坚持的简单哲学,对于初学者门槛低,不需要高深的系统知识也能安全、简单的使用Python。 而且移除GIL,会降低CPython单线程的执行效率。

    二.案例展示

    1>.单线程案例

     1 #!/usr/bin/env python
     2 #_*_conding:utf-8_*_
     3 #@author :yinzhengjie
     4 #blog:http://www.cnblogs.com/yinzhengjie
     5 
     6 import logging
     7 import datetime
     8 logging.basicConfig(level=logging.INFO, format="%(thread)s %(message)s")
     9 start = datetime.datetime.now()
    10 
    11 """
    12     注意,不要在代码中出现print等访问IO的语句。访问IO,线程阻塞,会释放GIL锁,其他线程被调度。
    13 """
    14 def calc():
    15     sum = 0
    16     for _ in range(1000000000): # 10亿
    17         sum += 1
    18 
    19 
    20 calc()
    21 calc()
    22 calc()
    23 calc()
    24 
    25 """
    26    当前代码是单线程程序,所有calc()依次执行,根本就不是并发。在主线程内,函数串行执行。
    27 """
    28 delta = (datetime.datetime.now() - start).total_seconds()
    29 logging.info(delta)
    30 
    31 
    32 
    33 #以上代码执行结果戳这里
    34 140736847635392 400.220969

    2>.多线程案例

     1 #!/usr/bin/env python
     2 #_*_conding:utf-8_*_
     3 #@author :yinzhengjie
     4 #blog:http://www.cnblogs.com/yinzhengjie
     5 
     6 import logging
     7 import datetime
     8 import threading
     9 
    10 logging.basicConfig(level=logging.INFO, format="%(thread)s %(message)s")
    11 start = datetime.datetime.now()
    12 
    13 """
    14     注意,不要在代码中出现print等访问IO的语句。访问IO,线程阻塞,会释放GIL锁,其他线程被调度。
    15 """
    16 def calc():
    17     sum = 0
    18     for _ in range(1000000000): # 10亿
    19         sum += 1
    20 
    21 
    22 t1 = threading.Thread(target=calc)
    23 t2 = threading.Thread(target=calc)
    24 t3 = threading.Thread(target=calc)
    25 t4 = threading.Thread(target=calc)
    26 
    27 t1.start()
    28 t2.start()
    29 t3.start()
    30 t4.start()
    31 
    32 t1.join()
    33 t2.join()
    34 t3.join()
    35 t4.join()
    36 """
    37     当前代码是多线程程序,calc()执行在不同的线程中,但是由于GIL的存在,线程的执行变成了假并发。但是这些线程可以被调度到不同的CPU核心上执行,只不过GIL让同一时间该进程只有一个线程被执行。
    38 """
    39 delta = (datetime.datetime.now() - start).total_seconds()
    40 logging.info(delta)
    41 
    42 
    43 #以上代码执行结果戳这里
    44 140736847635392 378.98106

    3>.总结

      从两段程序测试的结果来看,CPython中多线程根本没有任何优势,和一个线程执行时间相当。因为 GIL的存在,尤其是像上面的计算密集型程序,和单线程串行效果相当。这样,实际上就没有用上CPU 多核心的优势。

      因此,面对CPU密集型代码Cpython推荐使用多进程方式实现。

      博主推荐阅读:
        https://www.cnblogs.com/yinzhengjie/p/11894972.html
  • 相关阅读:
    【PAT甲级】1034 Head of a Gang (30分):图的遍历DFS
    循环的嵌套
    0.1+07 !=0.8的原因
    java script-页面交互
    java script-逻辑分支
    java script-数据类型转换&&运算符
    java script概述
    浏览器内核
    网格布局
    让一个元素在父元素上下左右居中
  • 原文地址:https://www.cnblogs.com/yinzhengjie/p/11893950.html
Copyright © 2011-2022 走看看