zoukankan      html  css  js  c++  java
  • Python的内存管理机制(垃圾回收)

    内存管理器

      Python 作为一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,与大多数编程语言不同,Python 中的变量无需事先申明,变量无需指定类型,程序员无需关心内存管理,Python 解释器给你自动回收。开发人员不用过多的关心内存管理机制,这一切全部由 Python 内存管理器承担了复杂的内存管理工作。

    Python内存池

    为什么要引入内存池

      当创建大量消耗小内存的对象时,频繁调用 new/malloc 会导致大量的内存碎片,致使效率降低。

      内存池的作用就是预先在内存中申请一定数量的,大小相等的内存块留作备用,当有新的内存需求时,就先从内存池中分配内存给这个需求,不够之后再申请新的内存。这样做最显著的优势就是能够减少内存碎片,提升效率。

    Python 中的内存管理机制为 Pymalloc

    内存池是如何工作的(how)

    CPython(Python 解释器)的内存架构图:

    • python 的对象管理主要位于 Level+1~Level+3 层

    • Level+3层:对于 python 内置的对象(比如 int,dict 等)都有独立的私有内存池,对象之间的内存池不共享,即int释放的内存,不会被分配给float使用

    • Level+2层:当申请的内存大小小于 256 KB 时,内存分配主要由 Python 对象分配器(Python’s object allocator)实施

    • Level+1层:当申请的内存大小大于 256 KB 时,由Python原生的内存分配器进行分配,本质上是调用 C 标准库中的 malloc/realloc 等函数

    关于释放内存方面,当一个对象的引用计数变为 0 时,Python 就会调用它的析构函数。调用析构函数并不意味着最终一定会调用 free 来释放内存空间,如果真是这样的话,那频繁地申请、释放内存空间会使Python的执行效率大打折扣。因此在析构时也采用了内存池机制,从内存池申请到的内存会被归还到内存池中,以避免频繁地申请和释放动作。

    垃圾回收机制

      Python 的垃圾回收机制采用引用计数机制为主,标记-清除分代回收机制为辅的策略。其中,标记-清除机制用来解决计数引用带来的循环引用而无法释放内存的问题,分代回收机制是为提升垃圾回收的效率。

    引用计数

      Python 通过引用计数来保存内存中的变量追踪,即记录该对象被其他使用的对象引用的次数。

      Python 中有个内部跟踪变量叫做引用计数器,每个变量有多少个引用,简称引用计数。当某个对象的引用计数为 0 时,就列入了垃圾回收队列。

    • 引用计数增加的情况

    1. 一个对象被分配给一个新的名字(例如:a=[1,2])

    2. 将其放入一个容器中(如列表、元组或字典)(例如:c.append(a))

    • 引用计数减少的情况:

    1. 使用 del 语句对对象别名显式的销毁(例如:del b)

    2. 对象所在的容器被销毁或从容器中删除对象(例如:del c )

    3. 引用超出作用域或被重新赋值(例如:a=[3,4])

    引用计数能够解决大多数垃圾回收的问题,但是遇到两个对象相互引用的情况,del 语句可以减少引用次数,但是引用计数不会归 0,对象也就不会被销毁,从而造成了内存泄漏问题。针对该情况,Python引入了标记-清除机制

    标记-清除

      标记-清除用来解决引用计数机制产生的循环引用,进而导致内存泄漏的问题 。循环引用只有在容器对象才会产生,比如字典,元组,列表等。

    顾名思义,该机制在进行垃圾回收时分成了两步,分别是:

    • 标记阶段,遍历所有的对象,如果是可达的(reachable),也就是还有对象引用它,那么就标记该对象为可达

    • 清除阶段,再次遍历对象,如果发现某个对象没有标记为可达(即为Unreachable),则就将其回收

    具体栗子

    • a引用b,b引用a,此时两个对象各自被引用了2次(去除getrefcout()的临时引用)

       

    • 执行del之后,对象a,b的引用次数都-1,此时各自的引用计数器都为1,陷入循环引用

       

    • 标记:找到其中的一端a,因为它有一个对b的引用,则将b的引用计数-1

       

    • 标记:再沿着引用到b,b有一个a的引用,将a的引用计数-1,此时对象a和b的引用次数全部为0,被标记为不可达(Unreachable)

       

    • 清除: 被标记为不可达的对象就是真正需要被释放的对象

    上面描述的垃圾回收的阶段,会暂停整个应用程序,等待标记清除结束后才会恢复应用程序的运行。为了减少应用程序暂停的时间,Python 通过“分代回收”(Generational Collection)以空间换时间的方法提高垃圾回收效率。

    分代回收

      对于程序,存在一定比例的内存块的生存周期比较短;而剩下的内存块,生存周期会比较长,甚至会从程序开始一直持续到程序结束。生存期较短对象的比例通常在 80%~90%之间。因此,简单地认为:对象存在时间越长,越可能不是垃圾,应该越少去收集。这样在执行标记-清除算法时可以有效减小遍历的对象数,从而提高垃圾回收的速度,是一种以空间换时间的方法策略

      Python 将所有的对象分为年轻代(第0代)、中年代(第1代)、老年代(第2代)三代。所有的新建对象默认是 第0代对象。当在第0代的gc扫描中存活下来的对象将被移至第1代,在第1代的gc扫描中存活下来的对象将被移至第2代。当某一代中被分配的对象与被释放的对象之差达到某一阈值时,就会触发当前一代的gc扫描。当某一代被扫描时,比它年轻的一代也会被扫描,因此,第2代的gc扫描发生时,第0,1代的gc扫描也会发生,即为全代扫描。

    gc扫描次数(第0代>第1代>第2代)

    总结

      总体而言,python 通过内存池来减少内存碎片化,提高执行效率。主要通过引用计数来完成垃圾回收,通过标记-清除解决容器对象循环引用造成的问题,通过分代回收提高垃圾回收的效率。

    参考:https://mp.weixin.qq.com/s/PGfpBKyzaRkKPYEI72c-Nw

                          

  • 相关阅读:
    定时器的使用
    new LayoutParams 使用
    判断,日期是是昨天,前天 ,今天
    google推出的SwipeRefreshLayout下拉刷新用法
    Intent的Flag
    Eclipse Java注释模板设置详解
    Eclipse的模板设置代码
    Android如何在java代码中设置margin
    软键盘挡住输入框的解决方案
    Android自定义遮罩层设计
  • 原文地址:https://www.cnblogs.com/zhuminghui/p/13410448.html
Copyright © 2011-2022 走看看