zoukankan      html  css  js  c++  java
  • 《垃圾回收的算法与实现》——Python垃圾回收

    Python垃圾回收

    python采用引用计数法进行垃圾回收

    Python内存分配

    • python在分配内存空间时,在malloc之上堆放了3个独立的分层。
    • python内存分配时主要由arena、pool和block三个构成。

    第0层

    • 该层指glibc的malloc()这样的分配器,是对OS申请内存的部分。
    • python中如果生成的对象大于256B直接调用malloc,否则直接通过第1、2层分配。

    第1层

    • 该层主要管理arena,arena大小固定为256KB,其中保存了arena中开头的pool的地址。
    • 同时保持被分配的pool的数量、将空pool连接到单向链表的功能。
    • arena是被数组arenas管理。
    • unused_arena_objects单向链表连接未使用的arena,包括新生的或使用过但已废弃的。
    • usable_arenas双链表,其中arena分配了可利用的pool。

    第2层

    • 该层主要管理pool中的block,大小固定为4KB,每个pool的开头地址按照4KB的倍数对齐,与OS的页重合。
    • 在arena中将各个pool相连接。
    • pool被分隔成一个个的block,在pool初始化时就决定了该pool内的block的大小,block的大小是8B的整数倍,最大不超过256B。
    • Python分配时使用Best-fit,分配的block的大小最接近申请大小。
    • usedpools是保持pool的数组,每个pool用双向链表相连,数组中第一个位置中的是8B的pool集合直到第32个位置中的256B的pool。
    • 当usedpools中的pool的所有block被释放给arena。
    • block包括已经分配、使用完毕和未使用三种状态,后两者均可以将对象分配进去。
    • pool中定义了freeblock空闲表,用于链接使用完毕的block,而未使用的则在pool开头的nextoffset记录已分配的偏移。

    分配

    • 根据申请的大小找到usedpools的索引。
    • 当usedpools中指定索引的pool被分配了则从pool中freeblock尝试获取block,不行则通过偏移取出block,如果pool内没有能分配的block则将pool从usedpools中移除。
    • 如果没有block则通过new_arena将新的arena添加到usable_arensa中,如果分配失败则调用malloc。
    • 初始化pool,从arena的freepools中获取一个pool插入到usedpools的开头,而后检查pool固定block大小与申请的block大小是否相同,如果不同则还需要初始化pool

    释放

    • 将释放对象的block连接到freeblock。
    • 当pool内无已经分配的pool则将该pool连接到arena的freepools同时从usedpools中移除。
    • 当arena为空,从usable_arena移除,连接到unused_arena_objects中。
    • 当arena只有一个空pool时,即之前所有pool均被使用此时释放了一个pool,因此需要加入到usable_arenas。
    • usable_arenas内按照空pool的数量从小到大进行排序。usedpools也是优先使用被利用最多的pool。

    对象特有的分配器

    • python中各种类型的对象持有各自的分配器。
    • 不同的对象拥有不同的空闲链表(数组),使用完毕的对象初始化后加入到该链表。
    • 如果空闲链表满了则直接释放。

    引用计数

    • 对象内部有个计数器,32位环境下为int型,64位环境下为long型,指针为4的倍数因此使用这个长度还能多出两位。

    循环引用垃圾回收

    • 对象链表(双向链表)连接各个对象,对象的引用计数器复制到自对象内的另一个位置。
    • 对复制的计数器中非根直接引用的减1。
    • 将对象分为可能到达的对象的链表,复制计数器大于1或有从活动对象的引用。
    • 将其余对象放如不可能到达的对象的链表,这些对象即是循环引用垃圾。
    • 容器对象:可能保留了指向其他对象的运用的对象
    • 循环引用的对象只可能出现在容器对象,可以将容器对象用对象链表连接。
    • 分代容器对象链表,分为3代,每代有个阈值,超过该阈值则进行该代的回收。同时每回收一次进行晋升一次。
  • 相关阅读:
    数组和排序算法(冒泡、选择、插入排序)
    异常
    线程的五个状态,sleep和wait
    ArrayList、Vector、LinkedList
    String,StringBuffer,StringBuilder的区别
    Math.round(),Math.ceil(),Math.floor()的区别
    单例模式之双重锁模式、静态内部类模式、饿汉模式、懒汉模式,和安全的懒汉模式
    工厂模式简单的汽车工厂
    存储过程的优点
    数据库SQL特点数据查询,数据操纵,数据定义,数据控制,建立索引, 事务acid,数据库隔离级别
  • 原文地址:https://www.cnblogs.com/suolu/p/6664210.html
Copyright © 2011-2022 走看看