zoukankan      html  css  js  c++  java
  • Python内存管理

    最近面试问到了Python的内存管理机制,在这里简单总结一下,我在这里参考了某位大神的博客https://www.cnblogs.com/sunBinary/p/10934140.html,总结的当然比我的更好,大家有兴趣可以去看看~

    一、变量与对象

    1、变量,通过变量指针引用对象

      变量指针指向具体对象的内存空间,取对象的值。

    2、对象,类型已知,每个对象都包含一个头部信息(头部信息:类型标识符引用计数器

    注意:

    ​变量名没有类型,类型属于对象(因为变量引用对象,所以类型随对象),变量引用什么类型的对象,变量就是什么类型的。

    >>> var1=123
    >>> var2=var1
    >>> id(var1)
    140716553973968
    >>> id(var2)
    140716553973968

    说明:

    ​id()是python的内置函数,用于返回对象的身份,即对象的内存地址。

    >>> var1=123
    >>> var2=var1
    >>> id(var1)
    140716553973968
    >>> id(var2)
    140716553973968
    >>> var1=567
    >>> id(var1)
    1661397914192
    >>> id(var2)
    140716553973968

    引用所指判断

    通过is进行引用所指判断,is是用来判断两个引用所指的对象是否相同。

    整数

    In [46]: a=1
    In [47]: b=1
    In [48]: print(a is b)
    True

    短字符串

    In [49]: c="good"
    In [50]: d="good"
    In [51]: print(c is d)
    True

    长字符串

    In [52]: e="very good"
    In [53]: f="very good"
    In [54]: print(e is f)
    False

    列表

    In [55]: g=[]
    In [56]: h=[]
    In [57]: print(g is h)
    False

    由运行结果可知:

    1、Python缓存了整数和短字符串,因此每个对象在内存中只存有一份,引用所指对象就是相同的,即使使用赋值语句,也只是创造新的引用,而不是对象本身;

    2、Python没有缓存长字符串、列表及其他对象,可以由多个相同的对象,可以使用赋值语句创建出新的对象。

    3、python中对大于256的整数,会重新分配对象空间地址保存对象;对于字符串来说,如果不包含空格的字符串,则不会重新分配对象空间,对于包含空格的字符串则会重新分配

    ​ (a = 256, b = 256 , a is b == true, a = 300, b= 300, a is b == false;

    ​ x = "abc ef" , y="abc ef" x is y == false)

    二、引用计数

    在Python中,每个对象都有指向该对象的引用总数---引用计数

    查看对象的引用计数:sys.getrefcount()

    1、普通引用

    In [2]: import sys
    
    In [3]: a=[1,2,3,4]
    In [4]: sys.getrefcount(a)
    Out[4]: 2
    
    In [5]: b=a
    In [6]: sys.getrefcount(a)
    Out[6]: 3
    
    In [7]: sys.getrefcount(b)
    Out[7]: 3

    注意:

      当使用某个引用作为参数,传递给getrefcount()时,参数实际上创建了一个临时的引用。因此,getrefcount()所得到的结果,会比期望的多1。

    2、容器对象

    Python的一个容器对象(比如:列表、词典等),可以包含多个对象。

    In [12]: a=[1,2,3,4,5]
    In [13]: b=a
    
    In [14]: a is b
    Out[14]: True
    
    In [15]: a[0]=6
    In [16]: a
    Out[16]: [6, 2, 3, 4, 5]
    
    In [17]: a is b
    Out[17]: True
    
    In [18]: b
    Out[18]: [6, 2, 3, 4, 5]

    即像字典(dict),列表(List)等容器对象,改变一个就会引起另一个的改变,也称之为浅拷贝(这里关于深浅拷贝可以看我之前写的博客https://www.cnblogs.com/sunny0824/p/13418563.html)。

     3、引用计数的增加

    (1)对象被创建

    In [39]: sys.getrefcount(123)
    Out[39]: 6
    
    In [40]: n=123
    In [41]: sys.getrefcount(123)
    Out[41]: 7

    (2) 另外的别人被创建

    In [42]: m=n
    In [43]: sys.getrefcount(123)
    Out[43]: 8

    (3) 作为容器对象的一个元素

    In [44]: a=[1,12,123]
    In [45]: sys.getrefcount(123)
    Out[45]: 9

    (4) 作为参数传递给函数:foo(x)

    4、引用计数减少

    (1) 对象的别名被显式的销毁

    In [46]: del m
    In [47]: sys.getrefcount(123)
    Out[47]: 8

    (2) 对象的一个别名被赋值给其他对象

    In [48]: n=456
    In [49]: sys.getrefcount(123)
    Out[49]: 7

    (3) 对象从一个窗口对象中移除,或,窗口对象本身被销毁

    In [50]: a.remove(123)
    In [51]: a
    Out[51]: [1, 12]
    
    In [52]: sys.getrefcount(123)
    Out[52]: 6

    三、垃圾回收

    当Python中的对象越来越多,占据越来越大的内存,启动垃圾回收(garbage collection),将没用的对象清除。

    1、原理

      当Python的某个对象的引用计数降为0时,说明没有任何引用指向该对象,该对象就成为要被回收的垃圾。比如某个新建对象,被分配给某个引用,对象的引用计数变为1。如果引用被删除,对象的引用计数为0,那么该对象就可以被垃圾回收。

    In [74]: a=[321,123]
    In [75]: del a

    2、解析del

    ​ del a后,已经没有任何引用指向之前建立的[321,123],该表引用计数变为0,用户不可能通过任何方式接触或者动用这个对象,当垃圾回收启动时,Python扫描到这个引用计数为0的对象,就将它所占据的内存清空。

    3、注意

      (1)、垃圾回收时,Python不能进行其它的任务,频繁的垃圾回收将大大降低Python的工作效率;

      (2)、Python只会在特定条件下,自动启动垃圾回收(垃圾对象少就没必要回收)

      (3)、当Python运行时,会记录其中分配对象(object allocation)和取消分配对象(object deallocation)的次数。当两者的差值高于某个阈值时,垃圾回收才会启动。

    In [93]: import gc
    In [94]: gc.get_threshold()  #gc模块中查看阈值的方法
    Out[94]: (700, 10, 10)

    阈值分析:

      700即是垃圾回收启动的阈值;

      每10次0代垃圾回收,会配合1次1代的垃圾回收;而每10次1代的垃圾回收,才会有1次的2代垃圾回收;

    当然也是可以手动启动垃圾回收:

    In [95]: gc.collect()    #手动启动垃圾回收
    Out[95]: 2

    4、何为分代回收

      Python将所有的对象分为0,1,2三代;

      所有的新建对象都是0代对象;

      当某一代对象经历过垃圾回收,依然存活,就被归入下一代对象。

    四、内存池机制

    Python中有分为大内存和小内存:(256K为界限分大小内存)

    ​ 1、大内存使用malloc进行分配

    ​ 2、小内存使用内存池进行分配

    ​ 3、Python的内存池(金字塔)

    ​ 第3层:最上层,用户对Python对象的直接操作

      第1层和第2层:内存池,有Python的接口函数PyMem_Malloc实现-----若请求分配的内存在1~256字节之间就使用内存池管理系统进行分配,调用malloc函数分配内存,但是每次只会分配一块大小为256K的大块内存,不会调用free函数释放内存,将该内存块留在内存池中以便下次使用。

      第0层:大内存-----若请求分配的内存大于256K,malloc函数分配内存,free函数释放内存。

      第 -1,-2层:操作系统进行操作

    ​ python内存分配情况图

    Python的内存机制以金字塔行,-1,-2层主要有操作系统进行操作,

      第0层是C中的malloc,free等内存分配和释放函数进行操作;

      第1层和第2层是内存池,有Python的接口函数PyMem_Malloc函数实现,当对象小于256K时有该层直接分配内存;

      第3层是最上层,也就是我们对Python对象的直接操作;

    在 C 中如果频繁的调用 malloc 与 free 时,是会产生性能问题的.再加上频繁的分配与释放小块的内存会产生内存碎片. Python 在这里主要干的工作有:

      如果请求分配的内存在1~256字节之间就使用自己的内存管理系统,否则直接使用 malloc.

      这里还是会调用 malloc 分配内存,但每次会分配一块大小为256k的大块内存.

      经由内存池登记的内存到最后还是会回收到内存池,并不会调用 C 的 free 释放掉.以便下次使用.对于简单的Python对象,例如数值、字符串,元组(tuple不允许被更改)采用的是复制的方式(深拷贝?),也就是说当将另一个变量B赋值给变量A时,虽然A和B的内存空间仍然相同,但当A的值发生变化时,会重新给A分配空间,A和B的地址变得不再相同

  • 相关阅读:
    【Hadoop 分布式部署 五:分布式部署之分发、基本测试及监控】
    【Hadoop 分布式部署 四:配置Hadoop 2.x 中主节点(NN和RM)到从节点的SSH无密码登录】
    【Hadoop 分布式部署 三:基于Hadoop 2.x 伪分布式部署进行修改配置文件】
    【Hadoop 分布式部署 二:分布式环境预备工作(主机名 IP地址等设置)】
    【Hadoop 分布式部署 一 :分布式部署准备虚拟机 】
    Java基础 【类之间的关系】
    Java基础 【自动装箱和拆箱、面试题】
    java算法 第七届 蓝桥杯B组(题+答案) 3.凑算式
    java算法 第七届 蓝桥杯B组(题+答案) 2.生日蜡烛
    java算法 第七届 蓝桥杯B组(题+答案) 1.煤球数目
  • 原文地址:https://www.cnblogs.com/sunny0824/p/13569327.html
Copyright © 2011-2022 走看看