PHP垃圾回收说到底是对变量及其所关联内存对象的操作,
所以在讨论PHP的垃圾回收机制之前,先简要介绍PHP中变量及其内存对象的内部表示(其C源代码中的表示)。
PHP官方文档中将PHP中的变量划分为两类:标量类型和复杂类型。
标量类型包括布尔型、整型、浮点型和字符串;
复杂类型包括数组、对象和资源;
还有一个NULL比较特殊,它不划分为任何类型,而是单独成为一类。
PHP5.2中使用的内存回收算法是大名鼎鼎的Reference Counting,
这个算法中文翻译叫做“引用计数”,其思想非常直观和简洁:
为每个内存对象分配一个计数器,当一个内存对象建立时计数器初始化为1(因此此时总是有一个变量引用此对象),
以后每有一个新变量引用此内存对象,则计数器加1,而每当减少一个引用此内存对象的变量则计数器减1,
当垃圾回收机制运作的时候,将所有计数器为0的内存对象销毁并回收其占用的内存。
而PHP中内存对象就是zval,而计数器就是refcount__gc。
“引用计数”存在问题,就是当两个或多个对象互相引用形成环状后,
内存对象的计数器则不会消减为0;
这时候,这一组内存对象已经没用了,但是不能回收,从而导致内存泄露;
php5.3开始,使用了新的垃圾回收机制,
首先PHP会分配一个固定大小的“根缓冲区”,
这个缓冲区用于存放固定数量的zval,
这个数量默认是10,000,
如果需要修改则需要修改源代码Zend/zend_gc.c中的常量GC_ROOT_BUFFER_MAX_ENTRIES然后重新编译。
由上文我们可以知道,
一个zval如果有引用,要么被全局符号表中的符号引用,要么被其它表示复杂类型的zval中的符号引用。
因此在zval中存在一些可能根(root)。
这里我们暂且不讨论PHP是如何发现这些可能根的,这是个很复杂的问题,
总之PHP有办法发现这些可能根zval并将它们投入根缓冲区。
当根缓冲区满额时,PHP就会执行垃圾回收,此回收算法如下:
1、对每个根缓冲区中的根zval按照深度优先遍历算法遍历所有能遍历到的zval,
并将每个zval的refcount减1,同时为了避免对同一zval多次减1
(因为可能不同的根能遍历到同一个zval),每次对某个zval减1后就对其标记为“已减”。
2、再次对每个缓冲区中的根zval深度优先遍历,
如果某个zval的refcount不为0,则对其加1,否则保持其为0。
3、清空根缓冲区中的所有根(注意是把这些zval从缓冲区中清除而不是销毁它们),
然后销毁所有refcount为0的zval,并收回其内存。
如果不能完全理解也没有关系,只需记住PHP5.3的垃圾回收算法有以下几点特性:
1、并不是每次refcount减少时都进入回收周期,只有根缓冲区满额后在开始垃圾回收。
2、可以解决循环引用问题。
3、可以总将内存泄露保持在一个阈值以下。
与垃圾回收算法相关的PHP配置
可以通过修改php.ini中的zend.enable_gc来打开或关闭PHP的垃圾回收机制,
也可以通过调用gc_enable()或gc_disable()打开或关闭PHP的垃圾回收机制。
在PHP5.3中即使关闭了垃圾回收机制,PHP仍然会记录可能根到根缓冲区,
只是当根缓冲区满额时,PHP不会自动运行垃圾回收,
当然,任何时候您都可以通过手工调用gc_collect_cycles()函数强制执行内存回收。
原文链接http://www.cnblogs.com/leoo2sk/archive/2011/02/27/php-gc.html