golang中的gc采用三色标记法。在讲三色标记法之前,先了解一下Mark and Sweep算法,因为Mark and Sweep算法是三个标记法的一个改进版。
Mark and Sweep算法: 停止运行程序,遍历所有被引用的变量,被引用的对象被标记为“被引用”,没有被标记的进行回收。内存单元并不会立刻回收对象,而是将其标记为“不可达”状态。直到到达某个阈值或者到达某个时间间隔后,对其进行垃圾回收。算法分为两部分:标记(Mark)和清理(Sweep)。挂起程序,对所有存活的内存单元进行扫描,标记,确定哪些可以清除。优点是解决了相互引用的缺点,不足是会停止应用程序,当内存单元变量过多时,扫描清除会花很长时间,甚至几百毫秒。
三色标记法:属于标记清除法的一个改进版。起初所有内存对象都在白色的,从根出发标记所有的对象,标记为灰色,并放入一个队列。然后再将灰色队列中的对象取出,将其引用对象标记为黑色。重复此步骤,待灰色对象队列为空时,所有白色对象既为垃圾。最后白色区域内存对象被释放,黑色区域标记为白色,等待下一阶段GC再次扫描。
三色标记法触发有两个条件:第一个是阀值,就是内存扩大一倍时启动GC。第二个是每隔两分钟GC一次。
三色标记法的具体过程
1、GC开始的时候stop the world。对内存中的对象进行扫描。扫描完毕后,start the world。程序继续运行,GC同时开始标记。
2、将线程(goroutine)直接引用的对象标记为灰色,将灰色内存对象标记为黑色。同时将灰色内存对象引用的对象标记为灰色。
3、反复第2步直到灰色区域为空。此时只有黑色和白色区域了。
4、stop the world, again! 利用写屏障机制,将GC扫描时新创建的对象一律标记为灰色,然后变成黑色。
5、将内存对象被标记为白色的进行释放sweep。
6、剩下的内存全部标记为白色,以便下一次GC使用。
如何优化GC
写代码时,如果要考虑GC对性能的影响,那么要避免要用string+操作,改用var buf bytes.Buffer,用buf.WriteString("xxxx")操作。因为没有string+操作都会生成一个新的string,产生多余的内存碎片。还有就是尽量复用小对象,局部变量需要尽量少声名,多个小对象可以放到一个结构体中,这样方便GC扫描。