一、什么是GC
在Java中,对象所占用的内存在对象不再使用后会自动被回收。这些工作是由一个叫垃圾回收器 Garbage Collector
的进程完成的。
GC的优缺点
- 好处是
开发者无需过问内存管理,可以专注于解决实际问题。虽然内存泄露仍有可能会发生,但发生的概率比较小。
GC的智能算法可以在后台自动的进行内存管理,且这种管理在大多数时候是最佳的。
- 坏处是
当垃圾回收发生时,它会影响程序的性能,甚至会暂停程序的执行。这个被称为“Stop the world”垃圾回收机制,整个程序进程会被暂停以等待垃圾回收执行完。对某些应用而言,这可能是无法接受的。
开发者并不能指定何时或使用何种方法执行GC。
二、对象存活的判定
当一个对象不会再被使用的时候,我们会说这对象已经死亡。对象何时死亡,写程序的人应当是最清楚的。如果计算机也要弄清楚这件事情,就需要使用一些方法来进行对象存活判定,常见的方法有引用计数
(Reference Counting)有可达性分析
(Reachability Analysis)两种。
- 引用计数算法
引用计数算法的大致思想是给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是不可能再被使用的。它的实现简单,判定效率也很高,在大部分情况下它都是一个不错的算法,也有一些比较著名的应用案例,例如微软COM(Component Object Model)技术、使用ActionScript 3的FlashPlayer、Python语言和在游戏脚本领域得到许多应用的Squirrel中都使用了引用计数算法进行内存管理。
** 缺点 **
Java语言里面没有选用引用计数算法来管理内存,其中最主要原因是它没有一个优雅的方案去对象之间相互循环引用的问题:当两个对象互相引用,即使它们都无法被外界使用时,它们的引用计数器也不会为0。
- 可达性分析
这个算法的基本思路就是通过一系列的称为GC根节点(GC Roots)的对象作为起始点,从这些节点开始进行向下搜索,搜索所走过的路径成为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连(用图论的话来说就是从GC Roots到这个对象不可达)时,则证明此对象是不可用的。如下图所示,对象object 5、object 6、object 7虽然互相有关联,它们的引用并不为0,但是它们到GC Roots是不可达的,因此它们将会被判定为是可回收的对象。
三、Generational GC
这里我想重点说下Java内存中的堆区(Heap)GC是如何工作的。垃圾回收的过程也就是将堆区中不再需要对象清除的过程。几乎所有的GC都是分代的“分代的(generational)”,也就是说堆区会划分成很多的区块,也称为代。Hotspot的堆结构如下图所示:
New/Young Generation
大多数的应用中持有的对象很大部分是短生命周期的,这被称为“Weak generational hypothesis”。在垃圾回收期间分析应用中所有的对象是一件缓慢而耗时的工作,因此可以将短生命周期的对象在其被创建时就分隔出来。因此New Generation
可以进一步划分为:
Eden Space (Eden空间):所有的新创建的对象都存在与此。当其变满时,
minor GC
便会出现。然后所有仍然被引用的对象被移动到幸存者空间中。Survivor Spaces (幸存者空间):对不同的JVM而言,幸存者空间的实现方式也不尽相同,但基本原理都是相同的。New Generation中的每一个GC都会增加幸存者空间中的对象年龄。如果对象的年龄超过某个特定值(默认情况下是15),该对象会被移往Old G1eneration。
New Generation中的GC也被称为minor GC
。使用New Generation
的好处是可以减少分片带来的影响。
Old Generation
任何从New Generation中的幸存者空间中幸存下来的对象会被送往Old Generation。Old Generation通常比New Generation大很多。存在于Old Generation中的GC也被称为Full GC
。Full GC可以执行“Stop The World”机制,并且通常会占用更长的时间,因此Full GC也称为绝大不多的JVM可以进行优化的地方。
Metaspace
在Java 8中使用Metaspace
来存放类的元数据。
*(元数据(Meta Date),关于数据的数据或者叫做用来描述数据的数据或者叫做信息的信息。)。
四、回收机制的算法
标记—清除算法
标记—清除算法是最基础的收集算法,它分为“标记”和“清除”两个阶段:首先标记出所需回收的对象,在标记完成后统一回收掉所有被标记的对象,它的标记过程其实就是前面的根搜索算法中判定垃圾对象的标记过程。
扩展说明:标记—清除算法的执行情况如下图所示:
** 回收前状态 **
** 回收后状态 **
该算法有如下缺点:
标记和清除过程的效率都不高。
标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致,当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不触发另一次垃圾收集动作。
复制算法
复制算法是针对标记—清除算法的缺点,在其基础上进行改进而得到的,它将可用内存按容量分为大小相等的两块,每次只使用其中的一块,当这一块的内存用完了,就将还存活着的对象复制到另外一块内存上面,然后再把已使用过的内存空间一次清理掉。
复制算法有如下优点:
每次只对一块内存进行回收,运行高效。
只需移动栈顶指针,按顺序分配内存即可,实现简单。
内存回收时不用考虑内存碎片的出现。
缺点:可一次性分配的最大内存缩小了一半。
扩展说明
复制算法的执行情况如下图所示:
回收前状态:
回收后状态:
标记—整理算法
复制算法比较适合于新生代,在老年代中,对象存活率比较高,如果执行较多的复制操作,效率将会变低,所以老年代一般会选用其他算法,如标记—整理算法。该算法标记的过程与标记—清除算法中的标记过程一样,但对标记后出的垃圾对象的处理情况有所不同,它不是直接对可回收对象进行清理,而是让所有的对象都向一端移动,然后直接清理掉端边界以外的内存。
扩展说明
标记—整理算法的回收情况如下所示:
回收前状态:
回收后状态:
五、System.gc() and finalize()
- System.gc()
我们可以调用System.gc()
方法建议JVM执行垃圾回收。然后,并没有任何保证说JVM一定会执行该操作。作为开发者,我们无法知晓JVM是否执行了我们的代码。并且,通常认为使用System.gc()
是个很不明智的做法。
- finalize()
finalize()
方法存在于java.lang.Object
类中,可以被所有对象所使用。默认情况下其不执行任何动作。当垃圾回收器确定了一个对象没有任何引用时,其会调用finalize()
方法。但是,finalize方法并不一定会被执行,因此也不建议覆写finalize()
该方法。