前文提到,Java对象创建后,会为对象分配一块内存空间,众所周知,设备的内存有限,也就意味着必须在一个合适的时机释放该内存空间,那么什么情况下这个对象的内存空间可以被释放呢?又是谁来执行该操作呢?
早期计算机语言中,内存对象的创建和回收需要开发者根据逻辑控制。在Java中,内存空间的回收自动执行,由GC(Garbage Collection)实现,GC执行时机随机,大多数情况下,在JVM内存不足的情况下,会触发GC回收内存。
那么GC如何判断对象是否可回收呢?通过对象回收算法。
对象回收算法
对于一个对象而言,其所属的内存空间是否可被回收,一般有 引用计数法 和 可达性算法 两种判断方式。
引用计数法
针对一个对象而言,给其设置一个唯一的计算器,被引用时,计算器+1,失效时为-1,为0则表示没有被引用,可以回收。
可达性算法
可达性算法中的可达说的是对GC Roots是否可达,在Java垃圾回收机制中,对于每个线程都有一个普通的引用根节点和一个静态的内存分配根节点,随线程执行,其所关联到的对象会形成一个树状结构,在GC出发时,会从树的根节点向下查询,将每一个查询的路径作为一个引用链,当一个对象不在任何一条引用链上时,则会判定为垃圾对象。
在对象被判定为垃圾对象后,仅仅是做一个标记,JVM还会给这些对象一次机会,当GC后,会先判断被标记对象是否执行了 finalize 方法,如没有执行,会执行 finalize方法,在方法内会再次进行可达性的判断,如果可达则不回收,如果确定不可达了,就会对其进行回收。所以一般至少要经过两次标记才会回收。
优劣势比较
引用计数法的优点:
- 内存回收即时,对象引用计数为0时,立刻回收内存空间
- 不需要从根引用节点遍历对象,从要被回收的对象遍历其引用的其他对象
- 引用关系变化时,触发回收
- 实现简单
引用计数法的缺点:
- 无法处理循环引用的情况,比如A,B对象互相引用
- 计数器操作频繁
- 计数器需要额外的内存空间,最坏的情况下要记录堆中的所有对象
可达性算法的优点:
- 解决了引用计数法无法解决的循环引用问题
可达性算法的缺点:
- 算法实现复杂度较高
内存回收算法
上文中我们已经了解到如果去判定一个对象是否可回收,那么对于可回收对象,其内存空间又该如何释放呢?
分代收集理论
分代收集理论描述的是针对Java堆内存空间而言,我们应该将其划分为不同区域,按照对象的年龄(对象年龄一般和GC后不被回收的次数关联)分配到不同的区域进行存储,分代收集理论主要有以下阐述:
- 弱分代假说,绝大多数对象都是朝生夕死;
- 强分代假说,熬过越多次垃圾收集过程的对象就越难以消亡;
- 跨代引用说,跨代引用相对于同代引用来说仅占极少数
按照对象年龄,可以堆内存空间分为新生代,老年代和永久代。在不同分代上,所适用的垃圾回收方式自然也不同,常见如下:
- Minor GC 新生代收集,目标只是新生代的垃圾收集;
- Major GC 老年代收集,目标是老年代的垃圾收集;
- Full GC 收集整个java堆和方法区的垃圾收集;
- Mixed GC 收集整个新生代以及部分老年代的垃圾收集,仅G1支持;
标记-清除算法
最早出现的最基础的垃圾收集算法,常用于老年代垃圾回收,算法原理是 标记出所有需要回收的对象,然后统计回收掉被标记对象所占用的内存空间 。从算法原理可以看出,当回收对象数量多时,执行效率偏低且对象回收后会形成大量的内存空间碎片,随着内存空间使用,逐渐会形成一些无法被利用的小碎片,从而降低内存利用率。
标记-复制算法
标记-复制算法主要为了解决标记-清除算法对大量对象执行效率低的问题,其通常用于新生代垃圾回收,算法原理是将 可用内存按容量划分为等大的A ,B两块区域,在对A进行回收时,将A中仍然存活的对象复制到B中,随后清理A的所有内存空间,在对B进行回收时,将B中仍然存活的对象复制到A中,随后清理B的所有内存空间,以此循环 。从算法原理可以看出,由于将内存区域分成等待的两块,造成了 内存空间浪费 ,随程序运行, 存活对象数量增多时,复制效率会比较低 。
标记-整理算法
标记-整理算法主要为了解决标记-清除算法内存空间碎片化的问题,其通常用于永久代垃圾回收,算法原理是 标记出所有需要回收的对象,随后整理所有存活对象到内存空间地址一端,清理掉边界以外的其他内存空间。从算法原理可以看出,由于需要将存活对象整理到内存一端,导致其垃圾回收时间会比标记-清除算法更久。
GC工作原理
从上图可以看出,新生代被分为Eden区以及等大的S0和S1区,首先在Eden区创建对象,当Eden区满时,触发Young GC,将S0和Eden区所有存活对象拷贝到S1区,随后清理S0和Eden区内存空间,随后将S0与S1互换,对于多次Young GC多次,仍然在S0/S1区中存活的对象(指的是在S0拷贝S1,S1拷贝到S0这样循环多次达到阀值),将其拷贝至老年代中,当老年代空间不足时,触发Full GC,整个内存空间进行一次垃圾回收。
特殊的是,对于大对象而言会直接进入老年代,如很长的字符串,元素数据庞大的数组等
GC Roots
GC Roots
就是对象引用的根节点,一个对象是否有引用,就是在树形图中查找它的GC Roots
,换言之就是它是否可以被任一GC Roots
触达,可以的话就说明它有引用。常见的可以作为GC Roots
的对象如下:
- 虚拟机栈中引用的对象:比如正在运行的方法中所使用的的参数,局部变量和临时变量等
- 方法区中静态属性引用的对象:比如
Java
类的引用类型静态变量 - 方法区中常量引用的对象:比如字符串常量池中的引用
-
JNI
方法中引用的对象 - 虚拟机内部的引用•所有被同步锁持有的对象
- 反映Java虚拟机内部情况的
JMXBean
,JVMTI
中注册的回调,本地代码缓存等