1.怎么确定对象是垃圾
1.1 引用计数法
对于某个对象而言,只要应用程序中持有该对象的引用,就说明该对象不是垃圾,如果一个对象没有任何指针对其引用,它就是垃圾。当两个对象互相引用时,导致永远不能被回收。
1.2 可达性分析法
通过GC Root的对象,开始向下寻找,看某个对象是否可达。
能作为GC Root:类加载器、Thread、虚拟机栈的本地变量表、static成员、常量引用、本地方法栈的变量等。
2. 垃圾回收算法
- 标记-清除:
先标记,后清除,产生大量的空间碎片。用在老年代 - 标记-整理:
先标记,后整理,不会产生空间碎片。用在老年代 - 复制算法:
将内存划分为两块相等的区域,每次只使用其中一块。空间利用率低。用在新生代
3. 垃圾收集器
针对Yong区和Old区的垃圾回收算法不同,这里有不同的垃圾收集器。
-
Serial收集器
Yong区的一个单线程的垃圾收集器,不仅仅意味着它只会使用一个CPU或者一条收集线程去完成垃圾收集工作,更重要的是其在进行垃圾收集的时候需要暂停其他线程。
优点:简单高效,拥有很高的单线程收集效率
缺点:收集过程需要暂停所有线程
算法:复制算法
适用范围:新生代
应用:Client模式下的默认新生代收集器
回收过程
-
ParNew收集器
可以把这个收集器理解为Serial收集器的多线程版本.
优点:在多CPU时,比Serial效率高。
缺点:收集过程暂停所有应用程序线程,单CPU时比Serial效率差。
算法:复制算法
适用范围:新生代
应用:运行在Server模式下的虚拟机中首选的新生代收集器
回收过程
-
Parallel Scavenge收集器
Parallel Scavenge收集器是一个新生代收集器,它也是使用复制算法的收集器,又是并行的多线程收集器,看上去和ParNew一样,但是Parallel Scanvenge更关注系统的吞吐量.
吞吐量=运行用户代码的时间/(运行用户代码的时间+垃圾收集时间)
比如虚拟机总共运行了100分钟,垃圾收集时间用了1分钟,吞吐量=(100-1)/100=99%。
若吞吐量越大,意味着垃圾收集的时间越短,则用户代码可以充分利用CPU资源,尽快完成程序的运算任务。
-
Serial Old收集器
Serial Old收集器是Serial收集器的老年代版本,也是一个单线程收集器,不同的是采用"标记-整理算法",运行过程和Serial收集器一样。
-
Parallel Old收集器
Parallel Old收集器是Parallel Scavenge收集器的老年代版本,使用多线程和"标记-整理算法"进行垃圾回收。
CMS垃圾收集器
CMS(Concurrent Mark Sweep)收集器是一种以获取 最短回收停顿时间为目标的收集器。采用的是"标记-清除算法",整个过程分为4步。
(1)初始标记 CMS initial mark 标记GC Roots能关联到的对象 Stop The World
(2)并发标记 CMS concurrent mark 进行GC Roots Tracing
(3)重新标记 CMS remark 修改并发标记因用户程序变动的内容 Stop The World
(4)并发清除 CMS concurrent sweep
优点:并发收集、低停顿
缺点:产生大量空间碎片、并发阶段会降低吞吐量
回收过程
- G1垃圾收集器
使用G1收集器时,Java堆的内存布局与就与其他收集器有很大差别,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。
特点:
并行与并发
分代收集(仍然保留了分代的概念)
空间整合(整体上属于“标记-整理”算法,不会导致空间碎片)
可预测的停顿(比CMS更先进的地方在于能让使用者明确指定一个长度为M毫秒的时间片段内,消耗在垃圾收集 上的时间不得超过N毫秒)
回收步骤:
初始标记(Initial Marking): 标记一下GC Roots能够关联的对象,并且修改TAMS的值,需要暂停用户线程。
并发标记(Concurrent Marking): 从GC Roots进行可达性分析,找出存活的对象,与用户线程并发执行。
最终标记(Final Marking): 修正在并发标记阶段因为用户程序的并发执行导致变动的数据,需 暂停用户线程。
筛选回收(Live Data Counting and Evacuation): 对各个Region的回收价值和成本进行排序,根据 用户所期望的GC停顿时间制定回收计划。
4. 垃圾收集器分类
- 串行收集器--->Serial和Serial Old
只能有一个垃圾回收线程执行,用户线程暂停。 适用于内存比较小的嵌入式设备 。
- 并行收集器[吞吐量优先]--->Parallel Scanvenge、Parallel Old
多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。 适用于科学计算、后台处理等若交互场景 。
- 并发收集器[停顿时间优先]--->CMS、G1
用户线程和垃圾收集线程同时执行(但并不一定是并行的,可能是交替执行的),垃圾收集线程在执行的时候不会停顿用户线程的运行。 适用于相对时间有要求的场景,比如Web 。
5. 如何选择适合的垃圾收集器
官网建议
https://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/collectors.html#sthref28
- 优先调整堆的大小让服务器自己来选择
- 如果内存小于100M,使用串行收集器
- 如果是单核,并且没有停顿时间要求,使用串行或JVM自己选
- 如果允许停顿时间超过1秒,选择并行或JVM自己选
- 如果响应时间最重要,并且不能超过1秒,使用并发收集器