JVM原理
什么是JVM
虚拟机、字节码、平台无关
java内存模型:JMM
JVM运行时的数据区
- 程序计数器 - 线程私有
- java虚拟机栈 - 线程私有
- 本地方法栈 - 线程私有
- java堆 - 线程公用
- 方法区 - 线程公用
JVM内存分配
- 栈内存分配
- 保存参数、局部变量、中间计算过程和其他数据。退出方法的时候,修改栈顶指针就可以把栈中的内容销毁。
- 栈的优点:存取速度比堆快,仅次于寄存器,栈的数据可以共享。
- 栈的缺点:存在栈中的数据大小,生存期是在编译时就确定的,导致缺乏灵活性。
- 堆内存分配
- 堆的优点:动态分配内存大小,生存期不必事先告诉编译器,它是在运行期动态分配的,垃圾回收器自动收走不再使用的区域。
- 堆的缺点:运行时动态分配内存,在分配和销毁时都要占用时间,因此堆的效率较低。
java堆结构和垃圾回收
JVM堆配置参数
- -Xms 初始堆大小 默认物理内存的1/64(<1GB)
- -Xmx 最大堆大小 默认物理内存的1/4(1<GB),实际建议不大于4GB
- 一般建议设置 -Xms=-Xmx 好处是避免每次gc后,调整堆的大小,减少系统内存的分配
- 整个堆的大小=年轻代大小+年老代大小+持久代大小
JVM新生代(young generation)
- 新生代=1个eden区+2个Survivor区
- -Xmn 年轻代大小(1.4or lator) -XX:NewSize,-XX:MaxNewSize(设置年轻代大小(for 1.3/1.4)) 默认大小为整个堆的3/8
- -XX:NewRatio 年轻代(包括Eden区和两个Survivor区)与年老代的比值(除去持久代)Xms=Xmx并且设置了Xmn情况下,该参数不需要设置
- -XX:SurvivorRatio Eden区与Survivor区的大小比值,设置为8,则两个Survivor区与一个Eden区的比值为2:8,一个Survivor区占整个年轻代的1/10
- 用来存放JVM刚分配的Java对象。
JVM老年代(tenured generation)
- 老年代=整个堆-年轻代大小-持久代大小
- 年轻代中经过垃圾回收没有回收掉的对象,被复制到老年代
- 老年代存储对象比年轻代年龄大的多,而且不乏大对象
- 新建对象也可能直接进入老年代
- 大对象,可以通过启动参数设置-XX:PretenureSizeThreshold=1024(单位为字节,默认为0)来代表超过多大时就不在新生代分配。
- 大的数组对象,且数组中无引用外部对象。
- 老年代大小无配置参数。
JVM持久代(perm generation)
1.持久代=整个堆-年轻代大小-老年代大小
- -XX:PermSize -XX:MaxPermSize -》 设置持久代大小,一般情况下推荐吧-XX:PermSize设置成XX:MaxPermSize的值相同的值,因为永久代大小的调整也会导致堆内存需要出发fgc。
- 存放Class、Method元信息,其大小与项目的规模、类、方法的数量有关。一般设置为128M就自购了,设置原则是预留30%空间。
- 永久代回收方式
- 常量池中的常量,无用的类信息,常量的回收很简单,没有引用了就可以被回收。
- 对于无用的类进行回收,必须保证3点:
- 类的所有实例都已经回收
- 加载类的classloader已经被收回
- 类对象的class对象没有被引用(即使没有通过反射引用该类的地方)
JVM内存垃圾回收
JVM垃圾收集算法
1.引用计数算法
每个对象有有一个引用计数属性,新增一个引用时计数加1,引用释放时计数减1,计数为0时可以回收。此方法简单无法解决对象相互循环应用问题。还有一个问题是如何解决精准计数。
- 根搜索法
从GC Roots开始向下搜索,搜索所走过的路径称为引用链。当一个对象的GC Roots没有任何引用链时,则证明对象是不可用的,不可达对象。
在java语言中,GC Roots包括:
- 虚拟机栈中引用的对象。
- 方法区中静态属性实体引用的对象。
- 方法区中常量引用的对象。
- 本地方法栈中JNI引用的对象。
JVM垃圾回收算法
- 复制算法(Copying)
- 标记清除算法(Mark-Sweep)
- 标记整理压缩算法(Mark-Compac)
名词解释
- 串行回收:gc单线程内存回收、会暂停所有用户线程
- 并行回收:收集是指多个GC线程并行工作,但此时用户线程是暂停的;所以,Serial是串行的,Parallel收集器是并行的,而CMS收集器是并发的。
- 并发回收:是指用户线程与GC线程同时执行(不一定是并行,可能交替,但总体上是同时执行的),不需要停顿用户线程(其实在CMS中用户线程还是需要停顿的,只是非常短,GC线程在同一个CPU上执行)
JVM常见的垃圾回收器
- HotSpot收集器
- Serial回收器(串行回收器)
- ParNew回收器(并行回收器)
- CMS(并发标记清除)回收器
GC性能指标
- 吞吐量 应用花在GC上的时间百分比
- GC负荷 与吞吐量相反,指应用在GC上的时间百分比
- 暂停时间 应用花在GC stop-the-world的时间
- GC频率 顾名思义
- 反应速度 从一个对象变成垃圾到这个对象被回收的时间
- 一个交互式的应用要求暂停时间越少越好,然而,一个非交互性的应用,当然是希望GC负荷越低越好。
- 一个实时系统对暂停时间和GC负荷的要求,都是越低越好。
- 一个嵌入式系统当然希望Footprint越小越好。
内存容量配置原则
- 年轻代大小的选择
- 响应时间有限应用:尽可能的设大,知道接近系统的最低响应时间的限制(根据实际情况的选择),在此种情况下,年轻代收集发生的频率也是最小的,同时,减少到达年老代的对象。
- 吞吐量优先的应用:尽可能的设置大,可能达到Gbit的程度。因为对响应时间没有要求,垃圾收集可以并行进行。
- 避免设置过小,当新生代设置过小时会导致:1.YGC次数更加频繁 2.可能导致YGC对象直接进入旧生代,如果此时旧生代满了,会出发FGC。
- 年老代大小的选择
- 响应时间有限的应用:年老代使用并发收集器,所以其大小需要小心设置,一般要考虑并发会话率和会话持续时间等一些参数,如果堆设置小了,可能会造成内存碎片,高回收频率以及应用暂停而使用传统的标记清楚方式:如果堆大了,则需要较长的收集时间,最优化的方案,一般需要参考一下数据获得:
并发垃圾收集信息,持久代并发收集次数、传统GC信息、华仔年轻代和年老代回收商的时间比例。
吞吐量优先的应用:一般吞吐量优先的应用都有一个很大的年轻代和一个较小的年老代。原因是,这样可以尽可能回收掉大不符短期对象,减少中期对象,而年老代尽存放长期存活对象。