声明:本文摘抄自《深入理解Java虚拟机》一书,本文完全为自我学习,请感兴趣的同学购买正版,支持原创
虚拟机把描述类的数据从Class加载到内存,并对数据进行校验,转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。
类加载机制
类从被虚拟机加载到内存开始,到卸载出内存结束,它的整个生命周期包括:加载(Loading),验证(Verification),准备(Preparation),解析(Resolution),初始化(Initialization),使用(Using)和卸载(Unloading)7个阶段。其中验证,准备,解析3个过程统称为连接(Linking),这7个阶段发生的顺序如下图:
加载,验证,准备,初始化和卸载这5个阶段的顺序是确定的,类的加载过程中必须按照这种顺序按部就班地开始。而解析阶段不一定:它在某些情况下可以在初始化之后执行,这是为了支持Java语言的运行时绑定。这里写的是按部就班的“开始”,而不是按部就班地“进行”或“完成”,强调这点是因为这些阶段通常都是相互交叉的混合式进行,通常会在一个阶段执行的过程中调用或激活另一个阶段。
什么情况下需要开始类加载的第一阶段:加载?Java虚拟机规范中没有进行强制约束,这点可以交给虚拟机的具体实现来自由把握。但是对于初始化阶段,虚拟机规范则是严格规定了有且只有5种情况必须立即对类进行“初始化”(而加载,验证,准备自然需要在此之前开始):
- 遇到new,getstatic,putstatic,invokestatic这4个字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。生成这4条指令最常见的Java代码场景是:使用new关键字实例化对象的时候,读取或设置一个类的静态字段(被final修饰,已在编译期把结果放入常量池的静态字段除外)的时候,以及调用一个类的静态方法的时候。
- 使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先进行初始化。
- 当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
- 当虚拟机启动时,用户需要指定一个主类(包含main()方法的那个类),虚拟机会先初始化这个主类。
- 当使用JDK1.7的动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getStatic,REF_putStatic,REF_invokeStatic的方法句柄,并且这个句柄所对应的类没有进行过初始化,则需要先触发其初始化。
对于这5种会触发类初始化的场景,虚拟机规范中使用了一个很强烈的限定语:“有且只有”,这5种场景中的行为称为对一个类的主动引用。除此之外,所有引用类的方式都不会触发其初始化,称为被动引用。
下面举3个例子来说明何为被动引用
/**
* 被动使用类字段演示一;
* 通过子类引用父类的静态字段,不会导致子类初始化
*/
public class SuperClass {
static {
System.out.println("SuperClass init!");
}
public static int value = 123;
}
public class SubClass extends SuperClass {
static {
System.out.println("SubClass init!");
}
}
/**
* 非主动使用类字段演示一
*/
public class NotInitialization {
public static void main(String[] args) {
System.out.println(SubClass.value);
}
}
上述代码运行之后,只会输出“SuperClass init!”,而不会输出“SubClass init!”。对于静态字段,只有直接定义这个字段的类才会被初始化,因此通过子类引用其父类中定义的静态字段,只会触发父类的初始化而不会触发子类的初始化。至于是否要触发子类的加载和验证,在虚拟机规范中没有明确规定,这点取决于虚拟机的具体实现。对于Sun HotSpot虚拟机来说,可通过-XX:+TraceClassLoading
参数观察到此操作会导致子类的加载。
/**
* 非主动使用类字段演示二:
* 通过数组定义来引用类,不会触发此类的初始化
*/
public class NotInitialization {
public static void main(String[] args) {
SuperClass[] sca = new SuperClass[10];
}
}
运行之后发现没有输出“SuperClass init!”,说明并没有触发SuperClass类的初始化阶段。但是这段代码触发了另一个名为“[Loaded SuperClass ”的类初始化阶段,对于用户来说,这并不是一个合法的类名词,它是由虚拟机自动生成的,直接继承于java.lang.Object的子类,创建动作由字节码指令newarray触发。这个类代表了一个元素类型为SuperClass的一维数组,数组中应有的属性和方法(用户可以直接使用的只有被修饰为public的length属性和clone()方法)都实现在这个类里。
/**
* 非主动使用类字段演示三:
* 常量在编译阶段会存入调用类的常量池中,本质上并没有直接引用到定义常量的类,因此
* 不会触发定义常量的类的初始化
*/
public class ConstClass {
static {
System.out.println("ConstClass init!");
}
public static final String HELLOWORLD = "hello world";
}
/**
* 非主动使用类字段演示
*/
public class NotInitialization {
public static void main(String[] args) {
System.out.println(ConstClass.HELLOWORLD);
}
}
上述代码运行之后,也没有输出“ConstClass init!”,这是因为虽然在Java源码中引用了ConstClass类中的常量HELLOWORLD,但其实在编译阶段通过常量传播优化,已经将此常量的值“hello world”存储到了NotInitialization类的常量池中,以后NotInitialization对常量ConstClass.HELLOWORLD的引用实际都被转化为NotInitialization类对自身常量池的引用了。也就是说,实际上NotInitialization的Class文件之中并没有ConstClass类的符号引用入口,这两个类在编译成Class之后就不存在任何联系了。
接口的加载与类的加载过程稍有一些不同,接口也有初始化过程,这点和类是一致的,接口中不能使用“static{}”语句块,但编译器仍然会为接口生成“<cinit>()”类构造器,用于初始化接口中所定义的成员变量。接口与类真正有所区别的是前面讲述的5中“有且仅有”需要初始化场景中的第3种:当一个类在初始化时,要求其父类全部都已经初始化过了,但是一个接口在初始化时,并不要求其父接口全部都完成了初始化,只有在真正使用父接口的时候(如引用接口中定义的常量)才会初始化。