概述:
java作为一种高级语言,对开发者而言,创建一个对象是非常容易的,原因就是虚拟机底层做了很好的封装,调用者不需要关注太多细节。通过new关键字,就可以创建一个对象。了解对象的创建过程,内存布局对于性能上的一些优化,理解很多原理是很有帮助的。
对象的创建:
对象的创建包含3个步骤:为对象分配内存空间、初始化对象、将对象的内存地址赋给引用。
分配内存空间
创建对象的第一步就是要在内存空间中划分一块内存区域给对象使用,而对象所需要的内存空间大小在类加载完成时便可以确认。虚拟机划分内存区域的方法主要有指针碰撞法、空闲列表法。
指针碰撞法
指针碰撞法主要适用于内存绝对规整的情况,也就是将使用过的内存与未使用的内存严格分隔开。
如上图所示,内存区域是绝对规整的,中间的分界点指示器其实是一个内存地址的指针,当有新的对象创建需要分配内存空间时,只需要移动分界点指示器,也就是改变指针的值,使其往空闲区域移动就好。但是这种方式对于内存不规整的情况就不适用,因为这种情况很容易造成内存空间的浪费。
空闲列表
空闲列表的方式很容易理解,就是在虚拟机内部维护一个空闲内存区域的列表,记录当前哪些内存区域是可用的。当有对象创建需要分配内存空间时,只要在列表中找到合适大小的区域,然后修改列表的内容即可,这种方法不要求内存区域的规整性。空闲列表法在对线程环境容易出现并发问题,若A线程申请了一块内存区域,但还没来得及修改空闲列表,此时B线程申请内存区域,有可能会分配已经划分给A线程的区域而出现失败。因此虚拟机在底层采用CAS的方式来保证此操作的原子性和安全性。上篇介绍java运行时数据区域的文章中我们有提到在堆区可以为每个线程划分一个TLAB(线程本地分配缓冲区),每个线程在自己的分配缓冲区为对象分配内存,也可以解决多线程并发问题。
使用哪一种内存分配方法取决于虚拟机的实现,与虚拟机的GC算法相关联,上述两种方法没有孰优孰劣,只有适不适合而已。
初始化对象
java程序员比较幸福的就是,虚拟机在底层默默地帮我们干了很多的活。当虚拟机为新创建的对象分配内存区域后,会进行对象的初始化操作。如给对象中所有的基本数据变量赋上初始化值,以至于当我们未对它们进行赋值操作时就可以使用对象了。
内存地址赋给引用
当内存空间划分成功,完成对象初始化操作后,虚拟机会将刚创建好对象的内存地址赋给引用对象。完成此操作后,便可以在程序中通过引用访问对象的实例数据。
对象的内存布局:
在HotSpot虚拟机中,对象在内存中存储的布局可以划分为3块区域:对象头、实例数据、对齐填充。
对象头
对象头中主要包含2部分的信息,一部分是用于存储对象本身运行时的数据,例如哈希吗、分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等;另一部分则是类型指针,即对象指向的是类信息,虚拟机可以根据此指针确定对象是属于哪个类的实例。
实例数据
实例数据则是对象存储的真正有效的信息,也是对象存储的主要区域。对象中定义的所有字段的数据都会保存在这个区域,无论是定义在父类中还是子类中字段的数据都将存储在该区域。
对齐填充
对齐填充并不是必须存在的,其本身没有特殊的含义,仅仅是作为占位符存在而已。由于HotSpot要求对象起始地址必须是8字节的整数倍,也就是要求对象的大小是8字节的整数倍。因此在内存分配时,若对象的大小不是8字节整数倍,对齐填充就会将其补全。
对象的访问定位:
我们通常访问一个对象是通过其引用来访问,虚拟机的对象访问定位主流的方式有两种句柄法、直接指针。
上图展示的是使用句柄进行对象的访问定位,由图中可以看出,局部变量表中的对象引用指向的是句柄池,而句柄池中则保存着指向对象的真正内存地址。直接指针更容易理解,就是没有句柄池的存在,局部变量表中引用直接指向对象,保存对象的内存地址。
两者的区别很明显,句柄法的优势在于reference中存储的是句柄池的地址,这个地址是稳定的,即使对象发生移动,内存地址发生改变reference的内容是不需要修改。而直接指针法主要体现在速度更快,因为其减少了一次指针定位的过程,开销相对较小,缺点是若对象发生频繁移动,reference中的值需要被频繁修改。具体使用哪种方法要根据虚拟机实现的GC算法来决定,两者各有优势。
结束语
终于分析完对象创建过程中的各种操作,文章偏理论化,没有实际的案例讲解。主要是希望通过分析其过程,来加深对底层实现的理解。可以写代码过程中理解,若不畏难者可以尝试读一下虚拟机的源码。