Java对象创建与内存分布

本文主要讲述Java对象在虚拟机中创建,分配内存,初始化的过程,以及分配内存,引用对象的几种常见方式。

对象创建

对象创建分为三部分,首先是类加载,接着是为对象分配内存,最后是初始化。

创建
虚拟机遇到new指令时会去检查这个指令参数是否能在常量池中定位到一个符号引用,并检查这个符号引用代表的类是否已被加载、解析和初始化过,如果没有则先进性类加载过程。

分配内存
对象所需内存大小在类加载完成后即可确定,所以虚拟机只要从堆中划分出相应大小内存分配给新创建的对象即可。

常见的内存分配方式有两种,一种是“指针碰撞”,一种是“空闲列表”。不同的Java虚拟机实现会分别采用这两种内存分配方式。

“指针碰撞”假设Java堆中的内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放一个指针作为分界点指示器。当需要分配内存时只需要把指针向空闲内存方向移动对象大小相等的距离即可。

如果Java堆中的内存并不规整,那么虚拟机需要维护一个列表用来记录那些内存块可用。当需要分配内存时从列表中找出一个足够大的空间划分给对象实例,这就是“空闲列表”。

初始化
虚拟机在对象内存分配完成后首先会将不包括对象头的内存空间初始化为零值,即为对象的字段分配其数据类型所对应的初始值。这一步保证对象的实例字段在Java代码中可以不赋初始值就可使用。

接下来虚拟机向对象头空间写入实例所属类,类的元数据信息获取方式,对象的哈希码,对象GC分代年龄等信息。

然后执行方法按照程序员编写的程序代码将对象进行初始化。(这里就是所谓的对象初始化”两次”的问题)

分配内存的线程安全问题
对象创建在虚拟机中是非常频繁的过程,并发的情况下并不是线程安全的。解决问题有两种方案,一种是在分配内存时进行同步处理;另一种是为每一个线程在Java堆中预先分配一块内存(即本地线程分配缓冲TLAB),这样线程内存分配的动作分别在不同的内存空间中进行,只有缓冲区内存不足时才会为缓冲区同步分配内存。虚拟机分配内存时还会加上失败重试的方式。

对象内存分布

对象在内存中的分配包括三部分:对象头,实例数据和对齐填充。

对象头
对象头包括两部分信息,第一部分是用于存储对象自身的运行时数据,如哈希码,GC分代年龄、锁状态标识、线程持有的锁,偏向线程ID、偏向时间戳等,这部分数据的长度在32为虚拟机中为32bit在64为虚拟机中为64bit,所有数据均以标志位的形式存储。

对象头的另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。但这并不是必须有的,也就是查找对象元数据并不一定需要对象本身。如果对象是数组,那么对象头中还必须记录对象数组长度。

实例数据
示例数据部分存储着对象程序代码中定义的各种类型字段内容,包括从父类继承的和子类总定义的。这部分的存储顺序会受到虚拟机分配策略参数和字段在Java源代码中定义顺序的影响。虚拟机默认将相同长度的字段分配到一起,且父类定义的变量会出现在子类之前。通过配置虚拟机参数也可以使子类较窄的变量插到父类变量空隙中。

对象填充
对象填充仅仅是占位符,并不是必然存在。HotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,也就是说对象的大小必须是8字节的整数倍,所以如果对象实例数据部分没有对齐需要对齐填充来补齐(对象头已经对齐)。

对象访问

当创建好对象后,我们需要通过引用reference来访问使用对象,常见的有两种方式,第一种是句柄,第二种是直接指针。

句柄
Java堆中需要专门划分一部分内存作为句柄池,Java栈中的引用存储的是对象的句柄地址,而句柄地址存储了对象实例数据与数据类型各自的具体地址信息。

使用句柄的好处就是reference中存储的是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是普遍的行为)时只会改变句柄中实例数据指针,而reference不需要更改。

直接指针
直接指针就是Java栈中的引用直接存储对象的内存地址。使用直接指针最大的好处就是访问速度快,它节省了一次指针定位的时间开销。Sun的Hot Spot虚拟机使用的直接指针访问对象。