注:此文是我在读完周志明老师的深入理解Java虚拟机之后总结的一篇文章,请阅读此书获取更加详细的信息.
Java运行时数据区
Java运行时数据区分为下面的几块区域:
- 程序计数器:线程独立的一块区域,保存了下一条指令的地址.
- 虚拟机栈: 虚拟机栈也是线程独立的一块区域,它内部包含很多个栈帧,其中每个栈帧都是由方法在运行时创建的.每个栈帧都包括了局部变量表,操作数栈,动态链接,方法出口等信息.局部变量表中,存放了编译期可知的各种基本数据类型(boolean, byte, char, short, int, float, double),对象引用(reference)和returnAddress(指向了一条字节码指令的地址).
- 本地方法栈:和虚拟机栈类似,但是虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则为虚拟机使用到的Native方法服务.
- 堆:我们最常说的一块区域,是线程共享的一块区域,所以得对象实例以及数组都在堆上分配.可以是物理上不连续的内存空间,只要逻辑上连续即可.可以被分为新生代,老年代,永久代(某些虚拟机不支持永久代),新生代进一步被分为Eden空间,From Survivor空间, To Survivor空间.关于堆的内存空间,我们会在以后将要介绍的垃圾回收机制中详细介绍.
- 方法区.线程共享的一块区域,用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据.运行时常量池是方法区的一部分,用于存放编译期生成的各种字面量和符号引用,以及翻译出来的直接引用.
- 直接内存.Java虚拟机规范中没有定义此块区域,大小不受堆限制.
Java对象的创建过程
接收new指令
if(指令的参数能在常量池中定位到符号引用) {
if(符号引用代表的类已被加载,解析和初始化) {
} else {
加载相应的类
}
为新生对象中分配内存(不一定在新生代分配,当对象的大小超过设定的阈值时,将会直接在老年代分配)
将分配到的内存空间初始化为零值
对对象进行必要的设置,比如这个对象是哪个类的实例,如何才能找到类的元数据信息,对象的哈希码,对象的GC分代年龄等信息.这些信息存放在对象的对象头之中.根据虚拟机当前的运行状态不同,如是否启用偏向锁等,对象头会有不同的设置方式.
执行<init>方法,把对象按照程序员的意愿进行初始化.
}
给对象在堆中分配内存时,根据堆是否规整,又分为下面的两种分配方式:
- (1)堆内存规整: 堆内存是否规整取决于采用的垃圾回收器是否带有Compact过程,新生代的垃圾回收器由于普遍采用标记-复制算法,所以新生代堆内存一般是规整的.老年代的话,由于一般采用标记-整理算法,一般也是规整的.但是,CMS垃圾回收器例外. 在堆内存规整的情况下,采用指针碰撞的方法.
- (2)堆内存不规整: 在这种情况下,需要用一张列表来维护可用的内存,在分配内存的时候,从列表中找到一块足够大的空间,划分给对象,并更新可用内存表,这种方式叫做”空闲列表”.
有没有感觉其实跟操作系统中内存分配很像?
那么如何保证为对象分配内存时,是线程安全的?
两种解决方案:
- ①对分配内存空间的动作进行同步处理.实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性
- ②每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓存(TLAB).哪个线程要分配内存,就在哪个线程的TLAB上分配,只有TLAB用完并分配新的TLAB时,才需要同步锁定.虚拟机是否采用TLAB,可以通过-xx:+/-UseTLAB参数来设定.
对象的内存布局
对象在内存中大体分为三个部分:对象头,实例数据,对齐填充.其中对象头又可以被进一步划分为运行时数据和类型指针.对象头在32位和64位机器上分别占64位和128位.其中运行时数据和类型指针各占一半.
运行时数据又可以被细分为下面的内容:
当处于未锁定状态时,在32位机器上,25bit用于存储对象的哈希码,4bit用于存储对象的分代年龄,2bit用于存放锁标志位,1bit固定为0.
类型指针指向该对象的类对象,并不是所有的虚拟机实现都必须在对象数据上保留类型指针.如果对象是一个数组,那在对象头中还必须有一块用于记录数组长度的数据,因为虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小,但是无法从数组的元数据确定数组的大小.
对象在内存中的布局中的第二部分是实例数据.实例数据包括父类和子类中的实例字段,不包括实例方法.
为什么不包括实例方法呢?
因为实例方法是无状态的,也就是说,一个类的实例方法是不会有任何改变的.所以,一个类只需要在方法区中维护一份实例方法即可,而不需要再在对象中保存实例方法的信息.
实例数据的存储顺序受虚拟机分配策略参数和字段在Java源码中定义顺序的影响.HotSpot虚拟机默认的分配策略为longs/doubles,ints,shorts/chars,bytes/booleans, oop(Ordinary Object Pointers).
我们可以看到,相同宽度的字段总是被分配到一起,且父类中的变量在子类之前.如果Compact Fields参数为true,子类中较窄的变量也可能插入到父类变量的空隙中.
对象在内存中的布局的最后一部分是对齐填充.这部分是为了满足对象的起始地址必须是8字节的整数倍,即对象的大小必须是8字节的整数倍的要求.
对象的访问定位
我们使用reference对象来定位并使用对象,那么reference对象是如何定位对象的呢?有两种实现方式:
- 1.基于句柄 堆中专门划出一块内存作为句柄池,reference对象存储了句柄池中对应对象的句柄的位置.
句柄池由一个个的句柄构成,句柄又由到实例数据的指针和到对象类型数据的指针组成.
- 2.基于直接指针
这两种方式各有优缺点:基于句柄的方式能够在对象被移动(在垃圾回收中是很常见的行为)的时候,不需要改变reference对象,只需要改变句柄池中对应句柄的内容.而基于直接指针的方式,则由于仅需要一次定位便能直接定位到对应的对象实例数据,所以其性能相对高一些.
目前,HotSpot虚拟机中是使用的基于直接指针的这种方式.但是,使用基于句柄的方式的应用也有很多.