虚拟机类加载机制

在Java语言中,类型的加载、连接和初始化过程都是在程序运行期间完成。虚拟机在运行期间会把描述类的数据从Class文件中加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机知己网使用的Java类型,这就是虚拟机的类加载机制。

1、类加载过程

类从被加载到内存开始,到卸载出内存为止,其生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)7个阶段。

1.1 加载

虚拟机规范没有对类加载的时机做规定,但要求五种情况必须触发类初始化,而在类初始化之前必定会先被加载:

  1. 创建一个类,调用类的静态方法静态变量时,如果类没有进行初始化,则需要先触发其初始化
  2. 使用java.lang.reflect包的方法对类进行反射调用时,如果类没有进行初始化则需要先触发其初始化
  3. 初始化一个类时如果其父类还没有进行初始化,则需要先触发其父类的初始化
  4. 当虚拟机启动时,用户需要指定一个要执行的主类(包含main方法的类),虚拟机要先初始化这个类
  5. 当使用JDK1.7动态语言时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄所对应的类没有进行初始化,则需要先触发其初始化。

虚拟机需要完成三件事:

  1. 通过类得全限定名来获取定义此类额二进制字节流(可以从zip包读取,如JAR,WAR,可以从网络中获取,可以动态生成JSP,可以从数据库中读取)
  2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
  3. 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据访问的入口

加载阶段,既可以使用系统提供的引导类加载器来完成,又可以使用用户自定义的类加载器完成。

1.2 验证

验证是连接的第一步,目的是确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身安全。

验证阶段包括4部分:

  1. 文件格式校验,验证字节流是否符合Class文件格式规范,版本号是否可以被虚拟机接受等等
  2. 元数据校验,对字节码描述信息进行语义分析,以保证描述信息符合Java语言规范
  3. 字节码校验,通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的,保证程序方法在运行期间不会做出危害虚拟机的事
  4. 符号引用校验,在虚拟机将符号引用转化为直接引用时(引用类方法字段等)需要进行符号引用校验,可以看做是对类自身以外(常量池的各种符号引用)的信息进行匹配性校验,目的是确保解析动作能正常执行,如果无法通过符号引用验证则会抛出类似java.lang.IllegalAccessError,java.lang.NoSuchFieldError,java.lang.NoSuchMethodError等。

1.3 准备

准备阶段为类变量(不包括实例变量)分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。

此处所设置的类变量初始值,并不是程序代码中所设置的初始值,而是为类变量赋0值,例如int类型为0,boolean类型为false。根据程序代码设置初始值是在初始化阶段发生。

1.4 解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。

符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量(类接口,字段方法常量等),只要使用时能无歧义地定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存。

直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。直接引用是和虚拟机实现的内存布局相关,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同。

1.5 初始化

初始化是类加载过程的最后一步,从这里开始执行Java程序代码。在准备阶段变量已经赋值过一次系统要求的初始值,初始化阶段则是根据程序代码去初始化类变量,同一个类加载器下一个类只会被初始化一次。

2、类加载器

类加载器功能就是通过一个类的全限定名来获取描述此类的二进制字节流。Java允许程序自己去实现类加载器。当前自定义类加载器可以实现OSGI,热部署、代码加密等诸多功能。

Java中有两种类加载器,一种是启动类加载器(Bootstrap ClassLoader,使用C++实现)是虚拟机的一部分,另一种是其他类加载器,独立于虚拟机外部,并且全部继承自java.lang.ClassLoader。

  • 启动类加载器,负责将存放在\lib目录中的类库加载到虚拟机内存中,无法被程序调用,用户编写自定义类加载器时如需把加载请求委派给引导类加载器直接使用null代替。

  • 扩展类加载器(Extension ClassLoader),负责加载\lib\ext目录中或者被java.ext.dirs系统变量指定的路径中的所有类库,开发者可以直接使用扩展类加载器。

  • 应用程序类加载器(Application ClassLoader),系统默认类加载器getSystemClassLoader()方法的返回值,负责加载用户(ClassPath)路径上所指定的类库,开发者可以直接使用这个类加载器

类加载器中有一个概念是双亲委派模型,其工作过程:如果一个类加载器收到了加载请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父类加载器反馈自己无法完成这个加载请求(它在搜索范围中没有找到所需要的类)时,子加载器才会尝试自己去加载。

双亲委派模型有一个好处就是Java类随着它的类加载器一起具备了一种带有优先级的层次关系。例如,java.lang.Object,无论哪个类加载器加载最终都会交给最顶层的类加载器加载,因此Object在各种加载器环境中都是一个类(判断类是否相同,需要同一个类加载器加载的同一个Class文件,缺一不可)。

双亲委派模型并不是必须,当前很多JNDI,代码热部署,模块热部署的应用并不符合双亲委派模型原则的行为。