本文我们总结JVM中类加载器子系统关于类加载过程,这里默认是Oracle的Hotspot。
【1】类加载器子系统作用
类加载器子系统负责从文件系统或者网络中加载Class文件,class文件在文件开头有特定的文件标识。
ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine决定。
加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
如下图所示类编译后class文件我们使用javap -v StackStruTest
查看字节码,其中Constant pool部分就会存储在方法区运行时常量池。
javap 是 Java Platform 的一个命令行工具,用于查看 Java 类文件的内容。它通常用来反汇编字节码并展示类文件的结构信息,包括类名、字段、方法和属性等。javap 是 Java 开发工具包 (JDK) 的一部分,因此如果你安装了 JDK,那么你就可以使用 javap。
【2】类加载器ClassLoader角色
如下图所示装载Car.class文件。
- class file存在于本地硬盘上,可以理解为设计师画在纸上的模板,而最终这个模板在执行的时候是要加载到JVM当中来根据这个文件实例化出n个一模一样的实例。
- class file加载到JVM中,被称为DNA元数据模板,放在方法区。
- 在.class文件->JVM->最终成为元数据模板,此过程就要一个运输工具(类装载器Class Loader),扮演一个快递员的角色。
【3】类的加载过程
例如下面的一段简单的代码
public class HelloLoader { public static void main(String[] args) { System.out.println("我已经被加载啦"); } }
它的加载过程是怎么样的呢?
完整的流程图如下所示:
【4】类加载过程-加载
通过一个类的全限定名获取定义此类的二进制字节流
将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口
加载class文件的方式
- 从本地系统中直接加载
- 通过网络获取,典型场景:Web Applet
- 从zip压缩包中读取,成为日后jar、war格式的基础
- 运行时计算生成,使用最多的是:动态代理技术
- 由其他文件生成,典型场景:JSP应用从专有数据库中提取.class文件,比较少见
- 从加密文件中获取,典型的防Class文件被反编译的保护措施
【5】类加载过程-链接
链接阶段包括验证、准备和解析。
① 验证 Verify
目的在于确保Class文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性,不会危害虚拟机自身安全。
主要包括四种验证,文件格式验证,元数据验证,字节码验证,符号引用验证。
如下图所示,我们查看16进制的class文件时(可以使用PXBinaryViewer
查看),开头几个字符是CA FE BA BE 来表明其是可以运行在JVM上的。
如果出现不合法的字节码文件,那么将会验证不通过。
② 准备 Prepare
为类变量分配内存并且设置该类变量的默认初始值,即零值。
这里不包含用final修饰的static,因为final在编译的时候就会分配了,准备阶段会显式初始化;
这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中。
零值:整数类型(int, short, byte, long)0 ; 浮点数类型(float, double)0.0 ; boolean false ;字符类型(char) \u0000 ; 引用类型(如对象、数组等) null 。
public class HelloApp { private static int a = 1; // 准备阶段为0,在下个阶段,也就是初始化的时候才是1 public static void main(String[] args) { System.out.println(a); } }
上面的变量a在准备阶段会赋初始值,但不是1,而是0。
③ 解析 Resolve
将常量池内的符号引用转换为直接引用的过程。
事实上,解析操作往往会伴随着JVM在执行完初始化之后再执行。
符号引用就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《java虚拟机规范》的class文件格式中。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的CONSTANT Class info、CONSTANT Fieldref info、CONSTANT Methodref info等
【6】类加载过程-初始化
初始化阶段就是执行类构造器方法
<clinit>()
的过程。此方法不需定义,是javac编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来。
- 也就是说如果类中有静态变量或静态代码块,则自动有clinit方法。
构造器方法中指令按语句在源文件中出现的顺序执行。
<clinit>()
不同于类的构造器。(关联:构造器是虚拟机视角下的<init>()
)若该类具有父类,JVM会保证子类的
<clinit>()
执行前,父类的<clinit>()
已经执行完毕。虚拟机必须保证一个类的
<clinit>()
方法在多线程下被同步加锁。
关于涉及到父类时候的变量赋值过程。
public class ClinitTest1 { static class Father { public static int A = 1; static { A = 2; } } static class Son extends Father { public static int b = A; } public static void main(String[] args) { System.out.println(Son.b); } }
输出结果为 2。也就是说首先加载ClinitTest1的时候,会找到main方法,然后执行Son的初始化。但是Son继承了Father,因此需要首先执行Father的初始化,同时将A赋值为2。
我们通过jclasslib Bytecode Viewer(可以单独安装也可以idea装插件)查看Father类的<clinit>()
方法。首先我们看到原来的值被赋值成1,然后又被复制成2,最后返回:
iconst_1 putstatic #2 <com/atguigu/java/chapter02/ClinitTest1$Father.A> iconst_2 putstatic #2 <com/atguigu/java/chapter02/ClinitTest1$Father.A> return
先选择编译后的class文件,然后在View-Show Bytecode With Jclasslib进行查看。
Son的<clinit>()
方法:获取静态变量A的值赋值给静态变量B。
0 getstatic #2 <com/atguigu/java/ClinitTest1$Son.A : I> 3 putstatic #3 <com/atguigu/java/ClinitTest1$Son.B : I> 6 return
ClinitTest1的main方法:
0 getstatic #2 <java/lang/System.out : Ljava/io/PrintStream;> 3 getstatic #3 <com/atguigu/java/ClinitTest1$Son.B : I> 6 invokevirtual #4 <java/io/PrintStream.println : (I)V> 9 return