JVM

深入理解Java虚拟机总结-编译期优化

Posted by AlstonWilliams on February 17, 2019

注:此文是我在读完周志明老师的深入理解Java虚拟机之后总结的一篇文章,请阅读此书获取更加详细的信息.

在这篇文章中,我们会简单介绍一下Java的编译过程,以及在编译过程中进行的优化.

编译过程

编译过程大致分为下面的三个过程,分别是:

  • 解析与填充符号表过程
  • 插入式注解处理器的注解处理过程
  • 分析与字节码生成关系

它们之间的关系如下图所示:

解析和填充符号表

1.词法分析,语法分析:

词法分析是将源代码中的字符流转变为Token集合.

语法分析是根据Token序列构造抽象语法树的过程,抽象语法树是一种用来描述程序代码语法结构的树型表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构,例如包,类型,修饰符,运算符,接口,返回值甚至代码注释等都可以是一个语法结构.

2.填充符号表:

符号表是由一组符号地址和符号信息构成的表格,符号表中所登记的信息在编译的不同阶段都要用到.在语义分析中,符号表所登记的内容将用于语义检查(如检查一个名字的使用和原先的说明是否一致)和产生中间代码,在目标代码生成阶段,当对符号表进行地址分配时,符号表是地址分配的依据.

注解处理器

注解处理器用于处理程序中的代码,由于注解会修改源代码,也就是会修改抽象语法树中的元素,所以如果在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止.

语义分析与字节码生成

在编译过程中,语义分析过程分为标注检查以及数据及控制流分析两个步骤.

1.标注检查:

标注检查步骤检查的内容包括诸如变量使用前是否已被声明,变量和赋值之间的数据类型是否能够匹配等.

2.数据及控制流分析:

数据及控制流分析是对程序上下文逻辑更进一步的验证,它可以检查出诸如程序局部变量在使用前是否有赋值,方法的每条路径是否都有返回值,是否所有的受查异常都被正确处理了等问题.

3.解语法糖:

Java中最常用的语法糖主要是前面提到过的泛型,变长参数,自动装箱/拆箱等,虚拟机运行时并不支持这些语法糖,它们在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖.

4.字节码生成:

字节码生成阶段不仅仅是把前面各个步骤生成的信息(语法树,符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作.

例如,之前的文章提到过的实例构造器**()方法和类构造器()方法**就是在这个阶段添加到语法树之中的.

完成对语法树的遍历和调整之后,就会把填充了所有所需信息的符号表交给com.sun.tools.javac.jvm.ClassWriter类,由这个类的writeClass()方法输出字节码,生成最终的Class文件,到此为止整个编译过程宣告结束.

Java语法糖

泛型与类型擦除

泛型可谓是Java中最常用的几个语法糖中的一个,但是Java中的泛型和C++中的语法糖不一样,它只存在于程序代码中,在经过编译之后的Class文件中,便不再存在.

那我们是如何获取到泛型传入的参数化类型呢?

这就涉及到Class文件中的Signature,LocalVariableTypeTable等属性了.其中Signature是最重要的一项属性,它的作用就是存储一个方法在字节码层面的特征签名,这个属性中保存的参数类型并不是原生类型,而是包括了参数化类型的信息.修改后的虚拟机规范要求所有能识别49.0以上版本的Class文件的虚拟机都要能正确地识别Signature参数.

自动装箱,拆箱与遍历循环

自动装箱,拆箱在编译之后被转化成了对应的包装和还原方法,而遍历循环则把代码还原成了迭代器的实现,这也是为何遍历循环需要被遍历的类实现Iterable接口的原因.变长参数呢,在调用的时候变成了一个数组类型的参数.

条件编译

Java中进行条件编译的方式是,使用条件为常量的if语句.在编译时,会把分支中不成立的代码块消除掉.

总结

可以看到,其实编译器并没有进行什么优化,而只是解语法糖,去掉不需要的代码而已.代码的优化实际上主要是在运行期完成,后面我们会写一篇文章专门来介绍编译器优化.