You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

309 lines
19 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 12 | Java编译器去除语法糖和生成字节码
你好我是宫文学。今天是Java编译器的最后一讲我们来探讨编译过程最后的两个步骤**去除语法糖和生成字节码**。
其实今天要讲的这两个编译步骤总体上都是为生成字节码服务的。在这一阶段编译器首先会把语法糖对应的AST转换成更基础的语法对应的AST然后基于AST和符号表来生成字节码。
从AST和符号表到变成字节码这可是一个很大的转变就像把源代码转化成AST一样。**那么,这个过程的实现思路是什么?有什么难点呢?**
今天这一讲我们就一起来解决以上这些问题在这个过程中你对Java编译器的认识会变得更加完整。
好了,我们首先来看看去除语法糖这一处理步骤。
## 去除语法糖Syntactic Sugar
Java里面提供了很多的语法糖比如泛型、Lambda、自动装箱、自动拆箱、foreach循环、变长参数、内部类、枚举类、断言assert等等。
你可以这么理解语法糖:它就是提高我们编程便利性的一些语法设计。既然是提高便利性,那就意味着语法糖能做到的事情,用基础语法也能做到,只不过基础语法可能更啰嗦一点儿而已。
不过我们最终还是要把语法糖还原成基础语法结构。比如foreach循环会被还原成更加基础的for循环。那么问题来了**在编译过程中,究竟是如何去除语法糖的?基础语法和语法糖又有什么区别呢?**
在[第10讲](https://time.geekbang.org/column/article/252828)中我提到过在JDK14中去除语法糖涵盖了编译过程的四个小阶段。
* **TRANSTYPES**泛型处理具体实现在TransTypes类中。
* **TRANSPATTERNS**处理模式匹配具体实现在TransPattern类中。
* **UNLAMBDA**把LAMBDA转换成普通方法具体实现在LambdaToMethod类中。
* **LOWER**其他所有的语法糖处理如内部类、foreach循环、断言等具体实现在Lower类中。
以上去除语法糖的处理逻辑都是相似的,它们的**本质都是对AST做修改和变换**。所以接下来我挑选了两个比较有代表性的语法糖泛型和foreach循环和你分析它们的处理过程。
**首先是对泛型的处理。**
Java泛型的实现比较简单`LinkedList<String>`和`LinkedList`对应的字节码其实是一样的。泛型信息`<String>`,只是用来在语义分析阶段做类型的检查。检查完之后,这些类型信息就会被去掉。
所以Java的泛型处理就是把AST中与泛型有关的节点简单地删掉相关的代码在TransTypes类中
对于“ `List<String> names = new ArrayList<String>()` ”这条语句它对应的AST的变化过程如下其中橙色的节点就是被去掉的泛型。
![](https://static001.geekbang.org/resource/image/06/6d/06a1e54b561b09dce936834ec311816d.jpg?wh=2284*1512)
图1对泛型的处理
**然后我们分析下对foreach循环的处理。**
foreach循环的意思是“遍历每一个成员”它能够以更简洁的方式遍历集合和数组等数据结构。在下面的示例代码中foreach循环和基础for循环这两种处理方式的结果是等价的但你可以看到foreach循环会更加简洁。
```
public static void main(String args[]) {
List<String> names = new ArrayList<String>();
...
//foreach循环
for (String name:names)
System.out.println(name);
//基础for循环
for ( Iterator i = names.iterator(); i.hasNext(); ) {
String name = (String)i.next();
System.out.println(name);
}
}
```
Java编译器把foreach循环叫做**增强for循环**对应的AST节点是**JCEnhancedForLoop**。
针对上面的示例代码我们来对比一下增强for循环的AST和去除语法糖之后的AST如下图所示
![](https://static001.geekbang.org/resource/image/3e/90/3ee6304103f7e41e3fc32c668f1e3490.jpg?wh=2284*1394)
图2foreach循环被改造成普通的for循环
你可以通过**反编译**,来获得这些没有语法糖的代码,它跟示例代码中用到的**基础for循环语句**是一样的。
对foreach循环的处理是在**Lower类的visitForeachLoop方法**中。
其实你在阅读编译技术相关的文献时应该经常会看到Lower这个词。它的意思是让代码从对人更友好的状态变换到对机器更友好的状态。比如说语法糖对编程人员更友好而基础的语句则相对更加靠近机器实现的一端所以去除语法糖的过程是Lower。除了去除语法糖**凡是把代码向着机器代码方向所做的变换都可以叫做Lower。**以后你再见到Lower的时候是不是就非常清楚它的意思了呢。
好了通过对泛型和foreach循环的处理方式的探讨现在你应该已经大致了解了去除语法糖的过程。总体来说去除语法糖就是把AST做一些变换让它变成更基础的语法要素从而离生成字节码靠近了一步。
那么接下来,我们看看编译过程的最后一个环节:生成字节码。
## 生成字节码Bytecode Generation
一般来说,我们会有一个错觉,认为生成字节码比较难。
实际情况并非如此因为通过前面的建立符号表、属性计算、数据流分析、去除语法糖的过程我们已经得到了一棵标注了各种属性的AST以及保存了各种符号信息的符号表。最难的编译处理工作在这几个阶段都已经完成了。
在[第8讲](https://time.geekbang.org/column/article/249261)中,我就介绍过目标代码的生成。其中比较难的工作,是指令选择、寄存器分配和指令排序。而这些难点工作,在生成字节码的过程中,基本上是不存在的。在少量情况下,编译器可能会需要做一点指令选择的工作,但也都非常简单,你在后面可以看到。
我们通过一个例子,来看看生成字节码的过程:
```
public class MyClass {
public int foo(int a){
return a + 3;
}
}
```
这个例子中foo函数对应的字节码有四个指令
```
public int foo(int);
Code:
0: iload_1 //把下标为1的本地变量(也就是参数a)入栈
1: iconst_3 //把常数3入栈
2: iadd //执行加法操作
3: ireturn //返回
```
生成字节码基本上就是对AST做深度优先的遍历逻辑特别简单。我们在[第5讲](https://time.geekbang.org/column/article/246281)曾经介绍过栈机的运行原理,也提到过栈机的一个优点,就是生成目标代码的算法比较简单。
你可以看一下我画的示意图,里面有生成字节码的步骤:
![](https://static001.geekbang.org/resource/image/05/21/05461yy0f34c9db1d35b83yyf4049721.jpg?wh=2284*516)
图3生成字节码
* 第1步把a的值入栈iload\_1
* 第2步把字面量3入栈iconst\_3
* 第3步生成加法运算指令iadd。这个操作会把前两个操作数出栈把结果入栈。
* 第4步生成return指令ireturn
这里面有没有指令选择问题?有的,但是很简单。
首先你注意一下iconst\_3指令这是把一个比较短的操作数压缩到了指令里面这样就只需要生成一个字节码。如果你把3改成一个稍微大一点的数字比如7那么它所生成的指令就要改成“bipush 7”这样就需要生成两个字节的字节码一个字节是指令一个字节是操作数。但这个操作数不能超过“2^7-1”也就是127因为一个字节只能表示-128~127之间的数据。
![](https://static001.geekbang.org/resource/image/9b/f2/9b88397b574e8f37d415ab1byycbecf2.jpg?wh=272*118)
如果字面量值变成128那指令就要变成“sipush 128”占据三个字节表示往栈里压入一个short数据其中操作数占据两个字节。
![](https://static001.geekbang.org/resource/image/cd/26/cd9dc78269b769f56ff236e9b2e3b426.jpg?wh=300*118)
如果该常数超过了两个字节能表示的范围比如“32768”那就要改成另一个指令“ldc #2”,这是把常数放到常量池里,然后从常量池里加载。
![](https://static001.geekbang.org/resource/image/53/76/53ebd4d4be1fdcc0bdddf847d0463a76.jpg?wh=698*118)
这几个例子反映了**由于字面量的长度不同,而选用了不同的指令**。接着,我们再来看看**数据类型对指令的影响。**
前面例子中生成的这四个指令全部都是针对整数做运算的。这是因为我们已经在语义分析阶段计算出了各个AST节点的类型它们都是整型。但如果是针对长整型或浮点型的计算那么生成的字节码就会不一样。下面是针对单精度浮点型所生成的字节码。
![](https://static001.geekbang.org/resource/image/e9/41/e9c61861bc83c3e58390741649fa6b41.jpg?wh=722*118)
**第三,数据类型影响指令生成的另一个情况,是类型转换。**
**一方面阅读字节码的规范你会发现对byte、short、int这几种类型做运算的时候使用的指令其实是一样的都是以i开头的指令。**比如加载到栈机都是用iload指令加法都是用iadd指令。
在示例代码中我们把foo函数的参数a的类型改成byte生成的字节码与之前也完全一样你可以自己去试一下。
```
public class MyClass {
public int foo(byte a){
return a + 3;
}
}
```
**另一方面在Java里把整型和浮点型做混合运算的时候编译器会自动把整型转化成浮点型。**比如我们再把示例代码改成下面这样:
```
public class MyClass {
public double foo(int a){
return a + 3.0;
}
}
```
这个时候foo函数对应的字节码如下其中 **i2d指令**就是把参数a从int型转换成double型
![](https://static001.geekbang.org/resource/image/6c/64/6cfd01bdfea327ba064fbb71b2f93464.jpg?wh=732*146)
OK到这里我已经总结了影响指令生成的一些因素包括字面量的长度、数据类型等。你能体会到这些指令选择的逻辑都是很简单的基于当前AST节点的属性编译器就可以做成正确的翻译了所以它们基本上属于“直译”。而我们在[第8讲](https://time.geekbang.org/column/article/249261)中介绍指令选择算法的时候遇到的问题通常是结合了多个AST节点生成一条指令它的难度要高得多。所以在第16讲讲解Java的JIT编译器生成目标代码的时候我会带你去看看这种复杂的指令选择算法的实现方式。
现在你对生成字节码的基本原理搞清楚了以后再来看Java编译器的具体实现就容易多了。
生成字节码的程序入口在**com.sun.tools.javac.jvm.Gen类**中。这个类也是AST的一个visitor。这个visitor把AST深度遍历一遍字节码就生成完毕了。
**在com.sun.tools.javac.jvm包中有两个重要的辅助类。**
**第一个辅助类是Item。**包的内部定义了很多不同的Item代表了在字节码中可以操作的各种实体比如本地变量LocalItem、字面量ImmediateItem、静态变量StaticItem、带索引的变量IndexedItem比如数组、对象实例的变量和方法MemberItem、栈上的数据StackItem、赋值表达式AssignItem等等。
![](https://static001.geekbang.org/resource/image/af/12/afda81ece1d912be6effd6570fa09f12.jpg?wh=2284*1355)
图4生成字节码过程中的辅助类Item及其子类
每种Item都支持一套标准的操作能够帮助生成字节码。我们最常用的是load()、store()、invoke()、coerce()这四个。
* **load()生成把这个Item加载到栈上的字节码。**
我们刚才已经见到了两种Item的load操作一个是本地变量a的LocalItem一个是立即数3的ImmediateItem。在字节码和汇编代码里如果一个指令的操作数是一个常数就叫做立即数
你可以看一下ImmediateItem的load()方法里面准确反映了我们前面分析的指令选择逻辑根据字面量长度的不同分别选择iconst\_X、bipush、sipush和ldc指令。
```
Item load() {
switch (typecode) {
//对int、byte、short、char集中类型来说生成的load指令是相同的。
case INTcode: case BYTEcode: case SHORTcode: case CHARcode:
int ival = numericValue().intValue();
if (-1 <= ival && ival <= 5)
code.emitop0(iconst_0 + ival); //iconst_X指令
else if (Byte.MIN_VALUE <= ival && ival <= Byte.MAX_VALUE)
code.emitop1(bipush, ival); //bipush指令
else if (Short.MIN_VALUE <= ival && ival <= Short.MAX_VALUE)
code.emitop2(sipush, ival); //sipush指令
else
ldc(); //ldc指令
break;
...
}
```
load()方法的返回值是一个StackItem代表加载到栈上的数据。
* **store()生成从栈顶保存到该Item的字节码。**
比如LocalItem的store()方法能够把栈顶数据保存到本地变量。而MemberItem的store()方法,则会把栈顶数据保存到对象的成员变量中。
* **invoke() : 生成调用该Item代表的方法的字节码。**
* **coerce():强制类型转换。**
我们之前讨论的类型转换功能就是在coerce()方法里完成的。
**第二个辅助类是Code类。**它里面有各种**emitXXX()方法,会生成各种字节码的指令。**
总结起来,字节码生成的总体框架如下面的类图所示:
* Gen类以visitor模式访问AST生成字节码最后生成的字节码保存在Symbol的code属性中。
* 在生成字节码的过程中编译器会针对不同的AST节点生成不同的Item并调用Item的load()、store()、invoke()等方法这些方法会进一步调用Code对象的emitXXX()方法,生成实际的字节码。
![](https://static001.geekbang.org/resource/image/52/d8/52d4abb0eb9654c22024378ba91cb5d8.jpg?wh=2284*881)
图5生成字节码过程中涉及的类
好了,这就是生成字节码的过程,你会发现它的思路是很清楚的。你可以写一些不同的测试代码,观察它生成的字节码,以及跟踪生成字节码的过程,很快你就能对各种字节码是如何生成的了然于胸了。
## 代码优化
到这里我们把去除语法糖和生成字节码两部分的内容都讲完了。但是在Java编译器里还有一类工作是分散在编译的各个阶段当中的它们也很重要这就是代码优化的工作。
总的来说Java编译器不像后端编译器那样会做深度的优化。比如像下面的示例代码“`int b = a + 3`”这行是无用的代码用一个“死代码删除”的优化算法就可以去除掉。而在Java编译器里这行代码照样会被翻译成字节码做一些无用的计算。
```
int foo(){
int a = 2;
int b = a + 3; //这行是死代码,可以优化掉
return a;
}
```
不过Java编译器还是在编译过程中顺便做了一些优化
**1.ATTR阶段常数折叠**
在属性分析阶段做了常数折叠优化。这样,在生成字节码的时候,如果一个节点有常数值,那么就直接把该常数值写入字节码,这个节点之下的子树就都被忽略。
**2.FLOW阶段不可达的代码**
在FLOW阶段通过活跃性分析编译器会发现某些代码是不可达的。这个时候Java编译器不是悄悄地优化掉它们而是会报编译错误让程序员自己做调整。
**3.LOWER阶段代数简化**
在LOWER阶段的代码中除了去除语法糖你还能看到一些代数简化的行为。给你举个例子在Lower.visitBinary()方法中也就是处理二元操作的AST的时候针对逻辑“或OR”和“与AND”运算有一些优化代码。比如针对“或”运算如果左子树的值是true那么“或”运算对应的AST用左子树代替而如果左子树是的值是false那么AST可以用右子树代替。
![](https://static001.geekbang.org/resource/image/43/97/43ba9cc3f2dd4e8b3ca61624e7306c97.jpg?wh=2284*880)
图6对AST做代数简化
**4.GEN阶段代数简化和活跃性分析**
在生成字节码的时候,也会做一些代数简化。比如在**Gen.visitBinary()方法中**有跟Lower.visitBinary()类似的逻辑。而整个生成代码的过程也有类似FLOW阶段的活跃性分析的逻辑对于不可达的代码就不再生成字节码。
看上去GEN阶段的优化算法是冗余的跟前面的阶段重复了。但是这其实有一个好处也就是可以把生成字节码的部分作为一个单独的库使用不用依赖前序阶段是否做了某些优化。
总结起来Java编译器在多个阶段都有一点代码优化工作但总体来看代码优化是很不足的。真正的高强度的优化还是要去看Java的JIT编译器。这些侧重于做优化的编译器有时就会被叫做“优化编译器Optimizing Compiler”。
## 课程小结
今天我带你分析了Java编译过程的最后两个步骤去除语法糖和字节码生成。你需要记住以下几点
* 语法糖是现代计算机语言中一个友好的特性。Java语言很多语法上的升级实际上都只是增加了一些语法糖而已。语法糖在Java编译过程中的去除语法糖环节会被还原成基础的语法。**其实现机制是对AST做修改和转换。**
* 生成字节码是一个比较机械的过程,**编译器只需要对AST进行深度优先的遍历即可。**在这个过程中会用到前几个阶段形成的属性信息,特别是**类型信息**。
我把本讲的知识点整理成了思维导图,供你参考:
![](https://static001.geekbang.org/resource/image/b1/ff/b1a76404ecb1ab138e3d9bce9b6949ff.jpg?wh=2284*2654)
之所以我花了4讲去介绍Java编译器的核心机制是因为像Java这样成熟的静态类型语言它的编译器的实现思路有很多借鉴意义比如词法分析和语法分析采用的算法、语义分析中多个阶段的划分和之间的相互关系、如何用各种方法检查语义错误、符号表的实现、语法糖和基础语法的关系等等。当你把Java编译器的脉络看清楚以后再去看其他静态类型语言的编译器的代码就会发现其中有很多地方是共通的你就能更快地熟悉起来。这样下来你对静态语言编译器的前端都会有个清晰的了解。
当然只了解前端部分是不够的Java还有专注于中后端功能的编译器也就是JIT编译器。我们这讲也已经说过了前端编译器的优化功能是有限的。那么如果想让Java代码高效运行就要依靠JIT编译器的优化功能和生成机器码的功能了。在后面的四讲中我会接着给你揭秘Java的JIT编译器。
## 一课一思
针对Java编译器这4讲的内容我们来做一个综合的思考题。假设你现在要写一个简单的DSL引擎比如让它能够处理一些自定义的公式最后要生成字节码你会如何让它最快地实现是否可以复用Java编译器的功能
欢迎你留言分享自己的观点。如果觉得有收获,也欢迎你把今天的内容分享给更多的朋友。
## 参考资料
Java语言规范第六章[Java虚拟机指令集](https://docs.oracle.com/javase/specs/jvms/se13/html/jvms-6.html)。