gitbook/手把手带你写一门编程语言/docs/436924.md
2022-09-03 22:05:03 +08:00

263 lines
20 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 36节点之海怎么生成基于图的IR
你好,我是宫文学。
从今天这节课开始,我们就要学习我们这门课的最后一个主题,也就是优化篇。
在前面的起步篇和进阶篇,我们基本上把编译器前端、后端和运行时的主要技术点都过了一遍。虽然到现在,我们语言支持的特性还不够丰富,但基本上都是工作量的问题了。当然,每个技术点我们还可以继续深挖下去,比如我们可以在类型计算中增加泛型计算的内容,可以把上两节课的垃圾收集算法改成更实用的版本,等等。在这个过程中,你还需要不断克服新冒出来的各种技术挑战。不过,基本上,你已经算入了门了,已经把主要的知识脉络都打通了。
而第三部分的内容,是我们整个知识体系中相对独立、相对完整的一部分,也是我们之前屡次提起过,但一直没有真正深化的内容,这就是优化。
优化是现代语言的编译器最重要的工作之一。像V8和其他JavaScript虚拟机的速度比早期的JavaScript引擎提升了上百倍让运行在浏览器中的应用可以具备强大的处理能力这都是优化技术的功劳。
所以,在这第三部分,我会带你涉猎优化技术中的一些基础话题,让你能够理解优化是怎么回事,并能够上手真正做一些优化。
那在这第一节课我会带你总体了解优化技术的作用、相关算法和所采用的数据结构。接着我会介绍本课程所采用的一个行业内前沿的数据结构基于图的IR又叫节点之海从而为后面具体的优化任务奠定一个基础。
那首先,我们先简单介绍一下与优化有关的背景知识。
## 有关优化的背景知识
如果我要把优化的内容和算法都大致介绍一下,可能也需要好几节课的篇幅。不过,我在《编译原理之美》的[第27节](https://time.geekbang.org/column/article/155338)和[28节](https://time.geekbang.org/column/article/156878),对优化算法的场景和分类,做了一些通俗的介绍。对于优化算法,特别是基于数据流分析的优化算法,也做了一些介绍。
而在《编译原理实战课》中,我在[第14节](https://time.geekbang.org/column/article/256914)、[15节](https://time.geekbang.org/column/article/257504)、[21节](https://time.geekbang.org/column/article/262041)、[23节](https://time.geekbang.org/column/article/264643)、[24节](https://time.geekbang.org/column/article/266379)分别涉及了Java、JavaScript、Julia和Go语言的编译器中的优化技术。所以我这里就不重复那些内容了只提炼几个要点重点和你说一下优化的目标、分类、算法以及数据结构让你做好讨论优化技术的知识准备。
### 优化的目标
**优化工作最常见的目标,是提高代码运行的性能**。在有些场景下我们还会关注降低目标代码的大小、优化IO次数等其他方面。
### 优化工作的分类
优化技术的种类非常多,我们很难用一个分类标准把各种优化工作都涵盖进去。但通常,我们会按照几个不同的维度来进行分类。
从优化算法的作用范围(或者空间维度)来说,可以分为局部优化(针对基本块的优化)、全局优化(针对整个函数)和过程间优化(多个函数一起统筹优化)。
从优化的时机也就是时间维度来说我们在编译和运行的各个阶段都可以做优化。所以llvm的主要发起人Chris Lattner曾经发表了一篇论文主题就是**全生命周期优化**。在编译期呢,编译器的前端就可以做优化,比如我们已经做过一些常数折叠工作。在后端也可以做一些优化,比如我们前面讲过的尾递归和尾调用优化。
但大部分优化是发生在前端和后端中间的过渡阶段这个阶段有时候也被叫做中端。除了这些还有运行时的优化。对于V8这种JIT的引擎在运行时还可以收集程序运行时的一些统计信息对程序做进一步的优化编译在某些场景下甚至比静态编译的效果还好。
### 优化的算法
优化涉及的算法也有很多。比如前面我们做常量折叠的时候基本上遍历一下AST进行属性计算就行了 ,但在做尾递归和尾调用优化的时候,我们就需要基于栈桢的知识对生成的汇编代码做调整,这里面就涉及到了一些优化的算法。但其中最有用的,则是**控制流**和**数据流分析**。
对于数据流分析,我们已经讲过不少了。那控制流分析是怎么回事呢?**控制流分析的重点是分析程序跳转的模式**,比如识别出来哪些是循环语句、哪些是条件分支语句等等,从而找到可以优化的地方。
比如如果一个循环内部的变量是跟循环无关的。那我们就可以把它提到循环外面避免重复计算该变量的值这种优化叫做“循环无关变量外提”。比如下面的示例程序中变量c的值跟循环是无关的所以我们就没必要每次循环都去计算它了。而要实现这种优化需要优化算法把程序的控制流分析清楚。
```plain
function foo(a:number):number{
let b = 0;
for (let i = 0; i< a; i++){
let c = a*a; //变量c的值与循环无关导致重复计算
b = i + c;
}
return b;
}
```
### 优化算法所依托的数据结构
针对中端的优化工作,我们最经常采用的数据结构是**控制流图**也就是CFG。在生成汇编代码的时候我们已经接触过控制流图了。当时我们把代码划分成一个个的基本块每个基本块都保存一些汇编代码基本块之间形成控制流的跳转。控制流图的数据结构用得很广泛比如llvm编译器就是基于CFG的这也意味着像C、C++、Rust、Julia这些基于llvm的语言都受益于CFG数据结构。另外虽然Go语言并不是基于llvm编译器的但也采用了CFG。
**控制流图最大的优点,当然是能够非常清楚地显示出控制流来,也就是程序的全局结构**。而我们做数据流分析的时候通常也要基于这样一个控制流的大框架来进行。比如我们在做变量活跃性分析的时候就是先分析了在单个的基本块里的变量活跃性然后再扩展到基于CFG在多个基本块之间做数据流分析。
不过虽然CFG的应用很普遍但它并不是唯一用于优化的数据结构。特别是像Java编译器Graal和JavaScript的V8引擎都采用了另一种基于图的IR。不过构成这个图的节点并不是基本块。我在这节课后面会重点介绍这个数据结构并且说明为什么采用这个数据结构的原因。
刚才我挑重点介绍了与优化有关的背景知识。不过我用短短的篇幅浓缩了太多的干货你可能会觉得过于抽象。所以我还是举几个例子更加直观地说明一下与优化有关的知识点借此我们也可以继续讨论下面关于IR的话题。
## 一个优化的例子
我们先来看这个代码片段这段代码中x和y都被赋值成了a+b。
```plain
x = a + b
y = a + b
z = y - x
```
你用肉眼就能看出来第二行代码是可以被优化的因为x和y的值是一样的所以在第二行代码中我们就不需要再计算一遍a+b了直接把x赋值给y就行。这种优化叫做“**公共子表达式删除Common Subexpression Elimination**”:
```plain
x = a + b
y = x
z = y - x
```
再接着看其实第三行也是可以优化的。因为y是等于x的所以 z := x - x也就是 z : = 0。这种优化方法是把y的值传播到了第三行所以就叫做**“拷贝传播Copy Propagation**”。
```plain
x = a + b
y = x
z = x - x //进一步可以优化成 z = 0
```
再进一步我们假设这个代码片段后面跟着的代码不需要再用变量y了那我们就可以把第二行代码删除这个方法就叫做“**死代码删除Dead Code Elimination**”。
为了实现上面这些优化工作我们经常使用的就是数据流分析算法。比如说使用我们之前学过的变量活跃性分析我们就可以知道在第二行处其实y是不活跃的是死代码可以删除。
同时,我们在优化算法中,还会经常使用一种叫做“**使用-定义链(Use-def chain**)”的技术,也就是在变量的定义和使用之间建立连接。从变量的定义,可以找到所有使用它的地方。反过来,在每个使用变量的地方,也可以找到它的定义。
我们用这种技术分析一下上面的第一个代码片段。在这段代码中x的定义使用到了a和b而它自己又被y和x所使用这样就构成了use-def链。
![图片](https://static001.geekbang.org/resource/image/42/52/4210235fc24c28ddf2d186b96ceb9252.jpg?wh=1785x640)
那use-def链有什么用途呢我们通过use-def链知道了变量和定义之间的关系以后实际上也就清楚了数据是怎么从一个变量流动到另一个变量的这其实就是程序中的数据流。知道了这些之后我们就能更容易地进行数据流分析也更容易实现优化。
比如既然y的定义是x那么x可以顺着use-def链往下传传播到z的定义中也就是第三行代码中实现拷贝传播。
而且用def-use链判断死代码也更容易。比如在第三个代码片段中是没有变量引用y的所以我们就能断定用来定义y的第二行肯定是死代码了。
所以use-def链是一项很有用的技术比如llvm等很多编译器都采用了它。
不过为了更好地使用use-def链技术更清晰地表达程序中的数据流我们对于要使用的IR是有一定要求的也就是要求IR是符合SSA格式的。
## 静态单赋值SSA格式的IR
我们首先说说什么是IR。我估计你应该知道IR的意思的。IR是Intermediate Representation的缩写字面意思是中间表达也就是我们的程序在转变成目标代码之前的一些中间格式。
从广义角度来说介于源代码和目标代码之间的各种中间格式都可以叫做IR。从这个意义上来说AST也可以看做是一种IR。不过**当我们提到IR的时候更多时候指的是它比较狭义的意思也就是用于优化的中间格式**。
IR也是有很多种的。在上面的示例程序中我使用的这种IR叫做“三地址代码”这也是教科书中经常使用的一种IR。这种IR的每个变量就是一个地址比如x = a + b中赋值符号左边是一个地址右边最多可以有两个地址。
那我刚才提到的要求IR是符合SSA格式的又是什么意思呢
SSA是Static Single Assignment的缩写也就是**静态单赋值**。它的意思是,**在代码中每个变量只能被定义一次**。比如如果我们之前定义x为a+b之后又定义它为c+d那这个IR就不符合SSA格式了。
```plain
x = a + b
...
x = c + d
```
这说的也是单赋值,那静态单赋值中的静态又是什么意思呢?
其实如果某个变量的赋值是出现在一个循环中那么在程序运行的时候这个变量可能被赋值了多次这是程序的动态情况。而我们目前对代码所做的分析都是静态分析。我们可以说只要在代码中变量只被赋值过一次就是符合SSA的。
如果每个变量只被赋值过一次,那么用“定义”这个词汇就很准确了,因为每个变量都是被其他变量所唯一定义的,在使用过程中一直不变的。
不过为什么要求IR必须是SSA格式的呢因为SSA格式的IR会产生很多好处使得优化算法更加简单。
比如在下面的代码片段中a一开始被赋值为c后来被赋值为d。那么这个时候虽然x和y的定义相同但它们实际的值是不同的因为a的定义发生了变化所以这里我们就不能进行子表达式删除的优化了。如果我们仍然要用use-def链来保存定义和使用的关系的话那就必须要把a的这两个值区分开比如变成a1和a2这样实际上也就变成了SSA格式。
```plain
a = c
x = a + b
a = d
y = a + b
```
我再用TypeScript举一个例子。在下面这个代码片段中变量a被赋值了两次。在第一次a是一个整型数据在第二次它变成了字符串型。
```plain
let a:number|string;
a = 2; //a现在是整型
console.log(a+3); //打印出5
a = "2"; //a变成了字符串型
console.log(a+3); //打印出字符串"23"
```
在这里例子中前后两个a的定义其实是完全不相关的连类型都不一样所以这里本来就应该写成两个变量才更合理。
好了我想你大致应该明白了SSA的含义以及使用SSA的原因了。那我们再进一步介绍一种先进的、用图来表示的IR。
## 基于图的IR节点之海
在前面的示例程序中,变量之间的定义-使用链是能够形成一张图的。如果再加上运算符,我们就可以用这张图来表达程序的逻辑了。
比如,这里有一个程序片段:
```plain
x = a + b
y = a + b
z = y * 10
```
如果我们把变量之间的数据流关系以及运算符画成图,就是下面的样子:
![图片](https://static001.geekbang.org/resource/image/a2/2b/a23d5dfd69f48f12acdc93c4c97f4f2b.jpg?wh=1188x640)
乍一看你会觉得这是一颗倒过来的AST。如果按照AST来看z的值确实就是(a+b)\*10一点都没错。
这里你要注意的是在生成这个图的时候我们可以把相同的表达式合并。比如x和y的值都是a + b那么我们就用同一个子图来表示就好了这样我们自然而然地就实现了公共子表达式的删除的优化。从这一点上你就能初步看到这种IR的优势了。
![图片](https://static001.geekbang.org/resource/image/e2/41/e2b4ee887741b6abbbc10125a2c6f741.jpg?wh=1188x640)
我们再接着看这个子图,你会发现,+号运算符有两条输出的边代表它依赖这两条边所指向的a和b变量来提供值。还有一条输入的边这里代表另一节点依赖这个节点数据。不过也有的论文会把箭头反过来画这样的话箭头方向代表的就是数据的流动方向而不是数据依赖关系了但它们表达的意思是一样的。
不过目前我们画出来的图只能用来表示数据流表达像刚才这样的进行算术运算的直线式执行的逻辑但不能表达控制流逻辑比如if语句、for循环语句和调用函数这些。不过你现在已经学习过生成汇编代码了所以你应该知道这些控制流逻辑都有一个共同的特点就是它们会生成跳转指令跳转到另外的代码地址去执行。
但我们仍然可以用图的方式来表达控制流逻辑。现在让我们先来分析一个带有if语句的简单的函数的例子这个例子是用TypeScript写的
```plain
function foo(a:number, b:number):number{
let x:number;
if (a>10){
x = a + b;
}
else{
x = a - b;
}
return x;
}
```
把这个程序转化成图,是下面的样子:
![图片](https://static001.geekbang.org/resource/image/6d/1d/6d67505a10a288c9c6cfce56fb53e91d.jpg?wh=1486x1080)
我解释一下这张图。
首先我们先看一下数据流的部分也就是橙色线的和橙色节点的部分。你会看到原来的变量x现在要变成x1和x2这两个变量这样才符合SSA的要求每个变量只赋值一次。
但这个时候就有个问题了我们最后一条语句“return x”中的x到底是x1还是x2呢
这显然取决于程序的控制流走得是哪个语句块。如果走得是if块呢那么就使用x1否则就使用x2。
所以这里我们引入了一个phi节点。这个节点的作用就是根据控制流提供的信息来确定选择两个值中的哪一个。我在图中用黑线表示了从控制流中提供过来的信息。从这个例子中你也可以看出**phi运算是SSA格式的IR中必然会采用的一种运算用来从多个可能的数据流分支中选择一个值**。
那接下来我们再看看控制流,也就是程序中的蓝色节点和蓝色箭头的部分。
控制流是从start节点开始的这也是进入函数的点。接着在if语句那里控制流会根据if条件为真还是假形成两条分支。因此if节点需要从“a>10”这个节点获得条件表达式的计算结果。由于这个值是与控制流有关的所以我也把这条箭头线也画成了黑色。
从if语句发出的两条控制流都以begin开头以end结尾。如果每条分支里还有嵌套的if语句和循环语句新的控制流节点就会出现在begin和end之间。这两条控制流在merge节点合并在一起并且它们会给merge节点提供一个信息说明控制流到底是从哪条分支过来的。这个信息又会给到数据流中的phi节点告诉phi节点应该计算哪个数据流分支的数据。
到这里,整个图就完成了。这个图也忠实地体现了原来程序的逻辑。
其实这个图就是当前JavaScript的V8编译器和Java的Graal编译器都在使用的一种IR。我们后面的课程还会进一步解析这个IR也会再分析如何基于这个IR来编译程序。
最后说说“节点之海”这个别名。你可以看到我们的示例程序是非常简单的但都形成了由这么多的节点构成的图。可以想象如果程序更复杂一点节点就会更多。并且我们在优化时还会把多个函数的图按照调用关系拼在一起形成更大的图就会更加令人眼花缭乱所以这个IR也被叫做节点之海。好在计算机的处理能力可比我们的眼睛强多了完全能够基于这样的IR愉快地完成优化和编译工作。
## 课程小结
这节课到这里就结束了。今天这节课我以非常紧凑的篇幅介绍了与优化有关的背景知识目的是帮助你把思路转移到优化这个主题上开始一起思考与优化有关的技术。而今天这节课重点呢显然是介绍JavaScript和Java编译器都在使用的一种基于图的IR。这里我希望你记住几个知识点。
首先,你需要记住优化技术的常用分类,比如按照空间维度,也就是优化的范围,可以分为本地优化、全局优化和过程间优化。从时间维度,优化技术可以贯穿整个程序的生命周期。
第二,从算法角度,优化算法也有很多,数据流分析算法仍然很有用。
第三从数据结构角度优化算法需要依托定义良好的数据结构和IR。之前我们使用过的CFG是常用的、成熟的数据结构而基于图的IR则是更前沿的、值得我们关注的一个数据结构。
第四,你还需要熟悉一些常见的优化场景,比如这节课提到的子表达式删除、拷贝传播、死代码删除、循环无关变量外提,等等。这样,你在思考与优化有关的技术的时候,会更容易联系实际。
第五目前成熟语言的编译器里用于做优化的IR都是符合SSA格式的它的好处是更容易形成use-def链、分隔开原本就应该是不同的变量、更有利于算法运行等等。这节课介绍的基于图的IR也是符合SSA格式的因为每个节点代表一个变量所以每个节点当然只能静态赋值一次。你要注意SSA格式的IR遇到控制流的分支和合并时需要一个phi运算帮助确定到底选择哪条数据流线路上的值。
第六、关于基于图的IR你目前只需要记住它能够同时表达数据流和控制流并且它也能够像AST一样忠实地反映源代码的逻辑就好了在后面的课程中我们还会继续深入了解它。
总结一遍以后,发现今天的知识点还真是挺密集的,我希望你能多看几遍,加深印象。
## 思考题
今天这节课,我们介绍了几个的简单的优化场景。你能不能再给我们分享一下你知道的优化场景和优化技术?多了解这些场景,会让我们的学习更加联系实际。
欢迎你把这节课分享给更多感兴趣的朋友。我是宫文学,我们下节课见。