# 15 | 挂起函数：Kotlin协程的核心

    你好，我是朱涛。这节课，我们来学习协程的挂起函数。

挂起函数，是Kotlin协程当中最基础、最重要的知识点。如果对协程的挂起函数没有足够的认识，我们后续的学习将会困难重重。如果不理解挂起函数，我们将无法理解协程的非阻塞；如果不了解挂起函数，我们将无法掌握Channel、Flow等API；如果不理解挂起函数，我们写出来的代码也会漏洞百出，就更别提优化软件架构了。

相反，如果能将挂起函数理解透彻，我们后面的学习也会更加轻松一些。所以这节课，我会从应用和原理两个角度，来带你理解挂起函数，包括如何使用挂起函数来优化异步任务，以及挂起函数的CPS当中的Continuation到底是什么。通过对这两个维度的学习，你在更轻易地掌握挂起函数应用场景的同时，对它的底层原理也会有一定认识。

那么接下来，你一定要打起精神，我们一起来攻克这个关键的知识点！

## 挂起函数：Kotlin协程的优势

通过前面课程的学习，我们已经知道了：协程就像是轻量级的线程一样。用线程能实现的功能，我们借助launch和async也同样可以做到。

不过你可能会好奇，如果只是把thread{} 替换成launch{}，那协程比起线程也没什么特殊的优势吧？**仅仅只是因为“轻量”“非阻塞”，我们就应该放弃线程，拥抱协程吗？**

其实，Kotlin协程最大的优势，就在于它的挂起函数。虽然很多编程语言都有协程的特性，但目前为止，只有Kotlin独树一帜，引入了“挂起函数”的概念。另外尽管有些语言的协程底层，也存在“挂起恢复”的概念，但是将这一概念直接暴露给开发者，直接用于修饰一个函数的，Kotlin算是做了一种创新。

那么，挂起函数到底有什么神奇的呢？我们先来看一段简单的Java代码：

```java
// 代码段1

getUserInfo(new CallBack() {
    @Override
    public void onSuccess(String response) {
        if (response != null) {
            System.out.println(response);
        }
    }
});

```

在这段代码中，我们发起了一个异步请求，从服务端查询用户的信息，通过CallBack返回response。这样的代码看起来没什么问题，平时我们写代码的时候也经常写类似的代码。不过实际的商业项目不可能这么简单，有的时候，我们可能需要连续执行几个异步任务，比如说，查询用户信息 --> 查找该用户的好友列表 -->拿到好友列表后，查找该好友的动态。

这样一来，我们的代码就难免会往下面这个方向发展：

```plain
// 代码段2

getUserInfo(new CallBack() {
    @Override
    public void onSuccess(String user) {
        if (user != null) {
            System.out.println(user);
            getFriendList(user, new CallBack() {
                @Override
                public void onSuccess(String friendList) {
                    if (friendList != null) {
                        System.out.println(friendList);
                        getFeedList(friendList, new CallBack() {
                            @Override
                            public void onSuccess(String feed) {
                                if (feed != null) {
                                    System.out.println(feed);
                                }
                            }
                        });
                    }
                }
            });
        }
    }
});

```

只要你参与过大型软件的开发，不管你用的是什么编程语言，你大概率都见到过类似上面的代码模式：**回调地狱**。

我们给它取这个名字是有原因的，以上代码存在诸多缺陷：**可读性差、扩展性差、维护性差，极易出错**！想象一下，如果让你基于以上代码再扩展出“超时取消”“出错重试”“进度展示”等相关功能，你会不会觉得头疼？

所以这时候，就该轮到Kotlin协程出场了。让我们用协程的挂起函数，来重构上面的代码：

```plain
// 代码段3

val user = getUserInfo()
val friendList = getFriendList(user)
val feedList = getFeedList(friendList)

```

你看，是不是简洁到了极致？这就是Kotlin协程的魅力：**以同步的方式完成异步任务**。  
注意，以上代码之所以能写成类似同步的方式，关键还是在于getUserInfo()、getFriendList()、getFeedList()这三个请求函数的定义。

```plain
// 代码段4

// delay(1000L)用于模拟网络请求

//挂起函数
// ↓
suspend fun getUserInfo(): String {
    withContext(Dispatchers.IO) {
        delay(1000L)
    }
    return "BoyCoder"
}

//挂起函数
// ↓
suspend fun getFriendList(user: String): String {
    withContext(Dispatchers.IO) {
        delay(1000L)
    }
    return "Tom, Jack"
}

//挂起函数
// ↓
suspend fun getFeedList(list: String): String {
    withContext(Dispatchers.IO) {
        delay(1000L)
    }
    return "{FeedList..}"
}

```

从以上代码中，我们可以看到，**所谓的挂起函数，其实就是比普通的函数多了一个suspend关键字而已**。如果去掉这个suspend关键字，所有的函数都会变成普通函数。

> 代码中的withContext(Dispatchers.IO)，作用是控制协程执行的线程池，具体细节我们会在第17讲中介绍。

既然如此，那么这个suspend关键字的作用是啥呢？挂起函数到底特别在哪呢？

实际上，挂起函数最神奇的地方，就在于它的挂起和恢复功能。从字面上看，suspend这个词就是“挂起”的意思，而它既然能被**挂起**，自然就还可以被**恢复**。它们两个一般是成对出现的。

> 还记得我们在讲[协程思维模型](https://time.geekbang.org/column/article/485632)的时候提到的“非阻塞”概念吗？这主要就归功于Kotlin协程的挂起函数的能力。

不过，我单纯用文字告诉你Kotlin协程支持挂起和恢复，你一定没有什么概念，我做了一个小动画，描述了挂起函数整体的执行流程，同时也展示了其背后更多的细节。需要注意的是，动画当中出现的“闪烁”，模拟的是请求网络。**你一定要多看几遍，确保没有遗漏其中的细节。**

然后，我也再给你重点解释下其中的关键点：

*   在IntelliJ当中，挂起函数会有一个特殊的箭头标记，这样就便于我们分辨出当前调用的函数是否是普通函数。调用挂起函数的位置，我们叫做是**挂起点**。
*   另外，表面上看起来是同步的代码，实际上也涉及到了线程切换，一行代码，切换了两个线程。
    *   比如“val user = getUserInfo()”，其中“=”左边的代码运行在主线程，而“=”右边的代码运行在IO线程。
    *   每一次从主线程到IO线程，都是一次协程挂起。
    *   每一次从IO线程到主线程，都是一次协程恢复。
*   挂起和恢复，这是挂起函数**特有的能力**，普通函数是不具备的。
*   挂起，只是将程序执行流程转移到了其他线程，主线程不会被阻塞。如果以上代码运行在Android系统，我们的App仍然可以响应用户的操作，主线程并不繁忙。相信现在，你对协程思维模型又会有更加深刻的体会了。

好，挂起函数的执行流程我们已经很清楚了。借助挂起函数，我们可以用同步的方式来写异步代码，对比起前面“回调地狱”式的代码，挂起函数写出来的代码可读性更好、扩展性更好、维护性更好，并且更难出错。

这个时候，你也许会感慨：挂起函数真的是太神奇了！简直就跟魔法一样！**那么，Kotlin协程到底是如何做到一行代码切换两个线程的呢？**

其实，Kotlin协程当中并不存在什么“魔法”。这一切的细节，都藏在了挂起函数的 **suspend** 关键字里。

## 深入理解suspend

到目前为止，我们已经知道了：suspend，是Kotlin当中的一个关键字，它主要的作用是用于定义“挂起函数”。不过如果你有仔细留意上节课当中的一段代码，你就会发现，同样的一个函数，加上suspend修饰以后，它的**函数类型**就会发生改变。

我们来回忆一下上节课的那段代码：

```plain
// 代码段5

fun func1(num: Int): Double {
    return num.toDouble()
}
/*
func1与func3唯一的区别
   ↓                         */
suspend fun func3(num: Int): Double {
    delay(100L)
    return num.toDouble()
}

val f1: (Int) -> Double = ::func1
val f2: suspend (Int) -> Double = ::func3

val f3: (Int) -> Double = ::func3 // 报错
val f4: suspend (Int) -> Double = ::func1 // 报错

```

可见，同样是Int作为参数，Double作为返回值，有没有suspend修饰，它们两者的函数类型是不一样的。“suspend (Int) -> Double”与“(Int) -> Double”并不能互相赋值。

在讲[高阶函数](https://time.geekbang.org/column/article/476637)的时候，我提到过Kotlin的函数类型，其实只跟参数、返回值、接收者相关，不过现在又加了一条：还跟suspend相关。

> 补充：如果你接触过[Compose](https://github.com/JetBrains/compose-jb)，你会发现其中的@Composable跟suspend一样，也可以改变一个函数的类型，不过这个并不是我们要了解的重点，这里只是帮助你建立一个知识连接，如果你将来遇到了Compose，你就可以快速理解了。

**那么，suspend修饰的函数，到底会变成什么类型？**如果你将挂起函数与前面“回调地狱的代码”放在一起对比，再结合我们[第3讲](https://time.geekbang.org/column/article/473529)学过的Kotlin原理，应该就会找到一些头绪了：

![图片](https://static001.geekbang.org/resource/image/08/68/08c49bd12047359fc8cea409fc6a2568.png?wh=1442x811)

其实，**挂起函数的本质，就是Callback**。

别忘了，我们还有Kotlin编译器这个“幕后的翻译官”啊！虽然我们写出来的挂起函数并没有任何Callback的逻辑，但是，当Kotlin编译器检测到suspend关键字修饰的函数以后，就会自动将挂起函数转换成带有CallBack的函数。

如果我们将上面的挂起函数反编译成Java，结果会是这样：

```java
// 代码段6

//                              Continuation 等价于 CallBack
//                                         ↓         
public static final Object getUserInfo(Continuation $completion) {
  ...
  return "BoyCoder";
}

```

从反编译的结果来看，挂起函数确实变成了一个带有CallBack的函数，只是这个CallBack换了个名字，叫做Continuation。我们来看看Continuation在Kotlin中的定义：

```plain
// 代码段7

public interface Continuation<in T> {
// ...

//      相当于 CallBack的onSuccess   结果   
//                 ↓                 ↓
    public fun resumeWith(result: Result<T>)
}

interface CallBack {
    void onSuccess(String response);
}

```

根据以上定义我们其实能发现，**Continuation本质上也就是一个带有泛型参数的CallBack**，只是它的名字看起来有点吓人而已。这个“从挂起函数转换成CallBack函数”的过程，被叫做是CPS转换（Continuation-Passing-Style Transformation）。

看，Kotlin官方要将CallBack命名为Continuation的原因也出来了：Continuation道出了它的实现原理。当然，为了理解挂起函数，我们用CallBack会更加简明易懂。

下面我用动画来演示一下挂起函数在CPS转换过程中，函数签名的变化：

![图片](https://static001.geekbang.org/resource/image/37/92/3732f7a3473e82c5a5d109a18d87f992.gif?wh=720x405)

> **注意**：挂起函数CPS转换后的内部逻辑，其实要远比演示的复杂，这个我们到源码篇再深究，我们暂时只关注它**函数签名**的变化。

你能看到，在上面CPS转换的过程中，函数的类型发生了变化：“suspend ()->String” 变成了 “(Continuation)-> Any?”。

而这就意味着，如果你在Java中访问一个Kotlin挂起函数getUserInfo()，会看到Java里的getUserInfo()的类型是“(Continuation)-> Object”（即接收Continuation为参数，返回值是Object）。

![图片](https://static001.geekbang.org/resource/image/5b/90/5b81e4a51acaafa1ce56f7a888037790.png?wh=792x286)

到这里，我们就只剩下最后一个问题需要搞清楚了，那就是：**Continuation到底是什么**？如果你查[词典](https://dictionary.cambridge.org/zhs/%E8%AF%8D%E5%85%B8/%E8%8B%B1%E8%AF%AD/continuation)和[维基百科](https://zh.wikipedia.org/wiki/%E8%AE%A1%E7%AE%97%E7%BB%AD%E4%BD%93)，可能会一头雾水，因为这个词太抽象了。

让我结合前面的代码案例，用更加通俗的语言解释给你听。

首先，我们只需要把握住Continuation的词源Continue即可。Continue是“继续”的意思，Continuation则是“接下来要做的事情”。放到程序中，Continuation就代表了，“程序继续运行下去需要执行的代码”，“接下来要执行的代码”，或者是“剩下的代码”。

就以上面的代码为例，当程序运行getUserInfo()这个挂起函数的时候，它的“Continuation”则是下图红框的代码：

![图片](https://static001.geekbang.org/resource/image/06/yb/060c08db5f586ed8e189cfa26eaa6yyb.png?wh=960x376)

这样理解了Continuation以后，CPS也就容易理解了，它其实就是**将程序接下来要执行的代码进行传递的一种模式**。

而CPS转换，就是**将原本的同步挂起函数转换成CallBack异步代码**的过程。这个转换是编译器在背后做的，我们程序员对此并无感知。

![图片](https://static001.geekbang.org/resource/image/03/22/03d156ec6a31d650c6634f486dc06222.gif?wh=720x405)

根据这个动图，可以看到当程序执行到getUserInfo()的时候，剩下的未执行代码都被一起打包了起来，以Continuation的形式，传递给了getUserInfo()的Callback回调当中。当然，这种方式其实只是大致模拟了挂起函数的CPS转换过程，实际细节要远比这个复杂。但这对于现阶段的学习来说，已经完全够用了。

以上就是Kotlin挂起函数的核心原理，它的挂起和恢复，其实也是通过CPS转换来实现的。在后面学习源码篇的时候，我们还会继续跟Continuation继续打交道。现在我们看着CPS的过程好像很简单，等到深入底层的时候，你会发现Continuation是多么的复杂和精妙。

这里，我们再来看看之前的协程思维模型：

![图片](https://static001.geekbang.org/resource/image/c6/1b/c6e735653c09f05ea94f5478d5e0d61b.gif?wh=1080x492)

所以，现在我们可以理出一条线索了：**协程之所以是非阻塞，是因为它支持“挂起和恢复”；而挂起和恢复的能力，主要是源自于“挂起函数”；而挂起函数是由CPS实现的，其中的Continuation，本质上就是Callback**。

读完上面的这段话，也许你会忍不住好奇：**协程跟挂起函数之间是什么关系？**

## 协程与挂起函数

你可能觉得，既然协程和挂起函数都是支持挂起和恢复的，那它们两个是不是同一个东西呢？

答案当然是**否定**的。

关于协程和挂起函数的关系，我们暂时还不适合深入源码层面去做探讨。不过，从我们目前已有的信息，就可以直接推断出，它们之间肯定是有着千丝万缕的联系的。让我们来看个简单的例子：

```plain
// 代码段8

fun main() {
    getUserInfo() // 报错
}

suspend fun getUserInfo(): String {
    withContext(Dispatchers.IO) {
        delay(1000L)
    }
    return "BoyCoder"
}

```

在上面的代码中，我们直接在main函数当中调用了getUserInfo()这个挂起函数，这时候，我们发现IDE会报错，报错的具体内容是这样的：

![图片](https://static001.geekbang.org/resource/image/68/aa/68010f8b8bd5de8d58dd8576828d92aa.png?wh=945x247)

这个报错信息的意思是：**挂起函数，只能在协程当中被调用，或者是被其他挂起函数调用**。这个意思也很好理解，对于这样的要求，我们很容易就能写出下面的代码：

```plain
// 代码段9

// 在协程中调用getUserInfo()
fun main() = runBlocking {
    val user = getUserInfo()
}

// 在另一个挂起函数中调用getUserInfo()
suspend fun anotherSuspendFunc() {
    val user = getUserInfo()
}

```

代码写到这里，很多人都会满足于这样的结果。但实际上，以上两种方式，它们之间是可以继续深入并且挖掘出共性的。

让我们回过头来看看runBlocking的函数签名：

```plain
// 代码段10

public actual fun <T> runBlocking(
    context: CoroutineContext, 
    block: suspend CoroutineScope.() -> T
): T {
}

```

我们重点关注它的第二个参数block的类型“suspend CoroutineScope.() -> T”，看到其中的suspend关键字了吗？**原来block也是一个挂起函数的类型**！那么，在block当中可以调用挂起函数，就一点也不奇怪了！

所以说，虽然“协程和挂起函数”都可以调用“挂起函数”，但是协程的Lambda，也是挂起函数。所以，它们本质上都是因为“挂起函数可以调用挂起函数”。

也就是说，站在目前的阶段来看，我们可以认为：**挂起和恢复，是协程的一种底层能力；而挂起函数，是这种底层能力的一种表现形式，通过暴露出来的suspend关键字，我们开发者可以在上层，非常方便地使用这种底层能力。**

## 小结

这节课，我们主要学习了Kotlin协程当中的最核心的特性：**挂起函数**。

挂起函数可以极大地简化异步编程，让我们能够**以同步的方式写异步代码**。相比“回调地狱”式的代码，挂起函数写出来的代码**可读性更好、扩展性更好、维护性更好，也更难出错**。而除此之外，你也需要牢记以下这些核心要点，来更好地掌握挂起函数。

*   要定义挂起函数，我们只需在普通函数的基础上，增加一个**suspend关键字**。suspend这个关键字，是会改变函数类型的，“suspend (Int) -> Double”与“(Int) -> Double”并不是同一个类型。
*   挂起函数，由于它拥有**挂起和恢复**的能力，因此对于同一行代码来说，“=”左右两边的代码分别可以执行在不同的线程之上。而这一切，都是因为Kotlin编译器这个幕后的翻译官在起作用。
*   **挂起函数的本质，就是Callback**。只是说，Kotlin底层用了一个更加高大上的名字，叫Continuation。而Kotlin编译器将suspend翻译成Continuation的过程，则是CPS转换。这里的Continuation是代表了，“程序继续运行下去需要执行的代码”，“接下来要执行的代码”，或者是 “剩下的代码”。

最后，我们还探索了协程与挂起函数之间的关系。我们发现：**挂起函数，只能在协程当中被调用，或者是被其他挂起函数调用**。但协程中的block，本质上仍然是挂起函数。

所以，我们可以认为：挂起和恢复是协程的一种底层能力；而挂起函数则是一种上层的表现形式。

![](https://static001.geekbang.org/resource/image/19/bd/19591ff06ebc553ca6fa695a3914bdbd.jpg?wh=2000x1279)

## 思考题

前面我们提到“挂起函数只能在协程当中被调用，或者是被其他挂起函数调用”，而本质上，还是因为“挂起函数可以调用挂起函数”。那么，你能找出更加底层的证据吗？

换个方式理解就是：凭什么挂起函数可以调用挂起函数，而普通函数不能调用挂起函数？它的底层逻辑到底什么？

```plain
// 代码段11

fun normalFunc() {
    val user = getUserInfo() // 报错
}

suspend fun anotherSuspendFunc() {
    val user = getUserInfo() // 通过
}

```

欢迎在留言区分享你的思考和答案，也欢迎你把今天的内容分享给更多的朋友，我们一起探讨和进步。