You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

108 lines
13 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 05 | 协程:如何快速地实现高并发服务?
你好,我是陶辉。
上一讲谈到,零拷贝通过减少上下文切换次数,提升了文件传输的性能。事实上高并发服务也是通过降低切换成本实现的,这一讲我们来看看它是如何做到的。
如果你需要访问多个服务来完成一个请求的处理比如实现文件上传功能时首先访问Redis缓存验证用户是否登陆再接收HTTP消息中的body并保存在磁盘上最后把文件路径等信息写入MySQL数据库中你会怎么做
用阻塞API写同步代码最简单但一个线程同一时间只能处理一个请求有限的线程数导致无法实现万级别的并发连接过多的线程切换也抢走了CPU的时间从而降低了每秒能够处理的请求数量。
为了达到高并发你可能会选择一个异步框架用非阻塞API把业务逻辑打乱到多个回调函数通过多路复用实现高并发然而由于业务代码过度关注并发细节需要维护很多中间状态不但Bug率会很高项目的开发速度也上不去产品及时上线存在风险。
如果想兼顾开发效率,又能保证高并发,协程就是最好的选择。它可以在保持异步化运行机制的同时,用同步方式写代码,这在实现高并发的同时,缩短了开发周期,是高性能服务未来的发展方向。
你会发现,解决高并发问题的技术一直在变化,从多进程、多线程,到异步化、协程,面对不同的场景,它们都在用各自不同的方式解决问题。我们就来看看,高并发的解决方案是怎么演进的,协程到底解决了什么问题,它又该如何应用。
## 如何通过切换请求实现高并发?
我们知道主机上资源有限一颗CPU、一块磁盘、一张网卡如何同时服务上百个请求呢多进程模式是最初的解决方案。内核把CPU的执行时间切分成许多时间片timeslice比如1秒钟可以切分为100个10毫秒的时间片每个时间片再分发给不同的进程通常每个进程需要多个时间片才能完成一个请求。
这样虽然微观上比如说就这10毫秒时间CPU只能执行一个进程但宏观上1秒钟执行了100个时间片于是每个时间片所属进程中的请求也得到了执行**这就实现了请求的并发执行。**
不过,每个进程的内存空间都是独立的,这样用多进程实现并发就有两个缺点:一是内核的管理成本高,二是无法简单地通过内存同步数据,很不方便。于是,多线程模式就出现了,多线程模式通过共享内存地址空间,解决了这两个问题。
然而共享地址空间虽然可以方便地共享对象但这也导致一个问题那就是任何一个线程出错时进程中的所有线程会跟着一起崩溃。这也是如Nginx等强调稳定性的服务坚持使用多进程模式的原因。
事实上,无论基于多进程还是多线程,都难以实现高并发,这由两个原因所致。
首先单个线程消耗的内存过多比如64位的Linux为每个线程的栈分配了8MB的内存还预分配了64MB的内存作为堆内存池你可以从[\[第2讲\]](https://time.geekbang.org/column/article/230221) 中找到Linux系统为什么这么做。所以我们没有足够的内存去开启几万个线程实现并发。
其次,切换请求是内核通过切换线程实现的,什么时候会切换线程呢?不只时间片用尽,**当调用阻塞方法时内核为了让CPU充分工作也会切换到其他线程执行。**一次上下文切换的成本在几十纳秒到几微秒间当线程繁忙且数量众多时这些切换会消耗绝大部分的CPU运算能力。
下图以上一讲介绍过的磁盘IO为例描述了多线程中使用阻塞方法读磁盘2个线程间的切换方式。
![](https://static001.geekbang.org/resource/image/a7/1e/a7729794e84cbb4a295454c6f2005c1e.jpg)
那么,怎么才能实现高并发呢?**把上图中本来由内核实现的请求切换工作,交由用户态的代码来完成就可以了**异步化编程通过应用层代码实现了请求切换降低了切换成本和内存占用空间。异步化依赖于IO多路复用机制比如Linux的epoll或者Windows上的iocp同时必须把阻塞方法更改为非阻塞方法才能避免内核切换带来的巨大消耗。Nginx、Redis等高性能服务都依赖异步化实现了百万量级的并发。
下图描述了异步IO的非阻塞读和异步框架结合后是如何切换请求的。
![](https://static001.geekbang.org/resource/image/5f/8e/5f5ad4282571d8148d87416c8f8fa88e.jpg)
**然而,写异步化代码很容易出错。**因为所有阻塞函数,都需要通过非阻塞的系统调用拆分成两个函数。虽然这两个函数共同完成一个功能,但调用方式却不同。第一个函数由你显式调用,第二个函数则由多路复用机制调用。这种方式违反了软件工程的内聚性原则,函数间同步数据也更复杂。特别是条件分支众多、涉及大量系统调用时,异步化的改造工作会非常困难。
有没有办法既享受到异步化带来的高并发,又可以使用阻塞函数写同步化代码呢?
协程可以做到,**它在异步化之上包了一层外衣,兼顾了开发效率与运行效率。**
## 协程是如何实现高并发的?
协程与异步编程相似的地方在于,它们必须使用非阻塞的系统调用与内核交互,把切换请求的权力牢牢掌握在用户态的代码中。但不同的地方在于,协程把异步化中的两段函数,封装为一个阻塞的协程函数。这个函数执行时,会使调用它的协程无感知地放弃执行权,由协程框架切换到其他就绪的协程继续执行。当这个函数的结果满足后,协程框架再选择合适的时机,切换回它所在的协程继续执行。如下图所示:
![](https://static001.geekbang.org/resource/image/e4/57/e47ec54ff370cbda4528e285e3378857.jpg)
看起来非常棒,然而,异步化是通过回调函数来完成请求切换的,业务逻辑与并发实现关联在一起,很容易出错。协程不需要什么“回调函数”,它允许用户调用“阻塞的”协程方法,用同步编程方式写业务逻辑。
那协程的切换是如何完成的呢?
实际上,**用户态的代码切换协程,与内核切换线程的原理是一样的。**内核通过管理CPU的寄存器来切换线程我们以最重要的栈寄存器和指令寄存器为例看看协程切换时如何切换程序指令与内存。
每个线程有独立的栈而栈既保留了变量的值也保留了函数的调用关系、参数和返回值CPU中的栈寄存器SP指向了当前线程的栈而指令寄存器IP保存着下一条要执行的指令地址。因此从线程1切换到线程2时首先要把SP、IP寄存器的值为线程1保存下来再从内存中找出线程2上一次切换前保存好的寄存器值写入CPU的寄存器这样就完成了线程切换。其他寄存器也需要管理、替换原理与此相同不再赘述。
协程的切换与此相同,只是把内核的工作转移到协程框架实现而已,下图是协程切换前的状态:
![](https://static001.geekbang.org/resource/image/a8/f7/a83d7e0f37f35353c6347aa76c8184f7.jpg)
从协程1切换到协程2后的状态如下图所示
![](https://static001.geekbang.org/resource/image/25/3f/25d2dcb8aa4569e5de741469f03aa73f.jpg)
创建协程时,会从进程的堆中(参见[\[第2讲\]](https://time.geekbang.org/column/article/230221)分配一段内存作为协程的栈。线程的栈有8MB而协程栈的大小通常只有几十KB。而且C库内存池也不会为协程预分配内存它感知不到协程的存在。这样更低的内存占用空间为高并发提供了保证毕竟十万并发请求就意味着10万个协程。当然栈缩小后就尽量不要使用递归函数也不能在栈中申请过多的内存这是实现高并发必须付出的代价。
由此可见协程就是用户态的线程。然而为了保证所有切换都在用户态进行协程必须重新封装所有的阻塞系统调用否则一旦协程触发了线程切换会导致这个线程进入休眠状态进而其上的所有协程都得不到执行。比如普通的sleep函数会让当前线程休眠由内核来唤醒线程而协程化改造后sleep只会让当前协程休眠由协程框架在指定时间后唤醒协程。再比如线程间的互斥锁是使用信号量实现的而信号量也会导致线程休眠协程化改造互斥锁后同样由框架来协调、同步各协程的执行。
**所以,协程的高性能,建立在切换必须由用户态代码完成之上,这要求协程生态是完整的,要尽量覆盖常见的组件。**比如MySQL官方提供的客户端SDK它使用了阻塞socket做网络访问会导致线程休眠必须用非阻塞socket把SDK改造为协程函数后才能在协程中使用。
当然,并不是所有的函数都能用协程改造。比如[\[第4讲\]](https://time.geekbang.org/column/article/232676) 提到的异步IO它虽然是非阻塞的但无法使用PageCache降低了系统吞吐量。如果使用缓存IO读文件在没有命中PageCache时是可能发生阻塞的。
这种时候,如果对性能有更高的要求,就需要把线程与协程结合起来用,把可能阻塞的操作放在线程中执行,通过生产者/消费者模型与协程配合工作。
实际上面对多核系统也需要协程与线程配合工作。因为协程的载体是线程而一个线程同一时间只能使用一颗CPU所以通过开启更多的线程将所有协程分布在这些线程中就能充分使用CPU资源。
除此之外为了让协程获得更多的CPU时间还可以设置所在线程的优先级比如Linux下把线程的优先级设置到-20就可以每次获得更长的时间片。另外[\[第1讲\]](https://time.geekbang.org/column/article/230194) 曾谈到CPU缓存对程序性能的影响为了减少CPU缓存失效的比例还可以把线程绑定到某个CPU上增加协程执行时命中CPU缓存的机率。
虽然这一讲中谈到协程框架在调度协程,然而,你会发现,很多协程库只提供了创建、挂起、恢复执行等基本方法,并没有协程框架的存在,需要业务代码自行调度协程。这是因为,这些通用的协程库并不是专为服务器设计的。服务器中可以由客户端网络连接的建立,驱动着创建出协程,同时伴随着请求的结束而终止。在协程的运行条件不满足时,多路复用框架会将它挂起,并根据优先级策略选择另一个协程执行。
因此使用协程实现服务器端的高并发服务时并不只是选择协程库还要从其生态中找到结合IO多路复用的协程框架这样可以加快开发速度。
## 小结
这一讲,我们从高并发的应用场景入手,分析了协程出现的背景和实现原理,以及它的应用范围。你会发现,协程融合了多线程与异步化编程的优点,既保证了开发效率,也提升了运行效率。
有限的硬件资源下,多线程通过微观上时间片的切换,实现了同时服务上百个用户的能力。多线程的开发成本虽然低,但内存消耗大,切换次数过多,无法实现高并发。
异步编程方式通过非阻塞系统调用和多路复用,把原本属于内核的请求切换能力,放在用户态的代码中执行。这样,不仅减少了每个请求的内存消耗,也降低了切换请求的成本,最终实现了高并发。然而,异步编程违反了代码的内聚性,还需要业务代码关注并发细节,开发成本很高。
协程参考内核通过CPU寄存器切换线程的方法在用户态代码中实现了协程的切换既降低了切换请求的成本也使得协程中的业务代码不用关注自己何时被挂起何时被执行。相比异步编程中要维护一堆数据结构表示中间状态协程直接用代码表示状态大大提升了开发效率。
在协程中调用的所有API都需要做非阻塞的协程化改造。优秀的协程生态下常用服务都有对应的协程SDK方便业务代码使用。开发高并发服务时与IO多路复用结合的协程框架可以与这些SDK配合自动挂起、切换协程进一步提升开发效率。
协程并不是完全与线程无关首先线程可以帮助协程充分使用多核CPU的计算力其次遇到无法协程化、会导致内核切换的阻塞函数或者计算太密集从而长时间占用CPU的任务还是要放在独立的线程中执行以防止它影响所有协程的执行。
## 思考题
最后,留给你一个思考题,你用过协程吗?觉得它还有什么优点?如果没有在生产环境中使用协程,原因是什么?欢迎你在留言区与我一起探讨。
感谢阅读,如果你觉得这节课有所收获,也欢迎把它分享给你的朋友。