gitbook/后端技术面试 38 讲/docs/184379.md
2022-09-03 22:05:03 +08:00

13 KiB
Raw Blame History

18 | 反应式编程框架设计:如何使程序调用不阻塞等待,立即响应?

我们在专栏[第1篇](https://time.geekbang.org/column/article/166581)就讨论了为什么在高并发的情况下,程序会崩溃。主要原因是,在高并发的情况下,有大量用户请求需要程序计算处理,而目前的处理方式是,为每个用户请求分配一个线程,当程序内部因为访问数据库等原因造成线程阻塞时,线程无法释放去处理其他请求,这样就会造成请求堆积,不断消耗资源,最终导致程序崩溃。

这是传统的Web应用程序运行期的线程特性。对于一个高并发的应用系统来说总是同时有很多个用户请求到达系统的Web容器。Web容器为每个请求分配一个线程进行处理线程在处理过程中如果遇到访问数据库或者远程服务等操作就会进入阻塞状态这个时候如果数据库或者远程服务响应延迟就会出现程序内的线程无法释放的情况而外部的请求不断进来导致计算机资源被快速消耗最终程序崩溃。

那么有没有不阻塞线程的编程方法呢?

反应式编程

答案就是反应式编程。反应式编程本质上是一种异步编程方案在多线程协程、异步方法调用、异步I/O访问等技术基础之上提供了一整套与异步调用相匹配的编程模型从而实现程序调用非阻塞、即时响应等特性即开发出一个反应式的系统以应对编程领域越来越高的并发处理需求。

人们还提出了一个反应式宣言,认为反应式系统应该具备如下特质:

即时响应,应用的调用者可以即时得到响应,无需等到整个应用程序执行完毕。也就是说应用调用是非阻塞的。

回弹性,当应用程序部分功能失效的时候,应用系统本身能够进行自我修复,保证正常运行,保证响应,不会出现系统崩溃和宕机的情况。

弹性,系统能够对应用负载压力做出响应,能够自动伸缩以适应应用负载压力,根据压力自动调整自身的处理能力,或者根据自身的处理能力,调整进入系统中的访问请求数量。

消息驱动,功能模块之间,服务之间,通过消息进行驱动,完成服务的流程。

目前主流的反应式编程框架有RxJava、Reactor等它们的主要特点是基于观察者设计模式的异步编程方案,编程模型采用函数式编程。

观察者模式和函数式编程有自己的优势但是反应式编程并不是必须用观察者模式和函数式编程。Flower就是一个纯消息驱动完全异步支持命令式编程的反应式编程框架。

下面我们就看看Flower如何实现异步无阻塞的调用以及Flower这个框架设计使用了什么样的设计原则与模式。

反应式编程框架Flower的基本原理

一个使用Flower框架开发的典型Web应用的线程特性如下图所示

当并发用户到达应用服务器的时候Web容器线程不需要执行应用程序代码它只是将用户的HTTP请求变为请求对象将请求对象异步交给Flower框架的Service去处理自身立刻就返回。因为容器线程不做太多的工作所以只需极少的容器线程就可以满足高并发的用户请求用户的请求不会被阻塞不会因为容器线程不够而无法处理。相比传统的阻塞式编程Web容器线程要完成全部的请求处理操作直到返回响应结果才能释放线程使用Flower框架只需要极少的容器线程就可以处理较的并发用户请求,而且容器线程不会阻塞。

用户请求交给基于Flower框架开发的业务Service对象以后Service之间依然是使用异步消息通讯的方式进行调用不会直接进行阻塞式的调用。一个Service完成业务逻辑处理计算以后会返回一个处理结果这个结果以消息的方式异步发送给它的下一个Service。

传统编程模型的Service之间如果进行调用如我们在专栏第一篇讨论的那样被调用的Service在返回之前调用的Service方法只能阻塞等待。而Flower的Service之间使用了AKKA Actor进行消息通信调用者的Service发送调用消息后不需要等待被调用者返回结果就可以处理自己的下一个消息了。事实上这些Service可以复用同一个线程去处理自己的消息也就是说只需要有限的几个线程就可以完成大量的Service处理和消息传输这些线程不会阻塞等待。

我们刚才提到通常Web应用主要的线程阻塞是因为数据库的访问导致的线程阻塞。Flower支持异步数据库驱动用户请求数据库的时候将请求提交给异步数据库驱动立刻就返回不会阻塞当前线程异步数据库访问连接远程的数据库进行真正的数据库操作得到结果以后将结果以异步回调的方式发送给Flower的Service进行进一步的处理这个时候依然不会有线程被阻塞。

也就是说使用Flower开发的系统在一个典型的Web应用中几乎没有任何地方会被阻塞所有的线程都可以被不断地复用有限的线程就可以完成大量的并发用户请求,从而大大地提高了系统的吞吐能力和响应时间,同时,由于线程不会被阻塞,应用就不会因为并发量太大或者数据库处理缓慢而宕机,从而提高了系统的可用性。

Flower框架实现异步无阻塞一方面是利用了Web容器的异步特性主要是Servlet3.0以后提供的AsyncContext快速释放容器线程另一方面是利用了异步的数据库驱动以及异步的网络通信主要是HttpAsyncClient等异步通信组件。而Flower框架内核心的应用代码之间的异步无阻塞调用则是利用了Akka 的Actor模型实现。

Akka Actor的异步消息驱动实现如下

一个Actor向另一个Actor进行通讯的时候当前Actor就是一个消息的发送者sender当它想要向另一个Actor进行通讯的时候就需要获得另一个Actor的ActorRef也就是一个引用通过引用进行消息通信。而ActorRef收到消息以后会将这个消息放入到目标Actor的Mailbox里面去然后就立即返回了。

也就是说一个Actor向另一个Actor发送消息的时候不需要另一个Actor去真正地处理这个消息只需要将消息发送到目标Actor的Mailbox里面就可以了。自己不会被阻塞可以继续执行自己的操作而目标Actor检查自己的Mailbox中是否有消息如果有消息Actor则会在从Mailbox里面去获取消息对消息进行异步的处理而所有的Actor会共享线程这些线程不会有任何的阻塞。

反应式编程框架Flower的设计方法

但是直接使用Actor进行编程有很多不便Flower框架对Actor进行了封装开发者只需要编写一些细粒度的Service这些Service会被包装在Actor里面进行异步通信。

Flower Service例子如下

public class ServiceA implements Service<Message2> {
  @Override
  public Object process(Message2 message) {
    return message.getAge() + 1;
  }
}

每个Service都需要实现框架的Service接口的process方法process方法的输入参数就是前一个Service process方法的返回值这样只需要将Service编排成一个流程Service的返回值就会变成Actor的一个消息被发送给下一个Service从而实现Service的异步通信。

Service的流程编排有两种方式一种方式是编程实现如下

getServiceFlow().buildFlow("ServiceA", "ServiceB");


表示ServiceA的返回值将作为消息发送给ServiceB成为ServiceB的输入值这样两个Service就可以合作完成一些更复杂的业务逻辑。

Flower还支持可视化的Service流程编排像下面这张图一样编辑流程定义文件就可以开发一个异步业务处理流程。

那么这个Flower框架是如何实现的呢

Flower框架的设计也是基于前面专栏讨论过的依赖倒置原则。所有应用开发者实现的Service类都需要包装在Actor里面进行异步调用但是Actor不会依赖开发者实现的Service类开发者也不会依赖Actor类他们共同依赖一个Service接口这个接口是框架提供的如上面例子所示。

Actor与Service的依赖倒置关系如下图所示

每个Actor都依赖一个Service接口而具体的Service实现类比如MyService则实现这个Service接口。在运行期实例化Actor的时候这个接口被注入具体的Service实现类比如MyService。在Flower中调用MyService对象其实就是给包装MyService对象的Actor发消息Actor收到消息执行自己的onReceive方法在这个方法里Actor调用MyService的process方法并将onReceive收到的Message对象当做process的输入参数传入。

process处理完成后返回一个Object对象。Actor会根据编排好的流程获取MyService在流程中的下一个Service对应的Actor即nextServiceActor将process返回的Object对象当做消息发送给这个nextServiceActor。这样Service之间就根据编排好的流程异步、无阻塞地调用执行起来了。

反应式编程框架Flower的落地效果

Flower框架在部分项目中落地应用应用效果较为显著一方面Flower可以显著提高系统的性能。这是某个C#开发的系统使用Flower重构后的TPS性能比较使用Flower开发的系统TPS差不多是原来C#系统的两倍。

另一方面Flower对系统可用性也有较大提升目前常见互联网应用架构如下图

用户请求通过网关服务器调用微服务完成处理那么当有某个微服务连接的数据库查询执行较慢时如图中服务1那么按照传统的线程阻塞模型就会导致服务1的线程都被阻塞在这个慢查询的数据库操作上。同样的网关线程也会阻塞在调用这个延迟比较厉害的服务1上。

最终的效果就是网关所有的线程都被阻塞即使是不调用服务1的用户请求也无法处理最后整个系统失去响应应用宕机。使用阻塞式编程实际的压测效果如下当服务1响应延迟出错率大幅飙升的时候通过网关调用正常的服务2的出错率也非常高。

使用Flower开发的网关实际压测效果如下同样服务1响应延迟出错率极高的情况下通过Flower网关调用服务2完全不受影响。

小结

事实上Flower不仅是一个反应式Web编程框架还是反应式的微服务框架。也就是说Flower的Service可以远程部署到一个Service容器里面就像我们现在常用的微服务架构一样。Flower会提供一个独立的Flower容器用于启动一些Service这些Service在启动了以后会向注册中心进行注册而且应用程序可以将这些分布式的Service进行流程编排得到一个分布式非阻塞的微服务系统。整体架构和主流的微服务架构很像主要的区别就是Flower的服务是异步的通过流程编排的方式进行服务调用而不是通过接口依赖的方式进行调用。

你可以点击这里进入Flower框架的源代码地址欢迎你参与Flower开发也欢迎将Flower应用到你的系统开发中。你对Flower有什么疑问也欢迎与我交流。

思考题

反应式编程虽然能带来性能和可用性方面的提升,但是也带来一些问题,你觉得反应式编程可能存在的问题有哪些?应该如何应对?你是否愿意在工作实践中尝试反应式编程?

欢迎你在评论区写下你的思考,也欢迎把这篇文章分享给你的朋友或者同事,一起交流。