You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

142 lines
9.8 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 39 | 案例分析高性能网络应用框架Netty
Netty是一个高性能网络应用框架应用非常普遍目前在Java领域里Netty基本上成为网络程序的标配了。Netty框架功能丰富也非常复杂今天我们主要分析Netty框架中的线程模型而**线程模型直接影响着网络程序的性能**。
在介绍Netty的线程模型之前我们首先需要把问题搞清楚了解网络编程性能的瓶颈在哪里然后再看Netty的线程模型是如何解决这个问题的。
## 网络编程性能的瓶颈
在[《33 | Thread-Per-Message模式最简单实用的分工方法》](https://time.geekbang.org/column/article/95098)中我们写过一个简单的网络程序echo采用的是阻塞式I/OBIO。BIO模型里所有read()操作和write()操作都会阻塞当前线程的如果客户端已经和服务端建立了一个连接而迟迟不发送数据那么服务端的read()操作会一直阻塞,所以**使用BIO模型一般都会为每个socket分配一个独立的线程**这样就不会因为线程阻塞在一个socket上而影响对其他socket的读写。BIO的线程模型如下图所示每一个socket都对应一个独立的线程为了避免频繁创建、消耗线程可以采用线程池但是socket和线程之间的对应关系并不会变化。
![](https://static001.geekbang.org/resource/image/e7/e2/e712c37ea0483e9dde0d6efe76e687e2.png)
BIO的线程模型
BIO这种线程模型适用于socket连接不是很多的场景但是现在的互联网场景往往需要服务器能够支撑十万甚至百万连接而创建十万甚至上百万个线程显然并不现实所以BIO线程模型无法解决百万连接的问题。如果仔细观察你会发现互联网场景中虽然连接多但是每个连接上的请求并不频繁所以线程大部分时间都在等待I/O就绪。也就是说线程大部分时间都阻塞在那里这完全是浪费如果我们能够解决这个问题那就不需要这么多线程了。
顺着这个思路我们可以将线程模型优化为下图这个样子可以用一个线程来处理多个连接这样线程的利用率就上来了同时所需的线程数量也跟着降下来了。这个思路很好可是使用BIO相关的API是无法实现的这是为什么呢因为BIO相关的socket读写操作都是阻塞式的而一旦调用了阻塞式API在I/O就绪前调用线程会一直阻塞也就无法处理其他的socket连接了。
![](https://static001.geekbang.org/resource/image/ea/1f/eafed0787b82b0b428e1ec0927029f1f.png)
理想的线程模型图
好在Java里还提供了非阻塞式NIOAPI**利用非阻塞式API就能够实现一个线程处理多个连接了**。那具体如何实现呢?现在普遍都是**采用Reactor模式**包括Netty的实现。所以要想理解Netty的实现接下来我们就需要先了解一下Reactor模式。
## Reactor模式
下面是Reactor模式的类结构图其中Handle指的是I/O句柄在Java网络编程里它本质上就是一个网络连接。Event Handler很容易理解就是一个事件处理器其中handle\_event()方法处理I/O事件也就是每个Event Handler处理一个I/O Handleget\_handle()方法可以返回这个I/O的Handle。Synchronous Event Demultiplexer可以理解为操作系统提供的I/O多路复用API例如POSIX标准里的select()以及Linux里面的epoll()。
![](https://static001.geekbang.org/resource/image/a7/40/a7ba3c8d6c49e50d9288baf0c03fa240.png)
Reactor模式类结构图
Reactor模式的核心自然是**Reactor这个类**其中register\_handler()和remove\_handler()这两个方法可以注册和删除一个事件处理器;**handle\_events()方式是核心**也是Reactor模式的发动机这个方法的核心逻辑如下首先通过同步事件多路选择器提供的select()方法监听网络事件当有网络事件就绪后就遍历事件处理器来处理该网络事件。由于网络事件是源源不断的所以在主程序中启动Reactor模式需要以 `while(true){}` 的方式调用handle\_events()方法。
```
void Reactor::handle_events(){
//通过同步事件多路选择器提供的
//select()方法监听网络事件
select(handlers);
//处理网络事件
for(h in handlers){
h.handle_event();
}
}
// 在主程序中启动事件循环
while (true) {
handle_events();
```
## Netty中的线程模型
Netty的实现虽然参考了Reactor模式但是并没有完全照搬**Netty中最核心的概念是事件循环EventLoop**其实也就是Reactor模式中的Reactor**负责监听网络事件并调用事件处理器进行处理**。在4.x版本的Netty中网络连接和EventLoop是稳定的多对1关系而EventLoop和Java线程是1对1关系这里的稳定指的是关系一旦确定就不再发生变化。也就是说一个网络连接只会对应唯一的一个EventLoop而一个EventLoop也只会对应到一个Java线程所以**一个网络连接只会对应到一个Java线程**。
一个网络连接对应到一个Java线程上有什么好处呢最大的好处就是对于一个网络连接的事件处理是单线程的这样就**避免了各种并发问题**。
Netty中的线程模型可以参考下图这个图和前面我们提到的理想的线程模型图非常相似核心目标都是用一个线程处理多个网络连接。
![](https://static001.geekbang.org/resource/image/03/04/034756f1d76bb3af09e125de9f3c2f04.png)
Netty中的线程模型
Netty中还有一个核心概念是**EventLoopGroup**顾名思义一个EventLoopGroup由一组EventLoop组成。实际使用中一般都会创建两个EventLoopGroup一个称为bossGroup一个称为workerGroup。为什么会有两个EventLoopGroup呢
这个和socket处理网络请求的机制有关socket处理TCP网络连接请求是在一个独立的socket中每当有一个TCP连接成功建立都会创建一个新的socket之后对TCP连接的读写都是由新创建处理的socket完成的。也就是说**处理TCP连接请求和读写请求是通过两个不同的socket完成的**。上面我们在讨论网络请求的时候,为了简化模型,只是讨论了读写请求,而没有讨论连接请求。
**在Netty中bossGroup就用来处理连接请求的而workerGroup是用来处理读写请求的**。bossGroup处理完连接请求后会将这个连接提交给workerGroup来处理 workerGroup里面有多个EventLoop那新的连接会交给哪个EventLoop来处理呢这就需要一个负载均衡算法Netty中目前使用的是**轮询算法**。
下面我们用Netty重新实现以下echo程序的服务端近距离感受一下Netty。
## 用Netty实现Echo程序服务端
下面的示例代码基于Netty实现了echo程序服务端首先创建了一个事件处理器等同于Reactor模式中的事件处理器然后创建了bossGroup和workerGroup再之后创建并初始化了ServerBootstrap代码还是很简单的不过有两个地方需要注意一下。
第一个如果NettybossGroup只监听一个端口那bossGroup只需要1个EventLoop就可以了多了纯属浪费。
第二个默认情况下Netty会创建“2\*CPU核数”个EventLoop由于网络连接与EventLoop有稳定的关系所以事件处理器在处理网络事件的时候是不能有阻塞操作的否则很容易导致请求大面积超时。如果实在无法避免使用阻塞操作那可以通过线程池来异步处理。
```
//事件处理器
final EchoServerHandler serverHandler
= new EchoServerHandler();
//boss线程组
EventLoopGroup bossGroup
= new NioEventLoopGroup(1);
//worker线程组
EventLoopGroup workerGroup
= new NioEventLoopGroup();
try {
ServerBootstrap b = new ServerBootstrap();
b.group(bossGroup, workerGroup)
.channel(NioServerSocketChannel.class)
.childHandler(new ChannelInitializer<SocketChannel>() {
@Override
public void initChannel(SocketChannel ch){
ch.pipeline().addLast(serverHandler);
}
});
//bind服务端端口
ChannelFuture f = b.bind(9090).sync();
f.channel().closeFuture().sync();
} finally {
//终止工作线程组
workerGroup.shutdownGracefully();
//终止boss线程组
bossGroup.shutdownGracefully();
}
//socket连接处理器
class EchoServerHandler extends
ChannelInboundHandlerAdapter {
//处理读事件
@Override
public void channelRead(
ChannelHandlerContext ctx, Object msg){
ctx.write(msg);
}
//处理读完成事件
@Override
public void channelReadComplete(
ChannelHandlerContext ctx){
ctx.flush();
}
//处理异常事件
@Override
public void exceptionCaught(
ChannelHandlerContext ctx, Throwable cause) {
cause.printStackTrace();
ctx.close();
}
}
```
## 总结
Netty是一个款优秀的网络编程框架性能非常好为了实现高性能的目标Netty做了很多优化例如优化了ByteBuffer、支持零拷贝等等和并发编程相关的就是它的线程模型了。Netty的线程模型设计得很精巧每个网络连接都关联到了一个线程上这样做的好处是对于一个网络连接读写操作都是单线程执行的从而避免了并发程序的各种问题。
你要想深入理解Netty的线程模型还需要对网络相关知识有一定的理解关于Java IO的演进过程你可以参考[Scalable IO in Java](http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf)至于TCP/IP网络编程的知识你可以参考韩国尹圣雨写的经典教程——《TCP/IP网络编程》。
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。