You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

228 lines
11 KiB
Markdown

2 years ago
# 20 | 大名⿍⿍的select看我如何同时感知多个I/O事件
你好我是盛延敏这里是网络编程实战的第20讲欢迎回来。
这一讲是性能篇的第一讲。在性能篇里我们将把注意力放到如何设计高并发高性能的网络服务器程序上。我希望通过这一模块的学习让你能够掌握多路复用、异步I/O、多线程等知识从而可以写出支持并发10K以上的高性能网络服务器程序。
还等什么呢?让我们开始吧。
## 什么是I/O多路复用
在[第11讲](https://time.geekbang.org/column/article/126126)中,我们设计了这样一个应用程序,该程序从标准输入接收数据输入,然后通过套接字发送出去,同时,该程序也通过套接字接收对方发送的数据流。
我们可以使用fgets方法等待标准输入但是一旦这样做就没有办法在套接字有数据的时候读出数据我们也可以使用read方法等待套接字有数据返回但是这样做也没有办法在标准输入有数据的情况下读入数据并发送给对方。
I/O多路复用的设计初衷就是解决这样的场景。我们可以把标准输入、套接字等都看做I/O的一路多路复用的意思就是在任何一路I/O有“事件”发生的情况下通知应用程序去处理相应的I/O事件这样我们的程序就变成了“多面手”在同一时刻仿佛可以处理多个I/O事件。
像刚才的例子使用I/O复用以后如果标准输入有数据立即从标准输入读入数据通过套接字发送出去如果套接字有数据可以读立即可以读出数据。
select函数就是这样一种常见的I/O多路复用技术我们将在后面继续讲解其他的多路复用技术。使用select函数通知内核挂起进程当一个或多个I/O事件发生后控制权返还给应用程序由应用程序进行I/O事件的处理。
这些I/O事件的类型非常多比如
* 标准输入文件描述符准备好可以读。
* 监听套接字准备好,新的连接已经建立成功。
* 已连接套接字准备好可以写。
* 如果一个I/O事件等待超过了10秒发生了超时事件。
## select函数的使用方法
select函数的使用方法有点复杂我们先看一下它的声明
```
int select(int maxfd, fd_set *readset, fd_set *writeset, fd_set *exceptset, const struct timeval *timeout);
返回若有就绪描述符则为其数目若超时则为0若出错则为-1
```
在这个函数中maxfd表示的是待测试的描述符基数它的值是待测试的最大描述符加1。比如现在的select待测试的描述符集合是{0,1,4}那么maxfd就是5为啥是5而不是4呢? 我会在下面进行解释。
紧接着的是三个描述符集合分别是读描述符集合readset、写描述符集合writeset和异常描述符集合exceptset这三个分别通知内核在哪些描述符上检测数据可以读可以写和有异常发生。
那么如何设置这些描述符集合呢?以下的宏可以帮助到我们。
```
void FD_ZERO(fd_set *fdset);      
void FD_SET(int fd, fd_set *fdset);  
void FD_CLR(int fd, fd_set *fdset);   
int FD_ISSET(int fd, fd_set *fdset);
```
如果你刚刚入门理解这些宏可能有些困难。没有关系我们可以这样想象下面一个向量代表了一个描述符集合其中这个向量的每个元素都是二进制数中的0或者1。
```
a[maxfd-1], ..., a[1], a[0]
```
我们按照这样的思路来理解这些宏:
* FD\_ZERO用来将这个向量的所有元素都设置成0
* FD\_SET用来把对应套接字fd的元素a\[fd\]设置成1
* FD\_CLR用来把对应套接字fd的元素a\[fd\]设置成0
* FD\_ISSET对这个向量进行检测判断出对应套接字的元素a\[fd\]是0还是1。
其中0代表不需要处理1代表需要处理。
怎么样,是不是感觉豁然开朗了?
实际上很多系统是用一个整型数组来表示一个描述字集合的一个32位的整型数可以表示32个描述字例如第一个整型数表示0-31描述字第二个整型数可以表示32-63描述字以此类推。
这个时候再来理解为什么描述字集合{0,1,4}对应的maxfd是5而不是4就比较方便了。
因为这个向量对应的是下面这样的:
```
a[4],a[3],a[2],a[1],a[0]
```
待测试的描述符个数显然是5 而不是4。
三个描述符集合中的每一个都可以设置成空,这样就表示不需要内核进行相关的检测。
最后一个参数是timeval结构体时间
```
struct timeval {
long tv_sec; /* seconds */
long tv_usec; /* microseconds */
};
```
这个参数设置成不同的值,会有不同的可能:
第一个可能是设置成空(NULL)表示如果没有I/O事件发生则select一直等待下去。
第二个可能是设置一个非零的值这个表示等待固定的一段时间后从select阻塞调用中返回这在[第12讲](https://time.geekbang.org/column/article/127900)超时的例子里曾经使用过。
第三个可能是将tv\_sec和tv\_usec都设置成0表示根本不等待检测完毕立即返回。这种情况使用得比较少。
## 程序例子
下面是一个具体的程序例子我们通过这个例子来理解select函数。
```
int main(int argc, char **argv) {
if (argc != 2) {
error(1, 0, "usage: select01 <IPaddress>");
}
int socket_fd = tcp_client(argv[1], SERV_PORT);
char recv_line[MAXLINE], send_line[MAXLINE];
int n;
fd_set readmask;
fd_set allreads;
FD_ZERO(&allreads);
FD_SET(0, &allreads);
FD_SET(socket_fd, &allreads);
for (;;) {
readmask = allreads;
int rc = select(socket_fd + 1, &readmask, NULL, NULL, NULL);
if (rc <= 0) {
error(1, errno, "select failed");
}
if (FD_ISSET(socket_fd, &readmask)) {
n = read(socket_fd, recv_line, MAXLINE);
if (n < 0) {
error(1, errno, "read error");
} else if (n == 0) {
error(1, 0, "server terminated \n");
}
recv_line[n] = 0;
fputs(recv_line, stdout);
fputs("\n", stdout);
}
if (FD_ISSET(STDIN_FILENO, &readmask)) {
if (fgets(send_line, MAXLINE, stdin) != NULL) {
int i = strlen(send_line);
if (send_line[i - 1] == '\n') {
send_line[i - 1] = 0;
}
printf("now sending %s\n", send_line);
size_t rt = write(socket_fd, send_line, strlen(send_line));
if (rt < 0) {
error(1, errno, "write failed ");
}
printf("send bytes: %zu \n", rt);
}
}
}
}
```
程序的12行通过FD\_ZERO初始化了一个描述符集合这个描述符读集合是空的
![](https://static001.geekbang.org/resource/image/ce/68/cea07eee264c1abf69c04aacfae56c68.png?wh=628*192)
接下来程序的第13和14行分别使用FD\_SET将描述符0即标准输入以及连接套接字描述符3设置为待检测
![](https://static001.geekbang.org/resource/image/71/f2/714f4fb84ab9afb39e51f6bcfc18def2.png?wh=640*200)
接下来的16-51行是循环检测这里我们没有阻塞在fgets或read调用而是通过select来检测套接字描述字有数据可读或者标准输入有数据可读。比如当用户通过标准输入使得标准输入描述符可读时返回的readmask的值为
![](https://static001.geekbang.org/resource/image/b9/bd/b90d1df438847d5e11d80485a23817bd.png?wh=632*194)
这个时候select调用返回可以使用FD\_ISSET来判断哪个描述符准备好可读了。如上图所示这个时候是标准输入可读37-51行程序读入后发送给对端。
如果是连接描述字准备好可读了第24行判断为真使用read将套接字数据读出。
我们需要注意的是这个程序的17-18行非常重要初学者很容易在这里掉坑里去。
第17行是每次测试完之后重新设置待测试的描述符集合。你可以看到上面的例子在select测试之前的数据是{0,3}select测试之后就变成了{0}。
这是因为select调用每次完成测试之后内核都会修改描述符集合通过修改完的描述符集合来和应用程序交互应用程序使用FD\_ISSET来对每个描述符进行判断从而知道什么样的事件发生。
第18行则是使用socket\_fd+1来表示待测试的描述符基数。切记需要+1。
## 套接字描述符就绪条件
当我们说select测试返回某个套接字准备好可读表示什么样的事件发生呢
第一种情况是套接字接收缓冲区有数据可以读如果我们使用read函数去执行读操作肯定不会被阻塞而是会直接读到这部分数据。
第二种情况是对方发送了FIN使用read函数执行读操作不会被阻塞直接返回0。
第三种情况是针对一个监听套接字而言的有已经完成的连接建立此时使用accept函数去执行不会阻塞直接返回已经完成的连接。
第四种情况是套接字有错误待处理使用read函数去执行读操作不阻塞且返回-1。
总结成一句话就是内核通知我们套接字有数据可以读了使用read函数不会阻塞。
不知道你是不是和我一样,刚开始理解某个套接字可写的时候,会有一个错觉,总是从应用程序角度出发去理解套接字可写,我开始是这样想的,当应用程序完成相应的计算,有数据准备发送给对端了,可以往套接字写,对应的就是套接字可写。
其实这个理解是非常不正确的select检测套接字可写**完全是基于套接字本身的特性来说**的,具体来说有以下几种情况。
第一种是套接字发送缓冲区足够大如果我们使用阻塞套接字进行write操作将不会被阻塞直接返回。
第二种是连接的写半边已经关闭如果继续进行写操作将会产生SIGPIPE信号。
第三种是套接字上有错误待处理使用write函数去执行写操作不阻塞且返回-1。
总结成一句话就是内核通知我们套接字可以往里写了使用write函数就不会阻塞。
## 总结
今天我讲了select函数的使用。select函数提供了最基本的I/O多路复用方法在使用select时我们需要建立两个重要的认识
* 描述符基数是当前最大描述符+1
* 每次select调用完成之后记得要重置待测试集合。
## 思考题
和往常一样,给你布置两道思考题:
第一道, select可以对诸如UNIX管道(pipe)这样的描述字进行检测么?如果可以,检测的就绪条件是什么呢?
第二道根据我们前面的描述一个描述符集合哪些描述符被设置为1需要进行检测是完全可以知道的你认为select函数里一定需要传入描述字基数这个值么请你分析一下这样设计的目的又是什么呢
欢迎你在评论区写下你的思考,也欢迎把这篇文章分享给你的朋友或者同事,一起交流一下。