You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

490 lines
30 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 12 | Redis真的是单线程吗
你好我是蒋德钧。今天这节课我们来聊聊Redis的执行模型。
所谓的执行模型就是指Redis运行时使用的进程、子进程和线程的个数以及它们各自负责的工作任务。
你在实际使用Redis的时候可能经常会听到类似“Redis是单线程”“Redis的主IO线程”“Redis包含多线程”等不同说法。我也听到不少同学提出困惑和疑问**Redis到底是不是一个单线程的程序**
其实彻底理解这个问题有助于指导我们保持Redis高性能、低延迟的特性。如果说Redis就是单线程程序那么我们就需要避免所有容易引起线程阻塞的操作而如果说Redis不只是单线程还有其他线程在工作那么我们就需要了解多线程各自负责什么任务负责请求解析和数据读写的线程有几个有哪些操作是后台线程在完成而不会影响请求解析和数据读写的。
所以今天这节课我就从Redis server启动后运行的进程开始带你一边学习Redis源码中子进程和线程的创建方式一边掌握Redis server运行时涉及到的进程、子进程和线程情况。
下面我们先来看Redis server启动时的进程运行。
## 从shell命令执行到Redis进程创建
我们在启动Redis实例时可以在shell命令行环境中执行redis-server这个可执行文件如下所示
```
./redis-server /etc/redis/redis.conf
```
shell运行这个命令后它实际会调用fork系统调用函数来新建一个进程。因为shell本身是一个进程所以这个通过fork新创建的进程就被称为是shell进程的子进程而shell进程被称为父进程。关于fork函数的具体用法我一会儿还会给你具体介绍。
紧接着shell进程会调用execve系统调用函数将子进程执行的主体替换成Redis的可执行文件。而Redis可执行文件的入口函数就是main函数这样一来子进程就会开始执行Redis server的main函数了。
下面的代码显示了execve系统调用函数原型。其中filename是要运行的程序的文件名argv\[\]和envp\[\]分别是要运行程序的参数和环境变量。
```
int execve(const char *filename, char *const argv[], char *const envp[]))
```
下图显示了从shell执行命令到创建Redis进程的过程你可以看下。
![](https://static001.geekbang.org/resource/image/d7/b5/d7ec5ef2698cyyd1973a6afbb0c7dfb5.jpg?wh=2000x510)
当我们用刚才介绍的shell命令运行Redis server后我们会看到Redis server启动后的日志输出会打印到终端屏幕上如下所示
```
37807:M 19 Aug 2021 07:29:36.372 # Server initialized
37807:M 19 Aug 2021 07:29:36.372 * DB loaded from disk: 0.000 seconds
37807:M 19 Aug 2021 07:29:36.372 * Ready to accept connections
```
这是因为shell进程调用fork函数创建的子进程会从父进程中继承一些属性比如父进程打开的文件描述符。对于shell进程来说它打开的文件描述符包括0和1这两个描述符分别代表了标准输入和标准输出。而execve函数只是把子进程的执行内容替换成Redis可执行文件子进程从shell父进程继承到的标准输入和标准输出保持不变。
所以Redis运行时通过serverLog函数打印的日志信息就会默认输出到终端屏幕上了也就是shell进程的标准输出。
而一旦Redis进程创建开始运行后它就会从main函数开始执行。我们在[第8讲](https://time.geekbang.org/column/article/406556)中已经学习了main函数的主要执行过程所以我们会发现它会调用不同的函数来执行相关功能。比如main函数调用initServerConfig函数初始化Redis server的运行参数调用loadServerConfig函数解析配置文件参数。当main函数调用这些函数时这些函数仍然是由原来的进程执行的。所以在这种情况下Redis仍然是单个进程在运行。
不过在main函数完成参数解析后会根据两个配置参数daemonize和supervised来设置变量background的值。它们的含义分别是
* 参数daemonize表示是否要设置Redis以守护进程方式运行
* 参数supervised表示是否使用upstart或是systemd这两种守护进程的管理程序来管理Redis。
那么我们来进一步了解下守护进程。守护进程是在系统后台运行的进程独立于shell终端不再需要用户在shell中进行输入了。一般来说守护进程用于执行周期性任务或是等待相应事件发生再进行处理。Redis server本身就是在启动后等待客户端输入再进行处理。所以对于Redis这类服务器程序来说我们通常会让它以守护进程方式运行。
好了如果设置了Redis以守护进程方式执行那么守护进程具体是怎么创建的呢这就和main函数调用的daemonize函数相关了。daemonize函数就是用来将Redis进程转换为守护进程来运行。
下面的代码显示了main函数根据变量background值来判断是否执行daemonize函数的逻辑你可以看下。
```
//如果配置参数daemonize为1supervised值为0那么设置background值为1否则设置其为0。
int main(int argc, char **argv) {
int background = server.daemonize && !server.supervised;
//如果background值为1调用daemonize函数。
if (background) daemonize();
}
```
也就是说如果background的值为1就表示Redis被设置为以守护进程方式运行因此main函数就会调用daemonize函数。
那么接下来我们就来学习下daemonize函数是如何将Redis转为守护进程运行的。
## 从daemonize函数的执行学习守护进程的创建
我们首先来看daemonize函数的部分执行内容如下所示。我们可以看到daemonize函数调用了fork函数并根据fork函数返回值有不同的分支代码。
```
void daemonize(void) {
if (fork() != 0) exit(0); //fork成功执行或失败则父进程退出
setsid(); //创建新的session
}
```
从刚才的介绍中我们已经知道当我们在一个程序的函数中调用fork函数时fork函数会创建一个子进程。而原本这个程序对应的进程就称为这个子进程的父进程。那么fork函数执行后的不同分支和父、子进程是什么关系呢这就和fork函数的使用有关了。
实际上fork函数的使用是比较有意思的我们可以根据fork函数的不同返回值来编写相应的分支代码这些分支代码就对应了父进程和子进程各自要执行的逻辑。
为了便于你理解我给你举个例子。我写了一段示例代码这段代码的main函数会调用fork函数并进一步根据fork函数的返回值是小于0、等于0还是大于0来执行不同的分支。注意fork函数的不同返回值其实代表了不同的含义具体来说
* 当返回值小于0时此时表明fork函数执行有误
* 当返回值等于0时此时返回值对应的代码分支就会在子进程中运行
* 当返回值大于0时此时返回值对应的代码分支仍然会在父进程中运行。
这段示例代码如下:
```
#include <stdio.h>
#include <unistd.h>
int main(int argc, char *argv[]) {
printf("hello main\n");
int rv = fork(); //fork函数的返回值
//返回值小于0表示fork执行错误
if (rv < 0) {
fprintf(stderr, "fork failed\n");
}
//返回值等于0对应子进程执行
else if (rv == 0) {
printf("I am child process %d\n", getpid());
}
//返回值大于0对应父进程执行
else {
printf("I am parent process of (%d), %d\n", rc, getpid());
}
return 0;
}
```
在这段代码中我根据fork函数的返回值分别写了三个分支代码其中返回值等于0对应的代码分支是子进程执行的代码。子进程会打印字符串“I am child process”并打印子进程的进程号。而返回值大于0对应的代码分支是父进程的代码。父进程会打印字符串“I am parent process of”并打印它所创建的子进程进程号和它自身的进程号。
那么如果你把这段代码编译后执行你可以看到类似如下的结果父进程打印了它的进程号62794而子进程则打印了它的进程号62795。这表明刚才示例代码中的不同分支的确是由父、子进程来执行的。这也就是说我们可以在fork函数执行后使用不同分支让父、子进程执行不同内容。
```
hello main
I am parent process of (62795), 62794
I am child process 62795
```
好了了解了fork函数创建子进程的知识后我们再来看下刚才介绍的daemonize函数。
现在我们已经知道daemonize函数调用fork函数后可以根据fork函数返回值设置不同代码分支对应父、子进程执行内容。其实daemonize函数也的确设置了两个代码分支。
* **分支一**
这个分支对应fork函数返回值不为0表示fork函数成功执行后的父进程执行逻辑或是fork函数执行失败的执行逻辑。此时父进程会调用exit(0)函数退出。也就是说如果fork函数成功执行父进程就退出了。当然如果fork函数执行失败了那么子进程也没有能成功创建父进程也就退出执行了。你可以看下下面的代码展示了这个分支。
```
void daemonize(void) {
if (fork() != 0) exit(0); //fork成功执行或失败则父进程退出
}
```
* **分支二**
这个分支对应fork函数返回值为0为子进程的执行逻辑。子进程首先会调用setsid函数创建一个新的会话。
然后子进程会用open函数打开/dev/null设备并把它的标准输入、标准输出和标准错误输出重新定向到/dev/null设备。因为守护进程是在后台运行它的输入输出是独立于shell终端的。所以为了让Redis能以守护进程方式运行这几步操作的目的就是把当前子进程的输入、输出由原来的shell终端转向/dev/null设备这样一来就不再依赖于shell终端了满足了守护进程的要求。
我把daemonize函数的代码放在这里你可以看下。
```
void daemonize(void) {
setsid(); //为子进程创建新的session
//将子进程的标准输入、标准输出、标准错误输出重定向到/dev/null中
if ((fd = open("/dev/null", O_RDWR, 0)) != -1) {
dup2(fd, STDIN_FILENO);
dup2(fd, STDOUT_FILENO);
dup2(fd, STDERR_FILENO);
if (fd > STDERR_FILENO) close(fd);
}
}
```
好了到这里我们就了解了Redis的main函数会根据配置参数daemonize和supervised来判断是否以守护进程方式运行Redis。
那么一旦Redis要以守护进程方式运行main函数会调用daemonize函数。daemonize函数会进一步调用fork函数创建子进程并根据返回值分别执行父进程和子进程的代码分支。其中父进程会退出。而子进程会代替原来的父进程继续执行main函数的代码。
下面的图展示了daemonize函数调用fork函数后的两个分支的执行逻辑你可以再回顾下。
![](https://static001.geekbang.org/resource/image/b9/11/b9fa1ea3962e18be5ca9973a2feeb111.jpg?wh=2000x947)
事实上Redis server启动后无论是否以守护进程形式运行都还是一个进程在运行。对于一个进程来说如果该进程启动后没有创建新的线程那么这个进程的工作任务默认就是由一个线程来执行的而这个线程我一般也称它为主线程。
对于Redis来说它的主要工作包括接收客户端请求、解析请求和进行数据读写等操作都没有创建新线程来执行所以Redis主要工作的确是由单线程来执行的这也是我们常说Redis是单线程程序的原因。因为Redis主要工作都是IO读写操作所以我也会把这个单线程称为主IO线程。
但其实Redis 在3.0版本后除了主IO线程外的确还会启动一些后台线程来处理部分任务从而避免这些任务对主IO线程的影响。那么这些后台线程是在哪里启动的又是如何执行的呢
这就和Redis的[bio.c](https://github.com/redis/redis/tree/5.0/src/bio.c)文件相关了。接下来我们就来从这个文件中学习下Redis的后台线程。
## 从bio.c文件学习Redis的后台线程
我们先来看下main函数在初始化过程最后调用的InitServerLast函数。InitServerLast函数的作用是进一步调用bioInit函数来创建后台线程让Redis把部分任务交给后台线程处理。这个过程如下所示。
```
void InitServerLast() {
bioInit();
}
```
bioInit函数是在[bio.c](https://github.com/redis/redis/tree/5.0/src/bio.c)文件中实现的它的主要作用调用pthread\_create函数创建多个后台线程。不过在具体了解bioInit函数之前我们先来看下bio.c文件中定义的主要数组这也是在bioInit函数中要进行初始化的。
bio.c文件针对要创建的线程定义了pthread\_t类型的数组bio\_threads用来保存创建的线程描述符。此外bio.c文件还创建了一个保存互斥锁的数组bio\_mutex以及两个保存条件变量的数组bio\_newjob\_cond和bio\_step\_cond。以下代码展示了这些数组的创建逻辑你可以看下。
```
//保存线程描述符的数组
static pthread_t bio_threads[BIO_NUM_OPS];
//保存互斥锁的数组
static pthread_mutex_t bio_mutex[BIO_NUM_OPS];
//保存条件变量的两个数组
static pthread_cond_t bio_newjob_cond[BIO_NUM_OPS];
static pthread_cond_t bio_step_cond[BIO_NUM_OPS];
```
从中你可以注意到这些数组的大小都是宏定义BIO\_NUM\_OPS这个宏定义是在[bio.h](https://github.com/redis/redis/tree/5.0/src/bio.h)文件中定义的默认值为3。
同时在bio.h文件中你还可以看到另外三个宏定义分别是BIO\_CLOSE\_FILE、BIO\_AOF\_FSYNC和BIO\_LAZY\_FREE。它们的代码如下所示
```
#define BIO_CLOSE_FILE 0 /* Deferred close(2) syscall. */
#define BIO_AOF_FSYNC 1 /* Deferred AOF fsync. */
#define BIO_LAZY_FREE 2 /* Deferred objects freeing. */
#define BIO_NUM_OPS 3
```
其中BIO\_NUM\_OPS表示的是Redis后台任务的类型有三种。而BIO\_CLOSE\_FILE、BIO\_AOF\_FSYNC和BIO\_LAZY\_FREE它们分别表示三种后台任务的操作码这些操作码可以用来标识不同的任务。
* **BIO\_CLOSE\_FILE**:文件关闭后台任务。
* **BIO\_AOF\_FSYNC**AOF日志同步写回后台任务。
* **BIO\_LAZY\_FREE**:惰性删除后台任务。
实际上bio.c文件创建的线程数组、互斥锁数组和条件变量数组大小都是包含三个元素也正是对应了这三种任务。
### bioInit函数初始化数组
接下来我们再来了解下bio.c文件中的初始化和线程创建函数bioInit。我刚才也给你介绍过这个函数它是main函数执行完server初始化后通过InitServerLast函数调用的。也就是说Redis在完成server初始化后就会创建线程来执行后台任务。
所以从这里来看,**Redis在运行时其实已经不止是单个线程也就是主IO线程在运行了还会有后台线程在运行**。如果你以后遇到Redis是否是单线程的问题时你就可以给出准确答案了。
bioInit函数首先会初始化互斥锁数组和条件变量数组。然后该函数会调用listCreate函数给bio\_jobs这个数组的每个元素创建一个列表同时给bio\_pending数组的每个元素赋值为0。这部分代码如下所示
```
for (j = 0; j < BIO_NUM_OPS; j++) {
pthread_mutex_init(&bio_mutex[j],NULL);
pthread_cond_init(&bio_newjob_cond[j],NULL);
pthread_cond_init(&bio_step_cond[j],NULL);
bio_jobs[j] = listCreate();
bio_pending[j] = 0;
}
```
那么要想了解给bio\_jobs数组和bio\_pending数组元素赋值的作用我们就需要先搞清楚这两个数组的含义
* **bio\_jobs数组**的元素是bio\_jobs结构体类型用来表示后台任务。该结构体的成员变量包括了后台任务的创建时间time以及任务的参数。为该数组的每个元素创建一个列表其实就是为每个后台线程创建一个要处理的任务列表。
* **bio\_pending数组**的元素类型是unsigned long long用来表示每种任务中处于等待状态的任务个数。将该数组每个元素初始化为0其实就是表示初始时每种任务都没有待处理的具体任务。
下面的代码展示了bio\_job结构体以及bio\_jobs和bio\_pending这两个数组的定义你也可以看下。
```
struct bio_job {
time_t time; //任务创建时间
void *arg1, *arg2, *arg3; //任务参数
};
//以后台线程方式运行的任务列表
static list *bio_jobs[BIO_NUM_OPS];
//被阻塞的后台任务数组
static unsigned long long bio_pending[BIO_NUM_OPS];
```
好了到这里你就了解了bioInit函数执行时会把线程互斥锁、条件变量对应数组初始化为NULL同时会给每个后台线程创建一个任务列表对应bio\_jobs数组的元素以及会设置每种任务的待处理个数为0对应bio\_pending数组的元素
### bioInit函数设置线程属性并创建线程
在完成了初始化之后接下来bioInit函数会先通过pthread\_attr\_t类型的变量给线程设置属性。然后bioInit函数会调用前面我提到的pthread\_create函数来创建线程。
不过为了能更好地理解bioInit函数设置线程属性和创建线程的过程我们需要先对pthread\_create函数本身有所了解该函数的原型如下所示
```
int pthread_create(pthread_t *tidp, const pthread_attr_t *attr,
( void *)(*start_routine)( void *), void *arg);
```
可以看到pthread\_create函数一共有4个参数分别是
* \***tidp**指向线程数据结构pthread\_t的指针
* \***attr**指向线程属性结构pthread\_attr\_t的指针
* \***start\_routine**,线程所要运行的函数的起始地址,也是指向函数的指针;
* \***arg**,传给运行函数的参数。
了解了pthread\_create函数之后我们来看下bioInit函数的具体操作。
首先bioInit函数会调用pthread\_attr\_init函数初始化线程属性变量attr然后调用pthread\_attr\_getstacksize函数获取线程的栈大小这一属性的当前值并根据当前栈大小和REDIS\_THREAD\_STACK\_SIZE宏定义的大小默认值为4MB来计算最终的栈大小属性值。紧接着bioInit函数会调用pthread\_attr\_setstacksize函数来设置栈大小这一属性值。
下面的代码展示了线程属性的获取、计算和设置逻辑,你可以看下。
```
pthread_attr_init(&attr);
pthread_attr_getstacksize(&attr,&stacksize);
if (!stacksize) stacksize = 1; /针对Solaris系统做处理
while (stacksize < REDIS_THREAD_STACK_SIZE) stacksize *= 2;
pthread_attr_setstacksize(&attr, stacksize);
```
我也画了一张图,展示了线程属性的这一操作过程,你可以看下。
![](https://static001.geekbang.org/resource/image/0c/9a/0c9a1dd6f5038f05716d916c588d599a.jpg?wh=2000x1125)
在完成线程属性的设置后接下来bioInit函数会通过一个for循环来依次为每种后台任务创建一个线程。循环的次数是由BIO\_NUM\_OPS宏定义决定的也就是3次。相应的bioInit函数就会调用3次pthread\_create函数并创建3个线程。bioInit函数让这3个线程执行的函数都是**bioProcessBackgroundJobs**。
不过这里要注意一点就是在这三次线程的创建过程中传给这个函数的参数分别是0、1、2。这个创建过程如下所示
```
for (j = 0; j < BIO_NUM_OPS; j++) {
void *arg = (void*)(unsigned long) j;
if (pthread_create(&thread,&attr,bioProcessBackgroundJobs,arg) != 0) {
… //报错信息
}
bio_threads[j] = thread;
}
```
你看了这个代码,可能会有一个小疑问:**为什么创建的3个线程它们所运行的bioProcessBackgroundJobs函数接收的参数分别是0、1、2呢**
这就和bioProcessBackgroundJobs函数的实现有关了我们来具体看下。
### bioProcessBackgroundJobs函数处理后台任务
首先bioProcessBackgroundJobs函数会把接收到的参数arg转成unsigned long类型并赋值给type变量如下所示
```
void *bioProcessBackgroundJobs(void *arg) {
unsigned long type = (unsigned long) arg;
}
```
而**type变量表示的就是后台任务的操作码**。这也是我刚才给你介绍的三种后台任务类型BIO\_CLOSE\_FILE、BIO\_AOF\_FSYNC和BIO\_LAZY\_FREE对应的操作码它们的取值分别为0、1、2。
bioProcessBackgroundJobs函数的主要执行逻辑是一个while(1)的循环。在这个循环中bioProcessBackgroundJobs函数会从bio\_jobs这个数组中取出相应任务并根据任务类型调用具体的函数来执行。
我刚才已经介绍过bio\_jobs数组的每一个元素是一个队列。而因为bio\_jobs数组的元素个数等于后台任务的类型个数也就是BIO\_NUM\_OPS所以bio\_jobs数组的每个元素实际上是对应了某一种后台任务的任务队列。
在了解了这一点后我们就容易理解bioProcessBackgroundJobs函数中的while循环了。因为传给bioProcessBackgroundJobs函数的参数分别是0、1、2对应了三种任务类型所以在这个循环中bioProcessBackgroundJobs函数会一直不停地从某一种任务队列中取出一个任务来执行。
同时bioProcessBackgroundJobs函数会根据传入的任务操作类型调用相应函数具体来说
* 任务类型是BIO\_CLOSE\_FILE则调用close函数
* 任务类型是BIO\_AOF\_FSYNC则调用redis\_fsync函数
* 任务类型是BIO\_LAZY\_FREE则再根据参数个数等情况分别调用lazyfreeFreeObjectFromBioThread、lazyfreeFreeDatabaseFromBioThread和lazyfreeFreeSlotsMapFromBioThread这三个函数。
最后当某个任务执行完成后bioProcessBackgroundJobs函数会从任务队列中把这个任务对应的数据结构删除。我把这部分代码放在这里你可以看下。
```
while(1) {
listNode *ln;
//从类型为type的任务队列中获取第一个任务
ln = listFirst(bio_jobs[type]);
job = ln->value;
//判断当前处理的后台任务类型是哪一种
if (type == BIO_CLOSE_FILE) {
close((long)job->arg1); //如果是关闭文件任务那就调用close函数
} else if (type == BIO_AOF_FSYNC) {
redis_fsync((long)job->arg1); //如果是AOF同步写任务那就调用redis_fsync函数
} else if (type == BIO_LAZY_FREE) {
//如果是惰性删除任务,那根据任务的参数分别调用不同的惰性删除函数执行
if (job->arg1)
lazyfreeFreeObjectFromBioThread(job->arg1);
else if (job->arg2 && job->arg3)
lazyfreeFreeDatabaseFromBioThread(job->arg2,job->arg3);
else if (job->arg3)
lazyfreeFreeSlotsMapFromBioThread(job->arg3);
} else {
serverPanic("Wrong job type in bioProcessBackgroundJobs().");
}
//任务执行完成后调用listDelNode在任务队列中删除该任务
listDelNode(bio_jobs[type],ln);
//将对应的等待任务个数减一。
bio_pending[type]--;
}
```
所以说bioInit函数其实就是创建了3个线程每个线程不停地去查看任务队列中是否有任务如果有任务就调用具体函数执行。
你可以再参考回顾下图所展示的bioInit函数和bioProcessBackgroundJobs函数的基本处理流程。
![](https://static001.geekbang.org/resource/image/d8/c4/d8cb6f9f2e410e7680ef0e674b50efc4.jpg?wh=2000x1125)
不过接下来你或许还会疑惑既然bioProcessBackgroundJobs函数是负责执行任务的**那么哪个函数负责生成任务呢?**
这就是下面,我要给你介绍的**后台任务创建函数bioCreateBackgroundJob**。
### bioCreateBackgroundJob函数创建后台任务
bioCreateBackgroundJob函数的原型如下它会接收4个参数其中参数type表示该后台任务的类型剩下来的3个参数则对应了后台任务函数的参数如下所示
```
void bioCreateBackgroundJob(int type, void *arg1, void *arg2, void *arg3)
```
bioCreateBackgroundJob函数在执行时会先创建bio\_job这是后台任务对应的数据结构。然后后台任务数据结构中的参数会被设置为bioCreateBackgroundJob函数传入的参数arg1、arg2和arg3。
最后bioCreateBackgroundJob函数调用listAddNodeTail函数将刚才创建的任务加入到对应的bio\_jobs队列中同时将bio\_pending数组的对应值加1表示有个任务在等待执行。
```
{
//创建新的任务
struct bio_job *job = zmalloc(sizeof(*job));
//设置任务数据结构中的参数
job->time = time(NULL);
job->arg1 = arg1;
job->arg2 = arg2;
job->arg3 = arg3;
pthread_mutex_lock(&bio_mutex[type]);
listAddNodeTail(bio_jobs[type],job); //将任务加到bio_jobs数组的对应任务列表中
bio_pending[type]++; //将对应任务列表上等待处理的任务个数加1
pthread_cond_signal(&bio_newjob_cond[type]);
pthread_mutex_unlock(&bio_mutex[type]);
}
```
好了这样一来当Redis进程想要启动一个后台任务时只要调用bioCreateBackgroundJob函数并设置好该任务对应的类型和参数即可。然后bioCreateBackgroundJob函数就会把创建好的任务数据结构放到后台任务对应的队列中。另一方面bioInit函数在Redis server启动时创建的线程会不断地轮询后台任务队列一旦发现有任务可以执行就会将该任务取出并执行。
其实,这种设计方式是典型的**生产者-消费者模型**。bioCreateBackgroundJob函数是生产者负责往每种任务队列中加入要执行的后台任务而bioProcessBackgroundJobs函数是消费者负责从每种任务队列中取出任务来执行。然后Redis创建的后台线程会调用bioProcessBackgroundJobs函数从而实现一直循环检查任务队列。
下图展示的就是bioCreateBackgroundJob和bioProcessBackgroundJobs两者间的生产者-消费者模型,你可以看下。
![](https://static001.geekbang.org/resource/image/f5/ab/f5a7c20b6a826cf79c0675d11ea037ab.jpg?wh=2000x850)
好了到这里我们就学习了Redis后台线程的创建和运行机制。简单来说主要是以下三个关键点
* Redis是先通过bioInit函数初始化和创建后台线程
* 后台线程运行的是bioProcessBackgroundJobs函数这个函数会轮询任务队列并根据要处理的任务类型调用相应函数进行处理
* 后台线程要处理的任务是由bioCreateBackgroundJob函数来创建的这些任务创建后会被放到任务队列中等待bioProcessBackgroundJobs函数处理。
## 小结
今天这节课我给你介绍了Redis的执行模型并且也从源码的角度出发通过分析代码带你了解了Redis进程创建、以子进程方式创建的守护进程、以及后台线程和它们负责的工作任务。同时这也解答了你在面试中可能经常会被问到的问题**Redis是单线程程序吗**
事实上Redis server启动后它的主要工作包括接收客户端请求、解析请求和进行数据读写等操作是由单线程来执行的这也是我们常说Redis是单线程程序的原因。
但是学完这节课你应该也知道Redis还启动了3个线程来执行文件关闭、AOF同步写和惰性删除等操作从这个角度来说Redis又不能算单线程程序它还是有多线程的。而且在下节课我会给你介绍Redis 6.0中多IO线程的实现从多IO线程角度看Redis也无法称为是单线程程序了。
另外学完了这节课之后你还需要重点注意下fork函数使用和生产者-消费者模型这两个关键知识点。
**首先是fork函数的使用**。fork函数可以在一个进程运行时再创建一个子进程。当Redis被配置为以守护进程方式运行时Redis的main函数就是调用fork函数创建子进程让子进程以守护进程形式执行并让一开始启动执行的父进程退出。因为子进程会从父进程那继承代码所以main函数中的执行逻辑就交给了子进程继续执行。
**其次是生产者-消费者模型**。Redis在bio.c和bio.h文件中创建了后台线程并实现了后台任务的执行。你要重点关注一下这里使用的生产者-消费者执行模型这也是bio.c实现后台任务执行的核心设计思想。而且当你需要实现异步的任务执行时生产者-消费者模型就是一个很好的解决方案你可以从Redis源码中掌握这个方案的实现思路。
## 每课一问
Redis后台任务使用bio\_job结构体来描述该结构体用了三个指针变量来表示任务参数如下所示。如果我们创建的任务所需要的参数大于3个你有什么应对方法来传参么
```
struct bio_job {
time_t time;
void *arg1, *arg2, *arg3; //传递给任务的参数
};
```
欢迎在留言区分享你的答案和思考过程,如果觉得有收获,也欢迎你把今天的内容分享给更多的朋友。