You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

305 lines
19 KiB
Markdown

This file contains invisible Unicode characters!

This file contains invisible Unicode characters that may be processed differently from what appears below. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to reveal hidden characters.

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 25 | Pub/Sub在主从故障切换时是如何发挥作用的
你好,我是蒋德钧。
在前面两节课我们学习了哨兵工作的基本过程哨兵会使用sentinelRedisInstance结构体来记录主节点的信息在这个结构体中又记录了监听同一主节点的其他哨兵的信息。**那么,一个哨兵是如何获得其他哨兵的信息的呢?**
这其实就和哨兵在运行过程中,使用的**发布订阅Pub/Sub**通信方法有关了。Pub/Sub通信方法可以让哨兵订阅一个或多个频道当频道中有消息时哨兵可以收到相应消息同时哨兵也可以向频道中发布自己生成的消息以便订阅该频道的其他客户端能收到消息。
今天这节课我就带你来了解发布订阅通信方法的实现以及它在哨兵工作过程中的应用。同时你还可以了解哨兵之间是如何发现彼此的以及客户端是如何知道故障切换完成的。Pub/Sub通信方法在分布式系统中可以用作多对多的信息交互在学完这节课之后当你要实现分布式节点间通信时就可以把它应用起来。
好了,接下来,我们先来看下发布订阅通信方法的实现。
## 发布订阅通信方法的实现
发布订阅通信方法的基本模型是包含**发布者、频道和订阅者**,发布者把消息发布到频道上,而订阅者会订阅频道,一旦频道上有消息,频道就会把消息发送给订阅者。一个频道可以有多个订阅者,而对于一个订阅者来说,它也可以订阅多个频道,从而获得多个发布者发布的消息。
下图展示的就是发布者-频道-订阅者的基本模型,你可以看下。
![图片](https://static001.geekbang.org/resource/image/b4/9d/b41f7bc078c210ef35d17bf3dc9be09d.jpg?wh=1920x789)
### 频道的实现
了解了发布订阅方法的基本模型后,我们就来看下频道是如何实现的,因为在发布订阅通信方法中,频道很重要,它是发布者和订阅者之间通信的基础。
其实Redis的全局变量server使用了一个成员变量**pubsub\_channels**来保存频道pubsub\_channels的初始化是在initServer函数在[server.c](https://github.com/redis/redis/tree/5.0/src/server.c)文件中中完成的。initServer函数会调用dictCreate创建一个**keylistDictType类型的哈希表**,然后用这个哈希表来保存频道的信息,如下所示:
```plain
void initServer(void) {
server.pubsub_channels = dictCreate(&keylistDictType,NULL);
}
```
注意当哈希表是keylistDictType类型时它保存的哈希项的value就是一个列表。而之所以采用这种类型来保存频道信息是因为Redis把频道的名称作为哈希项的key而把订阅频道的订阅者作为哈希项的value。就像刚才我们介绍的一个频道可以有多个订阅者所以Redis在实现时就会用列表把订阅同一个频道的订阅者保存起来。
pubsub\_channels哈希表保存频道和订阅者的示意图如下所示
![图片](https://static001.geekbang.org/resource/image/21/7f/21775d173b9db1650d3285a18d7d7a7f.jpg?wh=1920x874)
了解了频道是如何实现的之后,下面我们再分别看下发布命令和订阅命令的实现。
### 发布命令的实现
发布命令在Redis的实现中对应的是**publish**。我在[第14讲](https://time.geekbang.org/column/article/411558)中给你介绍过Redis server在初始化时会初始化一个命令表redisCommandTable表中就记录了Redis支持的各种命令以及对应的实现函数。
这张命令表是在server.c文件中定义的当你需要了解Redis某个命令的具体实现函数时一个快捷的方式就是在这张表中查找对应命令然后就能定位到该命令的实现函数了。我们同样可以用这个方法来定位publish命令这样就可以看到它**对应的实现函数是publishCommand**(在[pubsub.c](https://github.com/redis/redis/tree/5.0/src/pubsub.c)文件中),如下所示:
```plain
struct redisCommand redisCommandTable[] = {
{"publish",publishCommand,3,"pltF",0,NULL,0,0,0,0,0},
}
```
我们来看下publishCommand函数它是调用**pubsubPublishMessage函数**在pubsub.c文件中来完成消息的实际发送然后再返回接收消息的订阅者数量的如下所示
```plain
void publishCommand(client *c) {
    //调用pubsubPublishMessage发布消息
    int receivers = pubsubPublishMessage(c->argv[1],c->argv[2]);
    … //如果Redis启用了cluster那么在集群中发送publish命令
    addReplyLongLong(c,receivers); //返回接收消息的订阅者数量
}
```
而对于pubsubPublishMessage函数来说它的原型如下。你可以看到它的两个参数分别是要**发布消息的频道**,以及**要发布的具体消息**。
```plain
int pubsubPublishMessage(robj *channel, robj *message)
```
pubsubPublishMessage函数会在server.pubsub\_channels哈希表中查找要发布的频道。如果找见了它就会遍历这个channel对应的订阅者列表然后依次向每个订阅者发送要发布的消息。这样一来只要订阅者订阅了这个频道那么发布者发布消息时它就能收到了。
```plain
//查找频道是否存在
de = dictFind(server.pubsub_channels,channel);
    if (de) { //频道存在
       
        //遍历频道对应的订阅者,向订阅者发送要发布的消息
        while ((ln = listNext(&li)) != NULL) {
            client *c = ln->value;
           
            addReplyBulk(c,channel);
            addReplyBulk(c,message);
            receivers++;
        }
    }
```
好了,了解了发布命令后,我们再来看下订阅命令的实现。
### 订阅命令的实现
和查找发布命令的方法一样我们可以在redisCommandTable表中找到订阅命令**subscribe**对应的实现函数是**subscribeCommand**在pubsub.c文件中
subscribeCommand函数的逻辑比较简单它会直接调用pubsubSubscribeChannel函数在pubsub.c文件中来完成订阅操作如下所示
```plain
void subscribeCommand(client *c) {
    int j;
    for (j = 1; j < c->argc; j++)
        pubsubSubscribeChannel(c,c->argv[j]);
    c->flags |= CLIENT_PUBSUB;
}
```
从代码中你可以看到subscribeCommand函数的参数是client类型的变量而它会根据client的**argc**成员变量执行一个循环并把client的每个**argv**成员变量传给pubsubSubscribeChannel函数执行。
对于client的argc和argv来说它们分别代表了要执行命令的参数个数和具体参数值那么**这里的参数值是指什么呢?**
其实我们来看下pubsubSubscribeChannel函数的原型就能知道了如下所示
```plain
int pubsubSubscribeChannel(client *c, robj *channel)
```
pubsubSubscribeChannel函数的参数除了client变量外还会**接收频道的信息**这也就是说subscribeCommand会按照subscribe执行时附带的频道名称来逐个订阅频道。我也在下面展示了subscribe命令执行的一个示例你可以看下。当这个subscribe命令执行时它会订阅三个频道分别是channel1、channel2和channel3
```plain
subscribe channel1 channel2 channel3
```
下面我们来具体看下pubsubSubscribeChannel函数的实现。这个函数的逻辑也比较清晰主要可以分成三步。
**首先**它把要订阅的频道加入到server记录的pubsub\_channels中。如果这个频道是新创建的那么它会在pubsub\_channels哈希表中新建一个哈希项代表新创建的这个频道并且会创建一个列表用来保存这个频道对应的订阅者。
如果频道已经在pubsub\_channels哈希表中存在了那么pubsubSubscribeChannel函数就直接获取该频道对应的订阅者列表。
**然后**pubsubSubscribeChannel函数把执行subscribe命令的订阅者加入到订阅者列表中。
**最后**pubsubSubscribeChannel函数会把成功订阅的频道个数返回给订阅者。
下面的代码展示了这部分的逻辑,你可以看下。
```plain
if (dictAdd(c->pubsub_channels,channel,NULL) == DICT_OK) {
  
   de = dictFind(server.pubsub_channels,channel); //在pubsub_channels哈希表中查找频道
   if (de == NULL) { //如果频道不存在
      clients = listCreate();  //创建订阅者对应的列表
      dictAdd(server.pubsub_channels,channel,clients); //新插入频道对应的哈希项
     
    } else {
      clients = dictGetVal(de); //频道已存在,获取订阅者列表
    }
    listAddNodeTail(clients,c); //将订阅者加入到订阅者列表
}
 
addReplyLongLong(c,clientSubscriptionsCount(c)); //给订阅者返回成功订阅的频道数量
```
现在你就了解了Redis中发布订阅方法的实现。接下来我们来看下哨兵在工作过程中又是如何使用发布订阅功能的。
## 发布订阅方法在哨兵中的应用
首先我们来看下哨兵用来发布消息的函数sentinelEvent。
### sentinelEvent函数与消息生成
哨兵在使用发布订阅方法时,封装了**sentinelEvent函数**(在[sentinel.c](https://github.com/redis/redis/tree/5.0/src/sentinel.c)文件中用来发布消息。所以你在阅读sentinel.c文件中关于哨兵的源码时如果看到sentinelEvent这就表明哨兵正在用它来发布消息。
我在[第22讲](https://time.geekbang.org/column/article/420759)中给你介绍过sentinelEvent函数你可以再回顾下。这个函数的原型如下所示
```plain
void sentinelEvent(int level, char *type, sentinelRedisInstance *ri, const char *fmt, ...)
```
实际上这个函数最终是通过调用刚才我提到的pubsubPublishMessage函数来实现向某一个频道发布消息的。那么当我们要发布一条消息时需要确定两个方面的内容**一个是要发布的频道,另一个是要发布的消息**。
sentinelEvent函数的第二个参数type表示的就是要发布的频道而要发布的消息就是由这个函数第四个参数fmt后面的省略号来表示的。
看到这里,你可以会有一个疑问,**为什么sentinelEvent函数参数中会有省略号**
其实,这里的省略号表示的是**可变参数**当我们无法列出传递给函数的所有实参类型和数目时我们可以用省略号来表示可变参数这就是说我们可以给sentinelEvent函数传递4个、5个、6个甚至更多的参数。
我在这里就以sentinelEvent函数的实现为例给你介绍下可变参数的使用这样一来当你在开发分布式通信程序时需要生成内容不定的消息时就可以把哨兵源码中实现的方法用起来。
在sentinelEvent函数中为了使用了可变参数它主要包含了四个步骤
* 首先我们需要定义一个va\_list类型的变量假设是ap。这个变量是指向可变参数的指针。
* 然后,当我们要在函数中使用可变参数了,就需要通过**va\_start宏**来获取可变参数中的第一个参数。va\_start宏有两个参数一个是刚才定义的va\_list类型变量ap另一个是可变参数的前一个参数也就是sentinelEvent函数参数中省略号前的参数fmt。
* 紧接着我们可以使用vsnprintf函数来按照fmt定义的格式打印可变参数中的内容。vsnprintf函数会逐个获取可变参数中的每一个参数并进行打印。
* 最后我们在获取完所有参数后需要调用va\_end宏将刚才创建的ap指针关闭。
下面的代码展示了刚才介绍的这个过程,你可以再看下。
```plain
void sentinelEvent(int level, char *type, sentinelRedisInstance *ri, const char *fmt, ...) {
    va_list ap;
... 
if (fmt[0] != '\0') {
        va_start(ap, fmt);
        vsnprintf(msg+strlen(msg), sizeof(msg)-strlen(msg), fmt, ap);
        va_end(ap);
    }
...
}
```
为了让你有个更加直观的了解我在下面列了三个sentinelEvent函数的调用示例你可以再学习掌握下。
第一个对应了哨兵调用sentinelCheckSubjectivelyDown函数**检测出主节点主观下线后**sentinelCheckSubjectivelyDown函数调用sentinelEvent函数向“+sdown”频道发布消息。此时传递给sentinelEvent的参数就是4个并没有可变参数如下所示
```plain
sentinelEvent(LL_WARNING,"+sdown",ri,"%@");
```
第二个对应了**哨兵在初始化时**在sentinelGenerateInitialMonitorEvents函数中调用sentinelEvent函数向“+monitor”频道发布消息此时传递给sentinelEvent的参数有5个包含了1个可变参数表示的是哨兵的quorum阈值如下所示
```plain
sentinelEvent(LL_WARNING,"+monitor",ri,"%@ quorum %d",ri->quorum);
```
最后一个对应了**哨兵在完成主节点切换后**在sentinelFailoverSwitchToPromotedSlave函数中调用sentinelEvent函数向“+switch-master”频道发布消息。此时传递给sentinelEvent的可变参数一共有5个对应了故障切换前的主节点名称、IP和端口号以及切换后升级为主节点的从节点IP和端口号如下所示
```plain
sentinelEvent(LL_WARNING,"+switch-master",master,"%s %s %d %s %d",
        master->name, master->addr->ip, master->addr->port,
        ref->addr->ip, ref->addr->port);
```
这样一来你也就了解了哨兵在工作过程中是通过sentinelEvent函数和pubsubPublishMessage函数来实现消息的发布的。在哨兵的整个工作过程中它会在一些关键节点上**使用sentinelEvent函数往不同的频道上发布消息**。除了刚才给你举例的三个频道+monitor、+sdown、+switch-master以外我还把哨兵在工作过程中会用到的消息发布频道列在了下表中你可以了解下。
![图片](https://static001.geekbang.org/resource/image/53/72/53c920eec89a2108351d816a80cbe272.jpg?wh=1920x1080)
其实在哨兵的工作过程中如果有客户端想要了解故障切换的整体情况或进度比如主节点是否被判断为主观下线、主节点是否被判断为客观下线、Leader是否完成选举、新主节点是否切换完成等等就可以通过subscribe命令订阅上面这张表中的相应频道。这样一来客户端就可以了解故障切换的过程了。
好,下面我们再来看下,哨兵在工作过程中对消息的订阅是如何实现的。
### 哨兵订阅与hello频道
首先你要知道,每个哨兵会订阅它所监听的主节点的`"__sentinel__:hello"`频道。在[第23讲](https://time.geekbang.org/column/article/421736)中我给你介绍过哨兵会周期性调用sentinelTimer函数来完成周期性的任务这其中就有哨兵订阅主节点hello频道的操作。
具体来说哨兵在周期性执行sentinelTimer函数时会调用sentinelHandleRedisInstance函数进而调用sentinelReconnectInstance函数。而在sentinelReconnectInstance函数中哨兵会调用redisAsyncCommand函数向主节点发送subscribe命令订阅的频道由宏定义SENTINEL\_HELLO\_CHANNEL在sentinel.c文件中指定也就是`"__sentinel__:hello"`频道。这部分的代码如下所示:
```plain
retval = redisAsyncCommand(link->pc,
                sentinelReceiveHelloMessages, ri, "%s %s",
                sentinelInstanceMapCommand(ri,"SUBSCRIBE"),
                SENTINEL_HELLO_CHANNEL);
```
从代码中,我们也可以看到,当在`"__sentinel__:hello"`频道上收到hello消息后哨兵会回调sentinelReceiveHelloMessages函数来进行处理。而sentinelReceiveHelloMessages函数实际是通过调用**sentinelProcessHelloMessage函数**来完成hello消息的处理的。
对于sentinelProcessHelloMessage函数来说它主要是从hello消息中获得发布hello消息的哨兵实例的基本信息比如IP、端口号、quorum阈值等。如果当前哨兵并没有记录发布hello消息的哨兵实例的信息那么sentinelProcessHelloMessage函数就会调用**createSentinelRedisInstance函数**来创建发布hello消息的哨兵实例的信息记录这样一来当前哨兵就拥有了其他哨兵实例的信息了。
好了,了解了哨兵对`"__sentinel__:hello"`频道的订阅和处理后,我们还需要搞清楚一个问题,即**哨兵是在什么时候发布hello消息的呢**
这其实是哨兵在sentinelTimer函数中调用sentinelSendPeriodicCommands函数时由sentinelSendPeriodicCommands函数调用sentinelSendHello函数来完成的。
**sentinelSendHello函数**会调用redisAsyncCommand函数向主节点的`"__sentinel__:hello"`频道发布hello消息。在它发送的hello消息中包含了发布hello消息的哨兵实例的IP、端口号、ID和当前的纪元以及该哨兵监听的主节点的名称、IP、端口号和纪元信息。
下面的代码就展示了hello消息的生成和发布你可以看下。
```plain
//hello消息包含的内容
snprintf(payload,sizeof(payload),
        "%s,%d,%s,%llu," //当前哨兵实例的信息包括ip、端口号、ID和当前纪元
        "%s,%s,%d,%llu", //当前主节点的信息包括名称、IP、端口号和纪元
        announce_ip, announce_port, sentinel.myid,
        (unsigned long long) sentinel.current_epoch,
        master->name,master_addr->ip,master_addr->port,
        (unsigned long long) master->config_epoch);
//向主节点的hello频道发布hello消息
retval = redisAsyncCommand(ri->link->cc,
        sentinelPublishReplyCallback, ri, "%s %s %s",
        sentinelInstanceMapCommand(ri,"PUBLISH"),
        SENTINEL_HELLO_CHANNEL,payload);
```
这样当哨兵通过sentinelSendHello向自己监听的主节点的`"__sentinel__:hello"`频道发布hello消息时和该哨兵监听同一个主节点的其他哨兵也会订阅主节点的`"__sentinel__:hello"`频道从而就可以获得该频道上的hello消息了。
通过这样的通信方式监听同一主节点的哨兵就能相互知道彼此的访问信息了。如此一来哨兵就可以基于这些访问信息执行主节点状态共同判断以及进行Leader选举等操作了。
## 小结
今天这节课我们了解了Redis实现的发布订阅通信方法。这个方法是提供了频道的方式让要通信的双方按照频道来完成消息交互。而**不同频道的不同名称,就代表了哨兵工作过程中的不同状态**。当客户端需要了解哨兵的工作进度或是主节点的状态判断时,就可以通过订阅哨兵发布消息的频道来完成。
当然,对于一个哨兵来说,它一定会订阅的频道是它所监听的主节点的`"__sentinel__:hello`"频道。通过这个频道监听同一主节点的不同哨兵就能通过频道上的hello消息来交互彼此的访问信息了比如哨兵的IP、端口号等。
此外,在这节课,我还给你介绍了一个**C语言函数可变参数的使用小技巧**,当你开发发布订阅功能时,都需要生成发布的消息,而可变参数就可以用来生成长度不定的消息。希望你能把这个小技巧应用起来。
## 每课一问
如果我们在哨兵实例上执行publish命令那么这条命令是不是就是由pubsub.c文件中的publishCommand函数来处理的呢?