gitbook/Redis源码剖析与实战/docs/413997.md

412 lines
25 KiB
Markdown
Raw Permalink Normal View History

2022-09-03 22:05:03 +08:00
# 17 | Lazy Free会影响缓存替换吗
你好,我是蒋德钧。
Redis缓存淘汰算法的目的其实是为了在Redis server内存使用量超过上限值的时候筛选一些冷数据出来把它们从Redis server中删除以保证server的内存使用量不超出上限。我们在前两节课已经分别学习了Redis源码对LRU算法和LFU算法的实现这两种算法在最后淘汰数据的时候都会删除被淘汰的数据。
不过无论是LRU算法还是LFU算法它们在删除淘汰数据时实际上都会根据Redis server的**lazyfree-lazy-eviction配置项**来决定是否使用Lazy Free也就是惰性删除。
惰性删除是Redis 4.0版本后提供的功能,它会使用后台线程来执行删除数据的任务,从而避免了删除操作对主线程的阻塞。但是,**后台线程异步删除数据能及时释放内存吗它会影响到Redis缓存的正常使用吗**
今天这节课我就来给你介绍下惰性删除在缓存淘汰时的应用。了解这部分内容你就可以掌握惰性删除启用后会给Redis缓存淘汰和内存释放带来的可能影响。这样当你在实际应用中遇到Redis缓存内存容量的问题时你就多了一条排查思路了。
那么接下来我们就先来看下缓存淘汰时的数据删除的基本过程。不过在了解这个删除过程之前我们需要先了解下Redis server启动惰性删除的配置。因为在Redis源码中有不少地方都会根据server是否启动惰性删除来执行不同的分支操作。
## 惰性删除的设置
首先当Redis server希望启动惰性删除时需要在redis.conf文件中设置和惰性删除相关的配置项。其中包括了四个配置项分别对应了如下的四种场景。
* **lazyfree-lazy-eviction**:对应缓存淘汰时的数据删除场景。
* **lazyfree-lazy-expire**对应过期key的删除场景。
* **lazyfree-lazy-server-del**对应会隐式进行删除操作的server命令执行场景。
* **replica-lazy-flush**:对应从节点完成全量同步后,删除原有旧数据的场景。
这四个配置项的默认值都是no。所以如果要在缓存淘汰时启用就需要将
lazyfree-lazy-eviction设置为yes。同时Redis server在启动过程中进行配置参数初始化时会根据redis.conf的配置信息设置全局变量server的lazyfree\_lazy\_eviction成员变量。
这样一来我们在Redis源码中如果看到对server.lazyfree\_lazy\_eviction变量值进行条件判断那其实就是Redis根据lazyfree-lazy-eviction配置项来决定是否执行惰性删除。
好了,了解了如何在缓存淘汰场景中设置惰性删除之后,接下来,我们就来看下被淘汰数据的删除过程。
## 被淘汰数据的删除过程
其实通过前两节课程的学习我们已经知道Redis源码中的freeMemoryIfNeeded函数在[evict.c](https://github.com/redis/redis/tree/5.0/src/evict.c)文件中)会负责执行数据淘汰的流程。而该函数在筛选出被淘汰的键值对后,就要开始删除被淘汰的数据,这个删除过程主要分成两步。
**第一步**freeMemoryIfNeeded函数会为被淘汰的key创建一个SDS对象然后调用propagateExpire函数如下所示
```
int freeMemoryIfNeeded(void) {
if (bestkey) {
db = server.db+bestdbid;
robj *keyobj = createStringObject(bestkey,sdslen(bestkey));
propagateExpire(db,keyobj,server.lazyfree_lazy_eviction);
}
```
propagateExpire函数是在[db.c](https://github.com/redis/redis/tree/5.0/src/db.c)文件中实现的。它会先创建一个redisObject结构体数组该数组的第一个元素是删除操作对应的命令对象而第二个元素是被删除的key对象。因为Redis server可能针对缓存淘汰场景启用了惰性删除所以**propagateExpire函数会根据全局变量server的lazyfree\_lazy\_eviction成员变量的值来决定删除操作具体对应的是哪个命令。**
如果lazyfree\_lazy\_eviction被设置为1也就是启用了缓存淘汰时的惰性删除那么删除操作对应的命令就是UNLINK否则的话命令就是DEL。因为这些命令会被经常使用所以Redis源码中会为这些命令创建共享对象。这些共享对象的数据结构是sharedObjectsStruct结构体并用一个全局变量shared来表示。在该结构体中包含了指向共享对象的指针这其中就包括了unlink和del命令对象。
以下代码展示了shared全局变量的定义以及sharedObjectsStruct结构体的定义其中shared变量是在[server.c](https://github.com/redis/redis/tree/5.0/src/server.c)文件中定义的而sharedObjectsStruct结构体是在[server.h](https://github.com/redis/redis/tree/5.0/src/server.h)中定义的。
```
struct sharedObjectsStruct shared;
struct sharedObjectsStruct {
...
robj *del, *unlink,
...
}
```
然后propagateExpire函数在为删除操作创建命令对象时就使用了shared变量中的unlink或del对象这部分代码如下所示
```
void propagateExpire(redisDb *db, robj *key, int lazy) {
robj *argv[2];
argv[0] = lazy ? shared.unlink : shared.del; //如果server启用了lazyfree-lazy-evict那么argv[0]的值为unlink对象否则为del对象
argv[1] = key; //被淘汰的key对象
...
}
```
紧接着propagateExpire函数会判断Redis server是否启用了AOF日志。如果启用了那么propagateExpire函数会先把被淘汰key的删除操作记录到AOF文件中以保证后续使用AOF文件进行Redis数据库恢复时可以和恢复前保持一致。这一步是通过调用feedAppendOnlyFile函数在[aof.c](https://github.com/redis/redis/tree/5.0/src/aof.c)文件中)来实现的。
然后propagateExpire函数会调用replicationFeedSlaves函数在[replication.c](https://github.com/redis/redis/tree/5.0/src/replication.c)文件中),把删除操作同步给从节点,以保证主从节点的数据一致。
下面代码展示了propagateExpire函数的基本流程你可以看下。
```
//如果启用了AOF日志则将删除操作写入AOF文件
if (server.aof_state != AOF_OFF)
feedAppendOnlyFile(server.delCommand,db->id,argv,2);
//将删除操作同步给从节点
replicationFeedSlaves(server.slaves,db->id,argv,2);
```
为了便于你更直观地理解这个流程,我也画了一张图,你可以参考下。
![](https://static001.geekbang.org/resource/image/74/9f/74200fb7ccbcb0cyya8cff7189e5009f.jpg?wh=1852x858)
这样接下来freeMemoryIfNeeded函数就会开始执行删除操作。
**第二步**freeMemoryIfNeeded函数会根据server是否启用了惰性删除分别执行两个分支。
* 分支一如果server启用了惰性删除freeMemoryIfNeeded函数会调用dbAsyncDelete函数进行异步删除。
* 分支二如果server未启用惰性删除freeMemoryIfNeeded函数会调用dbSyncDelete函数进行同步删除。
而无论是执行异步删除还是同步删除freeMemoryIfNeeded函数都会在调用删除函数前调用**zmalloc\_used\_memory函数**(在[zmalloc.c](http://github.com/redis/redis/tree/5.0/src/zmalloc.c)文件中计算当前使用的内存量。然后它在调用删除函数后会再次调用zmalloc\_used\_memory函数计算此时的内存使用量并计算删除操作导致的内存使用量差值这个差值就是通过删除操作而被释放的内存量。
所以freeMemoryIfNeeded函数最后会把这部分释放的内存量和已释放的内存量相加得到最新的内存释放量。这部分的执行逻辑如以下代码所示
```
delta = (long long) zmalloc_used_memory(); //获取当前内存使用量
if (server.lazyfree_lazy_eviction)
dbAsyncDelete(db,keyobj); //如果启用了惰性删除,则进行异步删除
else
dbSyncDelete(db,keyobj); //否则,进行同步删除
delta -= (long long) zmalloc_used_memory(); //根据当前内存使用量计算数据删除前后释放的内存量
mem_freed += delta; //更新已释放的内存量
```
所以到这里我们就知道了freeMemoryIfNeeded函数在选定被删除的键值对后可以通过异步或同步操作来完成数据的实际删除。那么**数据异步删除和同步删除具体又是如何执行的呢?**
下面,我们就来具体了解下。
## 数据删除操作
在学习数据异步或同步删除之前,你首先需要知道,删除操作实际上是包括了两步子操作。
* 子操作一将被淘汰的键值对从哈希表中去除这里的哈希表既可能是设置了过期key的哈希表也可能是全局哈希表。
* 子操作二:释放被淘汰键值对所占用的内存空间。
也就是说,如果这两个子操作一起做,那么就是**同步删除**;如果只做了子操作一,而子操作二由后台线程来执行,那么就是**异步删除**。
那么对于Redis源码来说它是使用了**dictGenericDelete函数**来实现前面介绍的这两个子操作。dictGenericDelete函数是在dict.c文件中实现的下面我们就来了解下它的具体执行过程。
**首先dictGenericDelete函数会先在哈希表中查找要删除的key。**它会计算被删除key的哈希值然后根据哈希值找到key所在的哈希桶。
因为不同key的哈希值可能相同而Redis的哈希表是采用了链式哈希你可以回顾下[第3讲](https://time.geekbang.org/column/article/400379)中介绍的链式哈希所以即使我们根据一个key的哈希值定位到了它所在的哈希桶我们也仍然需要在这个哈希桶中去比对查找这个key是否真的存在。
也正是由于这个原因dictGenericDelete函数紧接着就会在哈希桶中进一步比对查找要删除的key。如果找到了它就先把这个key从哈希表中去除也就是把这个key从哈希桶的链表中去除。
**然后dictGenericDelete函数会根据传入参数nofree的值决定是否实际释放key和value的内存空间。**dictGenericDelete函数中的这部分执行逻辑如下所示
```
h = dictHashKey(d, key); //计算key的哈希值
for (table = 0; table <= 1; table++) {
idx = h & d->ht[table].sizemask; //根据key的哈希值获取它所在的哈希桶编号
he = d->ht[table].table[idx]; //获取key所在哈希桶的第一个哈希项
prevHe = NULL;
while(he) { //在哈希桶中逐一查找被删除的key是否存在
if (key==he->key || dictCompareKeys(d, key, he->key)) {
//如果找见被删除key了那么将它从哈希桶的链表中去除
if (prevHe)
prevHe->next = he->next;
else
d->ht[table].table[idx] = he->next;
if (!nofree) { //如果要同步删除那么就释放key和value的内存空间
dictFreeKey(d, he); //调用dictFreeKey释放
dictFreeVal(d, he);
zfree(he);
}
d->ht[table].used--;
return he;
}
prevHe = he;
he = he->next; //当前key不是要查找的key再找下一个
}
...
}
```
那么从dictGenericDelete函数的实现中你可以发现dictGenericDelete函数实际上会根据nofree参数来决定执行的是同步删除还是异步删除。而Redis源码在dictGenericDelete函数的基础上还封装了**两个函数dictDelete和dictUnlink**。
这两个函数的区别就在于它们给dictGenericDelete函数传递的nofree参数值是0还是1。如果其中nofree的值为0表示的就是同步删除而nofree值为1表示的则是异步删除。
下面的代码展示了dictGenericDelete函数原型以及dictDelete和dictUnlink两个函数的实现你可以看下。
```
//dictGenericDelete函数原型参数是待查找的哈希表待查找的key以及同步/异步删除标记
static dictEntry *dictGenericDelete(dict *d, const void *key, int nofree)
//同步删除函数传给dictGenericDelete函数的nofree值为0
int dictDelete(dict *ht, const void *key) {
return dictGenericDelete(ht,key,0) ? DICT_OK : DICT_ERR;
}
//异步删除函数传给dictGenericDelete函数的nofree值为1
dictEntry *dictUnlink(dict *ht, const void *key) {
return dictGenericDelete(ht,key,1);
}
```
好了到这里我们就了解了同步删除和异步删除的基本代码实现。下面我们就再来看下在刚才介绍的freeMemoryIfNeeded函数中它在删除键值对时所调用的dbAsyncDelete和dbSyncDelete这两个函数是如何使用dictDelete和dictUnlink来实际删除被淘汰数据的。
### 基于异步删除的数据淘汰
我们先来看下基于异步删除的数据淘汰过程。这个过程是由**dbAsyncDelete函数**执行的,它是在[lazyfree.c](http://github.com/redis/redis/tree/5.0/src/lazyfree.c)文件中实现的。而这个函数的执行逻辑其实并不复杂,主要可以分成三步。
**第一步**dbAsyncDelete函数会调用dictDelete函数在过期key的哈希表中同步删除被淘汰的键值对如下所示
```
if (dictSize(db->expires) > 0) dictDelete(db->expires,key->ptr);
```
**第二步**dbAsyncDelete函数会调用dictUnlink函数在全局哈希表中异步删除被淘汰的键值对如下所示
```
dictEntry *de = dictUnlink(db->dict,key->ptr);
```
而到这里被淘汰的键值对只是在全局哈希表中被移除了它占用的内存空间还没有实际释放。所以此时dbAsyncDelete函数会**调用lazyfreeGetFreeEffort函数来计算释放被淘汰键值对内存空间的开销**。如果开销较小dbAsyncDelete函数就直接在主IO线程中进行同步删除了。否则的话dbAsyncDelete函数会创建惰性删除任务并交给后台线程来完成。
这里你需要注意的是虽然dbAsyncDelete函数说是执行惰性删除但其实它在实际执行的过程中会使用前面提到的这个lazyfreeGetFreeEffort函数来评估删除开销。
lazyfreeGetFreeEffort函数是在lazyfree.c文件中实现的它对删除开销的评估逻辑很简单就是根据**要删除的键值对的类型**来计算删除开销。当键值对类型属于List、Hash、Set和Sorted Set这四种集合类型中的一种并且没有使用紧凑型内存结构来保存的话那么这个键值对的删除开销就等于集合中的元素个数。否则的话删除开销就等于1。
我举个简单的例子以下代码就展示了lazyfreeGetFreeEffort函数计算List和Set类型键值对的删除开销。可以看到当键值对是Set类型同时它是使用哈希表结构而不是整数集合来保存数据的话那么它的删除开销就是Set中的元素个数。
```
size_t lazyfreeGetFreeEffort(robj *obj) {
if (obj->type == OBJ_LIST) { //如果是List类型键值对就返回List的长度也就其中元素个数
quicklist *ql = obj->ptr;
return ql->len;
} else if (obj->type == OBJ_SET && obj->encoding == OBJ_ENCODING_HT) {
dict *ht = obj->ptr;
return dictSize(ht); //如果是Set类型键值对就返回Set中的元素个数
}
...
}
```
这样当dbAsyncDelete函数通过lazyfreeGetFreeEffort函数计算得到被淘汰键值对的删除开销之后接下来的**第三步**它就会把删除开销和宏定义LAZYFREE\_THRESHOLD在lazyfree.c文件中进行比较这个宏定义的默认值是64。
所以当被淘汰键值对是包含超过64个元素的集合类型时dbAsyncDelete函数才会调用bioCreateBackgroundJob函数来实际创建后台任务执行惰性删除。关于bioCreateBackgroundJob函数的作用和工作机制我在[第12讲](https://time.geekbang.org/column/article/409927)中已经给你介绍过了,你可以再去回顾下。
不过如果被淘汰键值对不是集合类型或者是集合类型但包含的元素个数小于等于64个那么dbAsyncDelete函数就直接调用**dictFreeUnlinkedEntry函数**在dict.c文件中来释放键值对所占的内存空间了。
以下代码就展示了dbAsyncDelete函数使用后台任务或主IO线程释放内存空间的逻辑你可以看下。
```
//如果要淘汰的键值对包含超过64个元素
if (free_effort > LAZYFREE_THRESHOLD && val->refcount == 1) {
atomicIncr(lazyfree_objects,1);
bioCreateBackgroundJob(BIO_LAZY_FREE,val,NULL,NULL); //创建惰性删除的后台任务,交给后台线程执行
dictSetVal(db->dict,de,NULL); //将被淘汰键值对的value设置为NULL
}
if (de) {
dictFreeUnlinkedEntry(db->dict,de);
...
return 1;
}
```
另外,你也可以根据下图来整体回顾下这个执行过程。
![](https://static001.geekbang.org/resource/image/2e/cb/2ec7fcd7a52f4d5e1f2cf78bd44e5acb.jpg?wh=2000x916)
好,那么现在,我们也就了解了基于异步删除的数据淘汰过程,实际上会根据要删除的键值对包含的元素个数,来决定是实际使用后台线程还是主线程来进行删除操作。
不过,如果是使用了后台线程来释放内存,那么随之带来的一个问题就是:**主线程如何知道后台线程释放的内存空间,已经满足待释放空间的大小呢?**
其实freeMemoryIfNeeded函数本身在调用dbAsyncDelete或dbSyncDelete函数的前后都会统计已经使用的内存量并计算调用删除函数前后的差值这样其实就可以获得已经释放的内存空间大小。
而除此之外freeMemoryIfNeeded函数还会在调用dbAsyncDelete函数后再次主动检测当前的内存使用量是否已经满足最大内存容量要求。一旦满足了freeMemoryIfNeeded函数就会停止淘汰数据的执行流程了。这步的执行逻辑你可以参考以下给出的代码
```
int freeMemoryIfNeeded(void) {
...
//执行循环流程,删除淘汰数据
while (mem_freed < mem_tofree) {
...
//如果使用了惰性删除并且每删除16个key后统计下当前内存使用量
if (server.lazyfree_lazy_eviction && !(keys_freed % 16)) {
//计算当前内存使用量是否不超过最大内存容量
if (getMaxmemoryState(NULL,NULL,NULL,NULL) == C_OK) {
mem_freed = mem_tofree; //如果满足最大容量要求,让已释放内存量等于待释放量,以便结束循环
}
}
...
}}
```
到这里,我们就了解了基于异步删除的数据淘汰实现过程。接下来,我们再来看下基于同步删除的数据淘汰实现。
### 基于同步删除的数据淘汰
其实,和基于异步删除的数据淘汰过程相比,基于同步删除的数据淘汰过程就比较简单了。这个过程是由**dbSyncDelete函数**在db.c文件中实现的。
dbSyncDelete函数主要是实现了两步操作。首先它会调用dictDelete函数在过期key的哈希表中删除被淘汰的键值对。紧接着它会再次调用dictDelete函数在全局哈希表中删除被淘汰的键值对。这样一来同步删除的基本操作就完成了。
不过,**这里你需要注意的是**dictDelete函数通过调用dictGenericDelete函数来同步释放键值对的内存空间时最终是通过分别调用dictFreeKey、dictFreeVal和zfree三个函数来释放key、value和键值对对应哈希项这三者占用的内存空间的。
其中zfree函数是在zmalloc.c文件中实现的。而dictFreeKey、dictFreeVal这两个函数是在dict.h文件中定义的两个宏定义。它们的具体实现是根据操作的哈希表类型调用相应的valDestructor函数和keyDestructor函数来释放内存。你可以看看下面的代码其中就展示了dictFreeKey和dictFreeVal的宏定义。
```
#define dictFreeVal(d, entry) \
if ((d)->type->valDestructor) \
(d)->type->valDestructor((d)->privdata, (entry)->v.val)
#define dictFreeKey(d, entry) \
if ((d)->type->keyDestructor) \
(d)->type->keyDestructor((d)->privdata, (entry)->key)
```
那么,为了方便你能找到最终进行内存释放操作的函数,下面我就**以全局哈希表为例**来带你看下当操作全局哈希表时键值对的dictFreeVal和dictFreeKey两个宏定义对应的函数。
首先全局哈希表是在initServer函数中创建的。在创建时全局哈希表的类型是dbDictType如下所示
```
void initServer(void) {
...
for (j = 0; j < server.dbnum; j++) {
server.db[j].dict = dictCreate(&dbDictType,NULL);
server.db[j].expires = dictCreate(&keyptrDictType,NULL);
...
}
...
}
```
其中dbDictType是一个dictType类型的结构体dictType类型是在dict.h文件中定义的。它的最后两个成员变量就是keyDestructor函数指针和valDestructor函数指针如下所示
```
typedef struct dictType {
...
void (*keyDestructor)(void *privdata, void *key);
void (*valDestructor)(void *privdata, void *obj);
} dictType;
```
然后对于dbDictType来说它是在server.c文件中定义的。因为它作为全局哈希表保存的是SDS类型的key以及多种数据类型的value。所以dbDictType类型哈希表的key和value释放函数实际上分别是dictSdsDestructor函数和dictObjectDestructor函数如下所示
```
dictType dbDictType = {
...
dictSdsDestructor, //key的释放函数
dictObjectDestructor //value的释放函数
};
```
这两个函数都是在server.c文件中实现的。
其中dictSdsDestructor函数主要是直接调用sdsfree函数在sds.c文件中释放SDS字符串占用的内存空间。而dictObjectDestructor函数会调用decrRefCount函数在object.c文件中来执行释放操作如下所示
```
void dictObjectDestructor(void *privdata, void *val)
{
...
decrRefCount(val);
}
```
那么在这里,你要知道的是,**decrRefCount函数在执行时会判断待释放对象的引用计数。**只有当引用计数为1了它才会根据待释放对象的类型调用具体类型的释放函数来释放内存空间。否则的话decrRefCount函数就只是把待释放对象的引用计数减1。
现在我们来举个例子。如果待释放对象的引用计数为1并且是String类型的话那么decrRefCount函数就会调用freeStringObject函数来执行最终的内存释放操作。而如果对象是List类型那么decrRefCount函数则会调用freeListObject函数来最终释放内存。这部分代码如下所示
```
void decrRefCount(robj *o) {
if (o->refcount == 1) {
switch(o->type) {
case OBJ_STRING: freeStringObject(o); break;
case OBJ_LIST: freeListObject(o); break;
...
}
zfree(o);
} else {
...
if (o->refcount != OBJ_SHARED_REFCOUNT) o->refcount--;
}
}
```
我也画了一张图来展示decrRefCount函数的基本执行逻辑你可以看下。
![](https://static001.geekbang.org/resource/image/1e/74/1e242ba4cf7bc7b5a34543bfea6d7474.jpg?wh=2000x865)
所以说基于同步删除的数据淘汰过程其实就是通过dictDelete函数将被淘汰键值对从全局哈希表移除并通过dictFreeKey、dictFreeVal和zfree三个函数来释放内存空间。而通过以上内容的学习你就已经知道释放value空间的函数是decrRefCount函数它会根据value的引用计数和类型最终调用不同数据类型的释放函数来完成内存空间的释放。
而在这里,你也要注意的是,基于异步删除的数据淘汰,它通过后台线程执行的函数是**lazyfreeFreeObjectFromBioThread函数**在lazyfree.c文件而这个函数实际上也是调用了decrRefCount函数来释放内存空间的。
## 小结
今天这节课我给你介绍了Redis缓存在淘汰数据时执行的数据删除流程。因为在Redis 4.0版本之后提供了惰性删除的功能所以Redis缓存淘汰数据的时候就会根据是否启用惰性删除来决定是执行同步删除还是异步的惰性删除。
而你要知道无论是同步删除还是异步的惰性删除它们都会先把被淘汰的键值对从哈希表中移除。然后同步删除就会紧接着调用dictFreeKey、dictFreeVal和zfree三个函数来分别释放key、value和键值对哈希项的内存空间。而异步的惰性删除则是把空间释放任务交给了后台线程来完成。
注意,虽然惰性删除是由后台线程异步完成的,但是后台线程启动后会监听惰性删除的任务队列,一旦有了惰性删除任务,后台线程就会执行并释放内存空间。所以,从淘汰数据释放内存空间的角度来说,**惰性删除并不会影响缓存淘汰时的空间释放要求**。
不过在最后,我也想提醒你一下,就是后台线程需要**通过同步机制获取任务**这个过程会引入一些额外的时间开销会导致内存释放不像同步删除那样非常及时。实际上这也是Redis在被淘汰数据是小集合元素不超过64个仍然使用主线程进行内存释放的设计考虑因素。
## 每课一问
请你思考一下freeMemoryIfNeeded函数在使用后台线程删除被淘汰数据的过程中主线程是否仍然可以处理外部请求呢
欢迎在留言区写下你的答案和思考。如果觉得有收获,也欢迎你把今天的内容分享给更多的朋友。