You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

246 lines
19 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 16 | LFU算法和其他算法相比有优势吗
你好,我是蒋德钧。
上节课我给你介绍了Redis对缓存淘汰策略LRU算法的近似实现。其实Redis在4.0版本后还引入了LFU算法也就是**最不频繁使用**Least Frequently UsedLFU算法。LFU算法在进行数据淘汰时会把最不频繁访问的数据淘汰掉。而LRU算法是把最近最少使用的数据淘汰掉看起来也是淘汰不频繁访问的数据。那么**LFU算法和LRU算法的区别到底有哪些呢我们在实际场景中需要使用LFU算法吗**
其实如果只是从基本定义来看的话我们是不太容易区分出这两个算法的。所以今天这节课我就带你从源码层面来学习了解下LFU算法的设计与实现。这样你就能更好地掌握LFU算法的优势和适用场景当你要为Redis缓存设置淘汰策略时就可以作出合适的选择了。
那么在开始学习LFU算法的实现代码之前我们还是先来看下LFU算法的基本原理以此更好地支撑我们掌握代码的执行逻辑。
## LFU算法的基本原理
因为LFU算法是根据**数据访问的频率**来选择被淘汰数据的所以LFU算法会记录每个数据的访问次数。当一个数据被再次访问时就会增加该数据的访问次数。
不过,访问次数和访问频率还不能完全等同。**访问频率是指在一定时间内的访问次数**,也就是说,在计算访问频率时,我们不仅需要记录访问次数,还要记录这些访问是在多长时间内执行的。否则,如果只记录访问次数的话,就缺少了时间维度的信息,进而就无法按照频率来淘汰数据了。
我来给你举个例子假设数据A在15分钟内访问了15次数据B在5分钟内访问了10次。如果只是按访问次数来统计的话数据A的访问次数大于数据B所以淘汰数据时会优先淘汰数据B。不过如果按照访问频率来统计的话数据A的访问频率是1分钟访问1次而数据B的访问频率是1分钟访问2次所以按访问频率淘汰数据的话数据A应该被淘汰掉。
所以说当要实现LFU算法时我们需要能统计到数据的访问频率而不是简单地记录数据访问次数就行。
那么接下来我们就来学习下Redis是如何实现LFU算法的。
## LFU算法的实现
首先和我们上节课介绍的LRU算法类似LFU算法的启用是通过设置Redis配置文件redis.conf中的maxmemory和maxmemory-policy。其中maxmemory设置为Redis会用的最大内存容量而maxmemory-policy可以设置为allkeys-lfu或是volatile-lfu表示淘汰的键值对会分别从所有键值对或是设置了过期时间的键值对中筛选。
LFU算法的实现可以分成三部分内容分别是键值对访问频率记录、键值对访问频率初始化和更新以及LFU算法淘汰数据。下面我们先来看下键值对访问频率记录。
### 键值对访问频率记录
通过LRU算法的学习现在我们已经了解到每个键值对的值都对应了一个redisObject结构体其中有一个24 bits的lru变量。lru变量在LRU算法实现时是用来记录数据的访问时间戳。因为Redis server每次运行时只能将maxmemory-policy配置项设置为使用一种淘汰策略所以**LRU算法和LFU算法并不会同时使用**。而为了节省内存开销Redis源码就复用了lru变量来记录LFU算法所需的访问频率信息。
具体来说当lru变量用来记录LFU算法的所需信息时它会用24 bits中的低8 bits作为计数器来记录键值对的访问次数同时它会用24 bits中的高16 bits记录访问的时间戳。下图就展示了用来记录访问频率时的lru变量内容你可以看下。
![](https://static001.geekbang.org/resource/image/1c/dc/1cfd742c59f0c2447ac9af0f9160a4dc.jpg?wh=1920x430)
了解了LFU算法所需的访问频率是如何记录的接下来我们再来看下键值对的访问频率是如何初始化和更新的。
### 键值对访问频率的初始化与更新
首先我们要知道LFU算法和LRU算法的基本步骤实际上是**在相同的入口函数中执行**的。上节课围绕LRU算法的实现我们已经了解到这些基本步骤包括数据访问信息的初始化、访问信息更新以及实际淘汰数据。这些步骤对应的入口函数如下表所示你也可以再去回顾下上节课的内容。
![](https://static001.geekbang.org/resource/image/09/c4/0915155b20fee28776252f3b0c247ac4.jpg?wh=2000x783)
了解了这些入口函数后我们再去分析LFU算法的实现就容易找到对应的函数了。
对于键值对访问频率的初始化来说,当一个键值对被创建后,**createObject函数**就会被调用用来分配redisObject结构体的空间和设置初始化值。如果Redis将maxmemory-policy设置为LFU算法那么键值对redisObject结构体中的lru变量初始化值会由两部分组成
* 第一部分是**lru变量的高16位**是以1分钟为精度的UNIX时间戳。这是通过调用LFUGetTimeInMinutes函数在evict.c文件中计算得到的。
* 第二部分是**lru变量的低8位**被设置为宏定义LFU\_INIT\_VAL在[server.h](http://github.com/redis/redis/tree/5.0/src/server.h)文件中默认值为5。
你会发现这和我刚才给你介绍的键值对访问频率记录是一致的也就是说当使用LFU算法时lru变量包括了键值对的访问时间戳和访问次数。以下代码也展示了这部分的执行逻辑你可以看下。
```
robj *createObject(int type, void *ptr) {
robj *o = zmalloc(sizeof(*o));
...
//使用LFU算法时lru变量包括以分钟为精度的UNIX时间戳和访问次数5
if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
o->lru = (LFUGetTimeInMinutes()<<8) | LFU_INIT_VAL;
} else {
o->lru = LRU_CLOCK(); //使用LRU算法时的设置
}
return o;
}
```
下面,我们再来看下键值对访问频率的更新。
当一个键值对被访问时Redis会调用lookupKey函数进行查找。当maxmemory-policy设置使用LFU算法时lookupKey函数会**调用updateLFU函数来更新键值对的访问频率**也就是lru变量值如下所示
```
robj *lookupKey(redisDb *db, robj *key, int flags) {
...
if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
updateLFU(val); //使用LFU算法时调用updateLFU函数更新访问频率
} else {
val->lru = LRU_CLOCK(); //使用LRU算法时调用LRU_CLOCK
}
...
```
updateLFU函数是在[db.c](https://github.com/redis/redis/tree/5.0/src/db.c)文件中实现的,它的执行逻辑比较明确,一共分成三步。
**第一步,根据距离上次访问的时长,衰减访问次数。**
updateLFU函数首先会调用LFUDecrAndReturn函数在evict.c文件中对键值对的访问次数进行衰减操作如下所示
```
void updateLFU(robj *val) {
unsigned long counter = LFUDecrAndReturn(val);
...
}
```
看到这里,你可能会有疑问:**访问键值对时不是要增加键值对的访问次数吗,为什么要先衰减访问次数呢?**
其实这就是我在前面一开始和你介绍的LFU算法是根据访问频率来淘汰数据的而不只是访问次数。访问频率需要考虑键值对的访问是多长时间段内发生的。键值对的先前访问距离当前时间越长那么这个键值对的访问频率相应地也就会降低。
我给你举个例子假设数据A在时刻T到T+10分钟这段时间内被访问了30次那么这段时间内数据A的访问频率可以计算为3次/分钟30次/10分钟 = 3次/分钟)。
紧接着在T+10分钟到T+20分钟这段时间内数据A没有再被访问那么此时如果我们计算数据A在T到T+20分钟这段时间内的访问频率它的访问频率就会降为1.5次/分钟30次/20分钟 = 1.5次/分钟。以此类推随着时间的推移如果数据A在T+10分钟后一直没有新的访问那么它的访问频率就会逐步降低。这就是所谓的**访问频率衰减**。
因为Redis是使用lru变量中的访问次数来表示访问频率所以在每次更新键值对的访问频率时就会通过LFUDecrAndReturn函数对访问次数进行衰减。
具体来说LFUDecrAndReturn函数会首先获取当前键值对的上一次访问时间这是保存在lru变量高16位上的值。然后LFUDecrAndReturn函数会根据全局变量server的lru\_decay\_time成员变量的取值来计算衰减的大小num\_period。
这个计算过程会判断lfu\_decay\_time的值是否为0。如果lfu\_decay\_time值为0那么衰减大小也为0。此时访问次数不进行衰减。
否则的话LFUDecrAndReturn函数会调用LFUTimeElapsed函数在evict.c文件中计算距离键值对的上一次访问已经过去的时长。这个时长也是以1分钟为精度来计算的。有了距离上次访问的时长后LFUDecrAndReturn函数会把这个时长除以lfu\_decay\_time的值并把结果作为访问次数的衰减大小。
这里,**你需要注意的是**lfu\_decay\_time变量值是由redis.conf文件中的配置项lfu-decay-time来决定的。Redis在初始化时会通过initServerConfig函数来设置lfu\_decay\_time变量的值默认值为1。所以**在默认情况下,访问次数的衰减大小就是等于上一次访问距离当前的分钟数**。比如假设上一次访问是10分钟前那么在默认情况下访问次数的衰减大小就等于10。
当然如果上一次访问距离当前的分钟数已经超过访问次数的值了那么访问次数就会被设置为0这就表示键值对已经很长时间没有被访问了。
下面的代码展示了LFUDecrAndReturn函数的执行逻辑你可以看下。
```
unsigned long LFUDecrAndReturn(robj *o) {
unsigned long ldt = o->lru >> 8; //获取当前键值对的上一次访问时间
unsigned long counter = o->lru & 255; //获取当前的访问次数
unsigned long num_periods = server.lfu_decay_time ? LFUTimeElapsed(ldt) / server.lfu_decay_time : 0; //计算衰减大小
if (num_periods) //如果衰减大小不为0
//如果衰减大小小于当前访问次数那么衰减后的访问次数是当前访问次数减去衰减大小否则衰减后的访问次数等于0
counter = (num_periods > counter) ? 0 : counter - num_periods;
return counter; //如果衰减大小为0则返回原来的访问次数
}
```
好了到这里updateLFU函数就通过LFUDecrAndReturn函数完成了键值对访问次数的衰减。紧接着updateLFU函数还是会基于键值对当前的这次访问来更新它的访问次数。
**第二步,根据当前访问更新访问次数。**
在这一步中updateLFU函数会调用LFULogIncr函数来增加键值对的访问次数如下所示
```
void updateLFU(robj *val) {
...
counter = LFULogIncr(counter);
...
}
```
LFULogIncr函数是在evict.c文件中实现的它的执行逻辑主要包括两个分支
* **第一个分支对应了当前访问次数等于最大值255的情况。**此时LFULogIncr函数不再增加访问次数。
* **第二个分支对应了当前访问次数小于255的情况。**此时LFULogIncr函数会计算一个阈值p以及一个取值为0到1之间的随机概率值r。如果概率r小于阈值p那么LFULogIncr函数才会将访问次数加1。否则的话LFULogIncr函数会返回当前的访问次数不做更新。
从这里你可以看到因为概率值r是随机定的所以**阈值p的大小**就决定了访问次数增加的难度。阈值p越小概率值r小于p的可能性也越小此时访问次数也越难增加相反如果阈值p越大概率值r小于p的可能性就越大访问次数就越容易增加。
而阈值p的值大小其实是由两个因素决定的。一个是当前访问次数和宏定义LFU\_INIT\_VAL的**差值baseval**另一个是redis.conf文件中定义的**配置项lfu-log-factor**。
当计算阈值p时我们是把baseval和lfu-log-factor乘积后加上1然后再取其倒数。所以baseval或者lfu-log-factor越大那么其倒数就越小也就是阈值p就越小反之阈值p就越大。也就是说这里其实就对应了两种影响因素。
* baseval的大小这反映了当前访问次数的多少。比如访问次数越多的键值对它的访问次数再增加的难度就会越大
* lfu-log-factor的大小这是可以被设置的。也就是说Redis源码提供了让我们人为调节访问次数增加难度的方法。
以下代码就展示了LFULogIncr函数的执行逻辑你可以看下。
```
uint8_t LFULogIncr(uint8_t counter) {
if (counter == 255) return 255; //访问次数已经等于255直接返回255
double r = (double)rand()/RAND_MAX; //计算一个随机数
double baseval = counter - LFU_INIT_VAL; //计算当前访问次数和初始值的差值
if (baseval < 0) baseval = 0; //差值小于0则将其设为0
double p = 1.0/(baseval*server.lfu_log_factor+1); //根据baseval和lfu_log_factor计算阈值p
if (r < p) counter++; //概率值小于阈值时,
return counter;
}
```
这样等到LFULogIncr函数执行完成后键值对的访问次数就算更新完了。
**第三步更新lru变量值。**
最后到这一步updateLFU函数已经完成了键值对访问次数的更新。接着它就会调用**LFUGetTimeInMinutes函数**来获取当前的时间戳并和更新后的访问次数组合形成最新的访问频率信息赋值给键值对的lru变量如下所示
```
void updateLFU(robj *val) {
...
val->lru = (LFUGetTimeInMinutes()<<8) | counter;
}
```
好了到这里你就了解了Redis源码在更新键值对访问频率时对于访问次数它是先按照上次访问距离当前的时长来对访问次数进行衰减。然后再按照一定概率增加访问次数。这样的设计方法就既包含了访问的时间段对访问频率的影响也避免了8 bits计数器对访问次数的影响。而对于访问时间来说Redis还会获取最新访问时间戳并更新到lru变量中。
那么最后我们再来看下Redis是如何基于LFU算法淘汰数据的。
### LFU算法淘汰数据
在实现使用LFU算法淘汰数据时Redis是采用了和实现近似LRU算法相同的方法。也就是说Redis会使用一个**全局数组EvictionPoolLRU**来保存待淘汰候选键值对集合。然后在processCommand函数处理每个命令时它会调用freeMemoryIfNeededAndSafe函数和freeMemoryIfNeeded函数来执行具体的数据淘汰流程。
这个淘汰流程我在上节课已经给你介绍过了,你可以再去整体回顾下。这里,我也再简要总结下,也就是分成三个步骤:
* 第一步调用getMaxmemoryState函数计算待释放的内存空间
* 第二步调用evictionPoolPopulate函数随机采样键值对并插入到待淘汰集合EvictionPoolLRU中
* 第三步遍历待淘汰集合EvictionPoolLRU选择实际被淘汰数据并删除。
虽然这个基本流程和LRU算法相同但是你要**注意**LFU算法在淘汰数据时在第二步的evictionPoolPopulate函数中使用了不同的方法来计算每个待淘汰键值对的空闲时间。
具体来说在实现LRU算法时待淘汰候选键值对集合EvictionPoolLRU中的每个元素都使用**成员变量idle**来记录它距离上次访问的空闲时间。
而当实现LFU算法时因为LFU算法会对访问次数进行衰减和按概率增加所以它是使用**访问次数**来近似表示访问频率的。相应的LFU算法其实是用255减去键值对的访问次数这样来计算EvictionPoolLRU数组中每个元素的idle变量值的。而且在计算idle变量值前LFU算法还会**调用LFUDecrAndReturn函数衰减一次键值对的访问次数**,以便能更加准确地反映实际选择待淘汰数据时,数据的访问频率。
下面的代码展示了LFU算法计算idle变量值的过程你可以看下。
```
if (server.maxmemory_policy & MAXMEMORY_FLAG_LRU) {
idle = estimateObjectIdleTime(o);
} else if (server.maxmemory_policy & MAXMEMORY_FLAG_LFU) {
idle = 255-LFUDecrAndReturn(o);
}
```
所以说当LFU算法按照访问频率计算了待淘汰键值对集合中每个元素的idle值后键值对访问次数越大它的idle值就越小反之idle值越大。而EvictionPoolLRU数组中的元素是按idle值从小到大来排序的。最后当freeMemoryIfNeeded函数按照idle值从大到小遍历EvictionPoolLRU数组选择实际被淘汰的键值对时它就能选出访问次数小的键值对了也就是把访问频率低的键值对淘汰出去。
这样Redis就完成了按访问频率来淘汰数据的操作了。
## 小结
这节课我主要是给你介绍了Redis使用的LFU缓存淘汰策略。LFU算法会根据键值对的访问频率来淘汰数据而和使用访问次数淘汰数据不同使用访问频率不仅需要统计访问次数而且还要考虑所记录的访问距离当前时间的时长。
所以正是基于这样的设计考虑Redis源码在实现LFU算法时在键值对的redisObject结构体中的lru变量里会同时记录访问次数和访问时间戳。当键值对被再次访问时lru变量中的访问次数会先根据上一次访问距离当前的时长执行衰减操作然后才会执行增加操作。
不过键值对的访问次数只能用lru变量中有限的8 bits来记录最大值就是255。这样一来如果每访问一次键值对访问次数就加1的话那么访问次数很容易就达到最大值了这就无法区分不同的访问频率了。
为了区分不同的访问频率LFU算法在实现时是采用了**按概率增加访问次数**的方法,也就是说,已有访问次数越大的键值对,它的访问次数就越难再增加。
另外你也要知道对于LFU算法的执行流程来说它和LRU算法的基本执行流程是相同的这包括入口函数、待释放内存空间计算、更新待淘汰候选键值对集合以及选择实际被淘汰数据这几个关键步骤。不同的是LFU算法在待淘汰键值对集合中是按照键值对的访问频率大小来排序和选择淘汰数据的这也符合LFU算法本身的要求。
而且正因为LFU算法会根据访问频率来淘汰数据以及访问频率会随时间推移而衰减所以LFU算法相比其他算法来说更容易把低频访问的冷数据尽早淘汰掉这也是它的适用场景。
最后从LFU算法的实现代码来看当我们自己实现按访问频率进行操作的软件模块时我觉得Redis采用的这两种设计方法访问次数按时间衰减和访问次数按概率增加其实是一个不错的参考范例。你在自己的实现场景中就可以借鉴使用。
## 每课一问
LFU算法在初始化键值对的访问次数时会将访问次数设置为LFU\_INIT\_VAL它的默认值是5次。那么你能结合这节课介绍的代码说说如果LFU\_INIT\_VAL设置为1会发生什么情况吗