clock时钟淘汰算法详解及实现 - zxlrise/cache GitHub Wiki

1、Clock 页面置换算法

1.1、为什么需要clock算法？

LRU算法的性能接近于OPT,但是实现起来比较困难，且开销大；FIFO算法实现简单，但性能差。所以操作系统的设计者尝试了很多算法，试图用比较小的开销接近LRU的性能，这类算法都是CLOCK算法的变体。由于该算法循环地检查各页面的情况，故称为CLOCK算法，又称为最近未用(Not Recently Used, NRU)算法。

1.2、基本思路

需要用到页表项的访问位（access bit），当一个页面被装入内存时，把该位初始化为0，然后如果这个页被访问（读/写）时，硬件把它置为1. 把各个页面组织成环形链表（类似钟表面），把指针指向最老的页面（最先进来）；当发生一个缺页中断，考察指针所指向的最老的页面，若它的访问为为0，则立即淘汰。若访问为1，则把该位置为0，然后指针往下移动一格。如此下去，直到找到被淘汰的页面，然后把指针移动到它的下一格。

1.3、简单的CLOCK算法

是通过给每一个访问的页面关联一个附加位(reference bit)，有些地方也叫做使用位(use bit)。他的主要思想是：当某一页装入主存时，将use bit初始化为0；如果该页之后又被访问到，使用位也还是标记成1。对于页面置换算法，候选的帧集合可以看成是一个循环缓冲区，并且有一个指针和缓冲区相关联。遇到页面替换时，指针指向缓冲区的下一帧。如果这页进入主存后发现没有空余的帧(frame)，即所有页面的使用位均为1，那么这时候从指针开始循环一个缓冲区，将之前的使用位都清0，并且留在最初的位置上，换出该桢对应的页。 ps: 这里发现没有空余的帧，会将所有使用位都清零。

1.4、例子

以下面这个页面置换过程为例，访问的页面依次是:1,2,3,4,1,2,5,1,2,3,4,5。主存有4个空闲的帧，每个页面对应的结构为(页面号，使用位)。最开始页面号1进入主存，主存里面有空闲的帧，将其使用位记成1，由于主存中之前没有页面1，所以会发生缺页中断。同理随后的页面2，3，4进入主存，将其使用位记成1，发生缺页中断。当之后的页面1，2进入主存时，由于页面1,2已经在主存中，不做处理。当之后的页面5进入主存时，主存内没有空余的帧，这时候随着指针循环移动整个缓冲区，将之前页面的使用位全部清0，即这时候页面1,2,3,4对应的使用位全部为0，指针回到最初的位置，将页面1替换出去，页面5换入主存，同时使用位标记成1。以此类推，可知CLOCK共发生10次缺页中断。

2.1、算法思想

该算法是Clock的变种。相对于Clock标志位采用的是二进制0和1表示，Gclock的标志位采用的是一个整数，意味着理论上可以一直增加到无穷大。

2.2、工作原理

当待缓存对象在缓存中时，把其标记位的值加1。同时，指针指向该对象的下一个对象。
若不在缓存中时，检查指针指向对象的标记位。如果是0，则用待缓存对象替换该对象；否则，把标记位的值减1，指针指向下一个对象。如此直到淘汰一个对象为止。由于标记位的值允许大于1，所以指针可能循环多遍才淘汰一个对象。 ps: 这个有点类似于简化版本的 LFU，统计了对应的出现次数。

3、WSclock

3.1、算法思想

该算法同样是clock的变种，可能是实际运用最广泛的算法。它采用clock的原理，是ws算法的增强版。算法数据结构为循环链表，每个缓存对象保存了"最近使用的时间"rt和"是否引用"的R标志位,使用一个周期计时器t。age表示为当前时间和rt的差值。

3.2、工作原理

当待缓存对象存在缓存中时，更新rt为当前时间。同时，指针指向该对象的下一个对象。
若不存在于缓存中时，如果缓存没满，则更新指针指向位置的rt为当前时间,R为1。同时，指针指向下一个对象。如果满了，则需要淘汰一个对象。检查指针指向的对象，

R为1，说明对象在working set中，则重置R为0，指针指向下一个对象。
R为0。如果age大于t，说明对象不在working set中，则替换该对象，并置R为1，rt为当前时间。如果age不大于t，则继续寻找淘汰对象。如果回到指针开始的位置，还未寻找到淘汰对象，则淘汰遇到的第一个R为0的对象。二次机会发改进型的CLOCK算法思路：减少修改页的缺页处理开销修改Clock算法，使它允许脏页总是在一次时钟头扫描中保留下来，同时使用脏位（dity bit,也叫写位）和使用位来指导置换

3.3、算法流程

在之前的CLOCK算法上面除了使用位(used bit)，还增加了一个修改位(modified bit)，有些地方也叫做dirty bit。现在每一页有两个状态，分别是(使用位，修改位)，可分为以下四种情况考虑： (0,0)：最近没有使用使用也没有修改，最佳状态！ (0,1)：修改过但最近没有使用，将会被写 (1,0)：使用过但没有被修改，下一轮将再次被用 (1,1)：使用过也修改过，下一轮页面置换最后的选择

3.4、例子

以下面这个页面置换过程为例：访问的页面依次是:0,1,3,6,2,4,5,2,5,0,3,1,2,5,4,1,0，其中红色数字表示将要修改的页面，即他们的modified bit将被设置成1，在下图中这些页面用斜体表示，使用位和修改位如下图所示。下面的"Fault ?"表示缺页时查找空闲frame的次数。

替换顺序

从指针当前的位置开始寻找主存中满足(使用位，修改位)为(0,0)的页面；
如果第1步没有找到满足条件的，接着寻找状态为(0,1)页面；
如果依然没有找到，指针回到最初的位置，将集合中所有页面的使用位设置成0。重复第1步，并且如果有必要，重复第2步，这样一定可以找到将要替换的页面。 4、Java实现clock算法

4.1、说明

本文主要实现一个简单版本的 clock 算法，并对常规的实现加上一定的性能优化。（全网可能是独家的，或者说第一个这么实现的）优化主要是基于性能的考虑，类似于前面对于 LRU 的性能优化，将查询操作从 O(N) 优化到 O(1)。

4.2、实现思路

我们定义一个符合当前业务场景的循环链表（这个后期也可以独立出去，有时间单独写一个数据结构项目，便于复用）定义包含 accessFlag 的节点。我们使用双向链表，而不是单向链表，这样删除的性能是最好的。使用 map 保存 key 的信息，避免循环整个链表判断 key 是否存在，用空间换取时间。

4.3、代码实现

节点定义

/**
 * 循环链表节点
 * @author binbin.hou
 * @since 0.0.15
 * @param <K> key
 * @param <V> value
 */
public class CircleListNode<K,V> {

    /**
     * 键
     * @since 0.0.15
     */
    private K key;

    /**
     * 值
     * @since 0.0.15
     */
    private V value = null;

    /**
     * 是否被访问过
     * @since 0.0.15
     */
    private boolean accessFlag = false;

    /**
     * 前一个节点
     * @since 0.0.15
     */
    private CircleListNode<K, V> pre;
    /**
     * 后一个节点
     * @since 0.0.15
     */
    private CircleListNode<K, V> next;

    //getter & setter
}

双向链表实现基本属性为了和原来的 Lru 双向链表保持一致，我们实现原来的额接口。

public class LruMapCircleList<K,V> implements ILruMap<K,V> {

    private static final Log log = LogFactory.getLog(LruMapCircleList.class);

    /**
     * 头结点
     * @since 0.0.15
     */
    private CircleListNode<K,V> head;

    /**
     * 映射 map
     * @since 0.0.15
     */
    private Map<K, CircleListNode<K,V>> indexMap;

    public LruMapCircleList() {
        // 双向循环链表
        this.head = new CircleListNode<>(null);
        this.head.next(this.head);
        this.head.pre(this.head);

        indexMap = new HashMap<>();
    }

}

初始化 Head 节点，indexMap 用户保存 key 和双向节点之间的关系。
删除元素

/**
 * 移除元素
 *
 * 1. 是否存在，不存在则忽略
 * 2. 存在则移除，从链表+map中移除
 *
 * head==>1==>2==>head
 *
 * 删除 2 之后：
 * head==>1==>head
 * @param key 元素
 * @since 0.0.15
 */
@Override
public void removeKey(final K key) {
    CircleListNode<K,V> node = indexMap.get(key);
    if(ObjectUtil.isNull(node)) {
        log.warn("对应的删除信息不存在：{}", key);
        return;
    }
    CircleListNode<K,V> pre = node.pre();
    CircleListNode<K,V> next = node.next();
    //1-->(x2)-->3  直接移除2
    pre.next(next);
    next.pre(pre);
    indexMap.remove(key);
    log.debug("Key: {} 从循环链表中移除", key);
}

节点的删除不难，直接从循环链表中移除节点即可，同时移除 indexMap 中的信息。
更新此处对于 put/get 用的是同一个方法，实际上如果想实现增强版本的 clock 算法，二者还是区分开比较好，不过个人感觉原理差不多，此处就不再实现了，估计这就是淘汰算法的最后一个小节。

/**
 * 放入元素
 *
 * 类似于 FIFO，直接放在队列的最后
 * 
 * head==>1==>head
 * 加入元素：
 *
 * head==>1==>2==>head
 *
 * （1）如果元素不存在，则直接插入。
 * 默认 accessFlag = 0;
 * （2）如果已经存在，则更新 accessFlag=1;
 *
 * @param key 元素
 * @since 0.0.15
 */
@Override
public void updateKey(final K key) {
    CircleListNode<K,V> node = indexMap.get(key);
    // 存在
    if(ObjectUtil.isNotNull(node)) {
        node.accessFlag(true);
        log.debug("节点已存在，设置节点访问标识为 true, key: {}", key);
    } else {
        // 不存在，则插入到最后
        node = new CircleListNode<>(key);
        CircleListNode<K,V> tail = head.pre();
        tail.next(node);
        node.pre(tail);
        node.next(head);
        head.pre(node);
        // 放入 indexMap 中，便于快速定位
        indexMap.put(key, node);
        log.debug("节点不存在，新增节点到链表中：{}", key);
    }
}

淘汰数据

/**
 * 删除最老的元素
 *
 * （1）从 head.next 开始遍历，如果元素 accessFlag = 0，则直接移除
 * （2）如果 accessFlag=1，则设置其值为0，循环下一个节点。
 *
 * @return 结果
 * @since 0.0.15
 */
@Override
public ICacheEntry<K, V> removeEldest() {
    //fast-fail
    if(isEmpty()) {
        log.error("当前列表为空，无法进行删除");
        throw new CacheRuntimeException("不可删除头结点!");
    }
    // 从最老的元素开始，此处直接从 head.next 开始，后续可以考虑优化记录这个 key
    CircleListNode<K,V> node = this.head;
    while (node.next() != this.head) {
        // 下一个元素
        node = node.next();
        if(!node.accessFlag()) {
            // 未访问，直接淘汰
            K key = node.key();
            this.removeKey(key);
            return CacheEntry.of(key, node.value());
        } else {
            // 设置当前 accessFlag = 0,继续下一个
            node.accessFlag(false);
        }
    }
    // 如果循环一遍都没找到，直接取第一个元素即可。
    CircleListNode<K,V> firstNode = this.head.next();
    return CacheEntry.of(firstNode.key(), firstNode.value());
}

直接遍历节点，遇到 accessFlag=0 的直接淘汰即可。如果 accessFlag=1，则设置其值为0，然后继续下一个。（这里有点免死金牌只能用一次的感觉）循环一遍都没有找到，实际上直接取 head.next 即可，降级为 FIFO。当然因为我们已经更新 accessFlag=0 了，实际上继续循环也可以。

实现的不足之处这里有一个待改进点：我们不见得每次都从开始循环。这样实际上缺点比较明显，导致越先入队的元素第二次一定被淘汰，其他未被访问的元素可能会一直存在，可以用一个元素记住这个位置。（上一次被淘汰的节点的 next 节点），感觉这样才更加符合 clock 算法的思想。还有一种方法就是不把访问过的 accessFlag 置为0，循环一圈都找不到元素直接降级为 FIFO，不过这个在大部分元素被访问之后，性能会变差。所以还是建议标记一下上次循环的位置。

4.4、调用

我们在 cache 满的时候，调用下当前循环链表即可：

import com.github.houbb.cache.api.ICache;
import com.github.houbb.cache.api.ICacheEntry;
import com.github.houbb.cache.api.ICacheEvictContext;
import com.github.houbb.cache.core.model.CacheEntry;
import com.github.houbb.cache.core.support.struct.lru.ILruMap;
import com.github.houbb.cache.core.support.struct.lru.impl.LruMapCircleList;
import com.github.houbb.log.integration.core.Log;
import com.github.houbb.log.integration.core.LogFactory;

/**
 * 淘汰策略-clock 算法
 *
 * @author binbin.hou
 * @since 0.0.15
 */
public class CacheEvictClock<K,V> extends AbstractCacheEvict<K,V> {

    private static final Log log = LogFactory.getLog(CacheEvictClock.class);

    /**
     * 循环链表
     * @since 0.0.15
     */
    private final ILruMap<K,V> circleList;

    public CacheEvictClock() {
        this.circleList = new LruMapCircleList<>();
    }

    @Override
    protected ICacheEntry<K, V> doEvict(ICacheEvictContext<K, V> context) {
        ICacheEntry<K, V> result = null;
        final ICache<K,V> cache = context.cache();
        // 超过限制，移除队尾的元素
        if(cache.size() >= context.size()) {
            ICacheEntry<K,V>  evictEntry = circleList.removeEldest();;
            // 执行缓存移除操作
            final K evictKey = evictEntry.key();
            V evictValue = cache.remove(evictKey);

            log.debug("基于 clock 算法淘汰 key：{}, value: {}", evictKey, evictValue);
            result = new CacheEntry<>(evictKey, evictValue);
        }

        return result;
    }


    /**
     * 更新信息
     * @param key 元素
     * @since 0.0.15
     */
    @Override
    public void updateKey(final K key) {
        this.circleList.updateKey(key);
    }

    /**
     * 移除元素
     *
     * @param key 元素
     * @since 0.0.15
     */
    @Override
    public void removeKey(final K key) {
        this.circleList.removeKey(key);
    }

}

其实调用的地方没什么难度，就是直接调用下方法即可。

4.5、测试

好的，代码写完我们来简单的验证一下。
测试代码

ICache<String, String> cache = CacheBs.<String,String>newInstance()
        .size(3)
        .evict(CacheEvicts.<String, String>clock())
        .build();
cache.put("A", "hello");
cache.put("B", "world");
cache.put("C", "FIFO");
// 访问一次A
cache.get("A");
cache.put("D", "LRU");
Assert.assertEquals(3, cache.size());
System.out.println(cache.keySet());

日志

[DEBUG] [2020-10-07 11:32:55.396] [main] [c.g.h.c.c.s.s.l.i.LruMapCircleList.updateKey] - 节点不存在，新增节点到链表中：A
[DEBUG] [2020-10-07 11:32:55.398] [main] [c.g.h.c.c.s.s.l.i.LruMapCircleList.updateKey] - 节点不存在，新增节点到链表中：B
[DEBUG] [2020-10-07 11:32:55.401] [main] [c.g.h.c.c.s.s.l.i.LruMapCircleList.updateKey] - 节点不存在，新增节点到链表中：C
[DEBUG] [2020-10-07 11:32:55.403] [main] [c.g.h.c.c.s.s.l.i.LruMapCircleList.updateKey] - 节点已存在，设置节点访问标识为 true, key: A
[DEBUG] [2020-10-07 11:32:55.404] [main] [c.g.h.c.c.s.s.l.i.LruMapCircleList.removeKey] - Key: B 从循环链表中移除
[DEBUG] [2020-10-07 11:32:55.406] [main] [c.g.h.c.c.s.e.CacheEvictClock.doEvict] - 基于 clock 算法淘汰 key：B, value: world
[DEBUG] [2020-10-07 11:32:55.410] [main] [c.g.h.c.c.s.l.r.CacheRemoveListener.listen] - Remove key: B, value: world, type: evict
[DEBUG] [2020-10-07 11:32:55.411] [main] [c.g.h.c.c.s.s.l.i.LruMapCircleList.updateKey] - 节点不存在，新增节点到链表中：D
[D, A, C]

5、LRU、FIFO与Clock的比较

LRU和FIFO本质都是先进先出的思路，但LRU是针对页面的最近访问时间来进行排序，所以需要在每一次页面访问的时候动态的调整各个页面之间的先后顺序（每一个页面的最近访问时间变了）；而FIFO针对页面进入内存的时间来进行排序，这个时间是固定不变的，所以页面之间的先后顺序是固定不变的。如果程序局部性，则LRU会很好。如果内存中所有页面都没有被访问过会退化为FIFO（如页面进入内存后没有被访问，最近访问时间与进入内存的时间相同）。 LRU算法性能较好，但系统开销较大；FIFO算法的系统的开销较小，但可能发生Belady现象。因此，择衷的办法就是Clock算法，在每一次页面访问时，它不必去动态调整页面在链表中的顺序，而仅仅是做一个标记，等待发生缺页中断的时候，再把它移动到链表的末尾。对于内存当中未被访问的页面，Clock算法的表现与LRU一样好，而对于那些曾经访问过的页面，它不能像LRU那样记住它们的准确访问顺序。