LRU 算法及其实现方式 | Mikez Namespace

LRU（Least Recently Used，最近最少使用）算法是一种常见的缓存淘汰算法，用于在缓存满时决定哪些数据应该被移除，以腾出空间存放新数据。LRU 基于一个简单的原则：最近最少被使用的数据最可能在未来也不会被使用，因此应当优先淘汰这些数据。

LRU 算法原理

基本思想：LRU 通过记录每个数据项的使用时间，将最近最少使用的数据淘汰出缓存。具体来说，每当访问缓存中的一个数据项时，该项的访问时间会更新为最新时间；而当需要淘汰数据时，选择最久未被访问的数据项进行删除。

实现方式

LRU 算法可以通过多种方式实现，常见的有两种：

1. 基于链表和哈希表的实现

双向链表：
- 使用一个双向链表来维护缓存中的数据，链表的头部保存最近访问的数据，链表的尾部保存最久未被访问的数据。
- 每次访问一个数据项时，将该数据项移动到链表的头部。
- 当缓存满时，将链表尾部的数据项移除。
哈希表：
- 使用一个哈希表存储缓存中的键值对，以支持 O(1) 时间复杂度的快速查找。
- 哈希表中的每个键指向双向链表中的一个节点。
操作：
- 访问数据：通过哈希表找到对应的链表节点，并将其移动到链表头部。
- 新增数据：将数据插入到链表头部，同时在哈希表中添加对应的键值对。
- 删除数据：如果缓存满，删除链表尾部节点，并在哈希表中移除对应的键。
优点：结合双向链表和哈希表的实现，能够在 O(1) 时间复杂度内完成缓存数据的访问、插入和删除操作。

2. 基于栈的实现

栈的结构：使用两个栈来实现 LRU，一个用于保存缓存数据的顺序，另一个用于辅助操作。
- 每次访问数据时，将该数据项推入栈中。
- 当缓存满时，删除栈底部的数据项，这些数据是最久未被访问的。
操作：
- 访问数据：如果数据已在栈中，找到它并将其弹出，然后重新压入栈顶。
- 新增数据：如果数据不在栈中，直接压入栈顶。
- 删除数据：缓存满时，弹出栈底的数据项。
缺点：栈的实现需要线性时间复杂度（O(n)）来查找和删除数据，因此在效率上不如基于链表和哈希表的实现。

LRU 在实际应用中的优化

Window LRU：在大规模缓存系统中，可能会采用“窗口”大小限制来优化 LRU 的性能。例如，仅追踪最近的 N 次访问，而不是整个访问历史。
LRU-K：通过记录每个数据项的前 K 次访问时间，选择最近 K 次访问中最远的一次来决定淘汰。这个策略比单一的 LRU 更能反映数据的长期访问模式。

总结

LRU 是一种经典的缓存淘汰算法，适用于那些数据访问具有时间局部性（即最近访问的数据很可能会再次访问）的场景。通过使用双向链表和哈希表，LRU 能在 O(1) 时间复杂度内高效管理缓存，但在某些高性能场景下，可能会需要进一步的优化或结合其他算法（如 LFU）来应对特殊需求。