找回密码
 立即注册
首页 业界区 业界 高效实现 LRU 缓存机制:双向链表与哈希表的结合 ...

高效实现 LRU 缓存机制:双向链表与哈希表的结合

玛凶 前天 19:54
题目:
请你设计并实现一个满足  LRU (最近最少使用) 缓存 约束的数据结构。
实现 LRUCache 类:
LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存
int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返回 -1 。
void put(int key, int value) 如果关键字 key 已经存在,则变更其数据值 value ;如果不存在,则向缓存中插入该组 key-value 。如果插入操作导致关键字数量超过 capacity ,则应该 逐出 最久未使用的关键字。
函数 get 和 put 必须以 O(1) 的平均时间复杂度运行。
输入:
["LRUCache", "put", "put", "get", "put", "get", "put", "get", "get", "get"]
[[2], [1, 1], [2, 2], [1], [3, 3], [2], [4, 4], [1], [3], [4]]
输出:
[null, null, null, 1, null, -1, null, -1, 3, 4]
解释:
LRUCache lRUCache = new LRUCache(2);
lRUCache.put(1, 1); // 缓存是 {1=1}
lRUCache.put(2, 2); // 缓存是 {1=1, 2=2}
lRUCache.get(1);    // 返回 1
lRUCache.put(3, 3); // 该操作会使得关键字 2 作废,缓存是 {1=1, 3=3}
lRUCache.get(2);    // 返回 -1 (未找到)
lRUCache.put(4, 4); // 该操作会使得关键字 1 作废,缓存是 {4=4, 3=3}
lRUCache.get(1);    // 返回 -1 (未找到)
lRUCache.get(3);    // 返回 3
lRUCache.get(4);    // 返回 4
为了实现一个满足 LRU(最近最少使用)缓存约束的数据结构,我们可以使用哈希表(HashMap)和双向链表(Doubly Linked List)的组合。如下图展示:
1.png

设计思路:
哈希表:

  • 用于存储键值对,键是 key,值是一个指向双向链表节点的指针。
  • 哈希表的查找操作时间复杂度为 O(1)。
双向链表:

  • 用于维护最近使用的顺序,链表的头部是最久未使用的节点,尾部是最近使用的节点。
  • 双向链表的插入和删除操作时间复杂度为 O(1)。
操作逻辑:

  • get (key):


  • 如果键存在,将其对应的节点移动到双向链表的尾部(表示最近使用)。
  • 返回对应的值。

  • put (key, value):


  • 如果键存在,更新其值,并将其移动到双向链表的尾部。
  • 如果键不存在,创建新节点并插入到双向链表的尾部。
  • 如果缓存容量超出限制,删除双向链表头部的节点(最久未使用的节点)。
那为什么使用双向链表,而不使用其他数据结构呢?
原因如下:
在实现 LRU(最近最少使用)缓存时,双向链表是一种非常合适的数据结构,主要原因在于它能够高效地支持以下两个关键操作:
1. 快速移动节点:

  • LRU 缓存需要频繁地将某个节点标记为“最近使用”,即将其移动到链表的尾部。
  • 双向链表允许在 O(1) 时间内完成节点的插入和删除操作,因为每个节点都有指向前一个节点和后一个节点的指针。
  • 如果使用单向链表,删除操作需要从头开始遍历找到目标节点的前一个节点,时间复杂度为 O(n)。
2. 快速访问最久未使用的节点:

  • LRU 缓存需要在缓存满时删除最久未使用的节点。
  • 双向链表的头部始终是最久未使用的节点,可以直接通过头节点访问,时间复杂度为 O(1)。
  • 如果使用其他数据结构(如数组或单向链表),找到最久未使用的节点需要遍历整个数据结构,时间复杂度为 O(n)。
虽然双向链表本身已经非常高效,但单独使用双向链表无法快速找到某个特定的键值对。因此,通常会结合哈希表来实现 LRU 缓存:

  • 哈希表:用于快速查找键值对,时间复杂度为 O(1)。
  • 双向链表:用于维护最近使用的顺序,时间复杂度为 O(1)。
    通过这种组合,get 和 put 操作都能在 O(1) 时间复杂度内完成,同时满足 LRU 缓存的所有要求。
为什么其他数据结构不够理想?
1. 数组(或动态数组,如 Java 中的 ArrayList)
优点:可以通过索引快速访问任意位置的元素。
缺点:插入和删除操作需要移动大量元素,时间复杂度为 O(n)。无法快速找到最久未使用的元素,需要遍历整个数组。
2. 单向链表
优点:插入和删除操作的时间复杂度为 O(1)。
缺点:删除操作需要找到目标节点的前一个节点,需要从头开始遍历,时间复杂度为 O(n)。无法快速访问最久未使用的节点,需要从头开始遍历。
3. 队列
优点:可以快速访问队首和队尾的元素。
缺点:无法在队列中间插入或删除元素,无法快速将某个节点移动到队尾。无法快速找到某个特定的键值对。
4. 堆(如优先队列)
优点:可以快速找到最大值或最小值。
缺点:堆的插入和删除操作的时间复杂度为 O(logn),无法在 O(1) 时间内完成。无法快速找到某个特定的键值对。
双向链表的优势总结:

  • 高效插入和删除:双向链表允许在 O(1) 时间内完成节点的插入和删除操作。
  • 快速访问最久未使用的节点:双向链表的头部始终是最久未使用的节点,可以直接访问。
  • 灵活的节点移动:可以快速将任意节点移动到链表的尾部,表示其最近被使用。
明白了为什么使用双向链表和哈希表之后,下面给出详细的算法步骤和代码来实现这道题:
数据结构设计:

  • 双向链表(Doubly Linked List):用于维护最近使用的顺序。链表的头部是最久未使用的节点,尾部是最近使用的节点。每个节点存储键值对 (key, value)。
  • 哈希表(HashMap):用于快速查找节点。键是 key,值是对应的双向链表节点。
初始化:

  • 初始化缓存容量 capacity。
  • 初始化哈希表 cache。
  • 初始化双向链表的虚拟头节点 head 和虚拟尾节点 tail,并连接它们。
  1. class LRUCache {
  2.     private final int capacity;
  3.     private final Map<Integer, Node> cache;
  4.     private final Node head;
  5.     private final Node tail;
  6.     public LRUCache(int capacity) {
  7.         this.capacity = capacity;
  8.         this.cache = new HashMap<>();
  9.         this.head = new Node(-1, -1); // 虚拟头节点
  10.         this.tail = new Node(-1, -1); // 虚拟尾节点
  11.         head.next = tail;
  12.         tail.prev = head;
  13.     }
  14. }
复制代码
算法步骤:
1. get(int key) 操作
目标:如果键存在于缓存中,返回其值,并将其标记为最近使用;如果不存在,返回 -1。
(1)查找键:

  • 在哈希表中查找键 key。
  • 如果键不存在,返回 -1。
(2)更新节点位置:

  • 如果键存在,获取对应的节点 node。
  • 将该节点从双向链表中移除(调用 _remove(node))。
  • 将该节点添加到双向链表的尾部(调用 _add(node))。
(3)返回值:返回节点的值 node.value。
  1. public int get(int key) {
  2.     if (!cache.containsKey(key)) {
  3.         return -1;
  4.     }
  5.     Node node = cache.get(key);
  6.     remove(node); // 移除旧位置
  7.     add(node);    // 添加到尾部
  8.     return node.value;
  9. }
复制代码
2. put(int key, int value) 操作
目标:插入或更新键值对,并维护缓存的容量限制。
(1)如果键存在:

  • 更新节点的值 node.value = value。
  • 将该节点从双向链表中移除(调用 _remove(node))。
(2)插入新节点:

  • 创建一个新节点 node = new Node(key, value)。
  • 将新节点添加到双向链表的尾部(调用 _add(node))。
  • 将新节点存入哈希表 cache.put(key, node)。
(3)检查容量:

  • 如果缓存大小超过容量 capacity:
  • 删除双向链表头部的节点(最久未使用的节点)。
  • 从哈希表中移除对应的键 del cache[lruNode.key]。
  1. public void put(int key, int value) {
  2.     if (cache.containsKey(key)) {
  3.         Node node = cache.get(key);
  4.         node.value = value; // 更新值
  5.         remove(node);       // 移除旧位置
  6.     } else {
  7.         Node node = new Node(key, value);
  8.         if (cache.size() >= capacity) {
  9.             // 删除最久未使用的节点(头节点的下一个)
  10.             Node lruNode = head.next;
  11.             remove(lruNode);
  12.             cache.remove(lruNode.key);
  13.         }
  14.         cache.put(key, node);
  15.     }
  16.     add(cache.get(key)); // 添加到尾部
  17. }
复制代码
3. 辅助操作
(1) remove(Node node):
从双向链表中移除指定节点。
更新前后节点的指针:
  1. node.prev.next = node.next;
  2. node.next.prev = node.prev;
复制代码
(2) add(Node node):
将节点添加到双向链表的尾部。
更新尾部节点的指针:
  1. Node prev = tail.prev;
  2. prev.next = node;
  3. tail.prev = node;
  4. node.prev = prev;
  5. node.next = tail;
复制代码
完整 Java 代码实现:
  1. import java.util.HashMap;
  2. import java.util.Map;
  3. class LRUCache {
  4.     private final int capacity;
  5.     private final Map<Integer, Node> cache;
  6.     private final Node head;
  7.     private final Node tail;
  8.     static class Node {
  9.         int key;
  10.         int value;
  11.         Node prev;
  12.         Node next;
  13.         Node(int key, int value) {
  14.             this.key = key;
  15.             this.value = value;
  16.         }
  17.     }
  18.     public LRUCache(int capacity) {
  19.         this.capacity = capacity;
  20.         this.cache = new HashMap<>();
  21.         this.head = new Node(-1, -1); // 虚拟头节点
  22.         this.tail = new Node(-1, -1); // 虚拟尾节点
  23.         head.next = tail;
  24.         tail.prev = head;
  25.     }
  26.     public int get(int key) {
  27.         if (!cache.containsKey(key)) {
  28.             return -1;
  29.         }
  30.         Node node = cache.get(key);
  31.         // 移除旧位置
  32.         remove(node);
  33.         // 添加到尾部
  34.         add(node);
  35.         return node.value;
  36.     }
  37.     public void put(int key, int value) {
  38.         if (cache.containsKey(key)) {
  39.             // 如果键存在,更新值并移除旧位置
  40.             Node node = cache.get(key);
  41.             node.value = value;
  42.             remove(node);
  43.         } else {
  44.             // 如果键不存在,创建新节点
  45.             Node node = new Node(key, value);
  46.             if (cache.size() >= capacity) {
  47.                 // 如果超出容量,删除最久未使用的节点(头节点的下一个)
  48.                 Node lruNode = head.next;
  49.                 remove(lruNode);
  50.                 cache.remove(lruNode.key);
  51.             }
  52.             cache.put(key, node);
  53.         }
  54.         // 添加到尾部
  55.         add(cache.get(key));
  56.     }
  57.     private void remove(Node node) {
  58.         // 从双向链表中移除节点
  59.         Node prev = node.prev;
  60.         Node next = node.next;
  61.         prev.next = next;
  62.         next.prev = prev;
  63.     }
  64.     private void add(Node node) {
  65.         // 将节点添加到双向链表的尾部
  66.         Node prev = tail.prev;
  67.         prev.next = node;
  68.         tail.prev = node;
  69.         node.prev = prev;
  70.         node.next = tail;
  71.     }
  72.     public static void main(String[] args) {
  73.         LRUCache lRUCache = new LRUCache(2);
  74.         lRUCache.put(1, 1); // 缓存是 {1=1}
  75.         lRUCache.put(2, 2); // 缓存是 {1=1, 2=2}
  76.         System.out.println(lRUCache.get(1)); // 返回 1
  77.         lRUCache.put(3, 3); // 该操作会使得关键字 2 作废,缓存是 {1=1, 3=3}
  78.         System.out.println(lRUCache.get(2)); // 返回 -1 (未找到)
  79.         lRUCache.put(4, 4); // 该操作会使得关键字 1 作废,缓存是 {4=4, 3=3}
  80.         System.out.println(lRUCache.get(1)); // 返回 -1 (未找到)
  81.         System.out.println(lRUCache.get(3)); // 返回 3
  82.         System.out.println(lRUCache.get(4)); // 返回 4
  83.     }
  84. }
复制代码
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册