zoukankan      html  css  js  c++  java
  • LinkedHashMap:我还能实现LRU

    众所周知,LinkedHashMap继承自HashMap,在原先的HashMap的基础上,它增加了Entry的双向链接。

    有意思的是基于这种实现特性,LinkedHashMap 在迭代遍历时,取得键值对的顺序的依据是其插入次序或者是最近最少使用(LRU)的次序。

    LRU算法根据数据的历史访问记录来淘汰数据,其核心思想是“如果数据最近被访问过,那么将来被访问的几率也更高”,从而实现在定量缓存空间下缓存内容的管理,常用于浏览器和移动端各应用等本地缓存管理。

    通过access方式创建LinkedHashMap即可实现基本的LRU算法,可看源码中LinkedHashMap的构造函数:

    /**
         * Constructs an empty <tt>LinkedHashMap</tt> instance with the
         * specified initial capacity, load factor and ordering mode.
         *
         * @param  initialCapacity the initial capacity
         * @param  loadFactor      the load factor
         * @param  accessOrder     the ordering mode - <tt>true</tt> for
         *         access-order, <tt>false</tt> for insertion-order
         * @throws IllegalArgumentException if the initial capacity is negative
         *         or the load factor is nonpositive
         */
        public LinkedHashMap(int initialCapacity,
                             float loadFactor,
                             boolean accessOrder) {
            super(initialCapacity, loadFactor);
            this.accessOrder = accessOrder;
        }

      查看源码可知,其中LinkedHashMap的取得键值对的顺序是由其构造函数中传入的第三个参数accessOrder决定,当其为false时,即为选用插入次序;为true时,即为选用LRU的次序。

         而在我们利用LinkedHashMap实现LRU的关键在于重写下面这个方法

    protected boolean removeEldestEntry(Map.Entry<K,V> eldest) {
            return false;
        }

      下面我就使用LinkedHashMap实现LRU做了两个test。

      第一个test的目的是为了验证LinkedHashMap实现LRU的可行性,即其根据访问时间来管理内部元素的排序,具体实现如下:

    import java.util.Iterator;
    import java.util.LinkedHashMap;
    import java.util.Map;
    
    public class Test {
    
        public static void main(String[] args) {
            
            Map<Integer,Integer> map = new LinkedHashMap<>(16,0.75f,true);
            for(int i=0;i<16;i++)
                map.put(i, i);
            for(Iterator<Map.Entry<Integer, Integer>> iterator=map.entrySet().iterator();iterator.hasNext();) {
                System.out.print(iterator.next().getKey()+" ");
            }
            System.out.println();
            map.get(5);
            for(Iterator<Map.Entry<Integer, Integer>> iterator=map.entrySet().iterator();iterator.hasNext();) {
                System.out.print(iterator.next().getKey()+" ");
            }
        }
    
    } 

    输出情况如下:

    可见访问过的5确实被放到链表的末尾。

    第二个test即是一个简单的实现LRU功能的LinkedHashMap,直接贴代码:

    import java.util.Iterator;
    import java.util.LinkedHashMap;
    import java.util.Map;
    
    class LRULinkedHashMap<K,V> extends LinkedHashMap<K,V>{
        private int capacity;
        private static final long serialVersionUID=1L;
        /**
         * LRULinkedHashMap的含参构造器
         * @param capacity 指定的缓存最大容量
         */
        LRULinkedHashMap(int capacity){
            super(16,0.75f,true);
            this.capacity=capacity;
        }
        
        @Override
        /**
         * 当map中存储元素大于了最大缓存容量时,删除链表顶端元素即最近最少使用元素。
         * 输出当前最少使用的元素的键值对
         */
        protected boolean removeEldestEntry(java.util.Map.Entry<K, V> eldest) {
            // TODO 自动生成的方法存根
            System.out.println("("+eldest.getKey()+","+eldest.getValue()+")");
            return size()>capacity;
        }
        
    }
    
    public class LinkedHashMapForLRU {
        public static void main(String[] args) {
            Map<Integer, Integer>  map = new LRULinkedHashMap<Integer,Integer>(5);
            //存入7个键值对
            for(int i=0;i<7;i++) 
                map.put(i, i);
            //输出最后保存在缓存中的键值对
            for(Iterator<Map.Entry<Integer,Integer>> it = map.entrySet().iterator();it.hasNext();) {
                System.out.print(it.next().getKey()+" ");
            }
            
        }
    }

    输出情况如下:

    可见我们实现的LRULinkedHashMap确实发挥了它的作用。

    那LinkedHashMap在源码中是怎么实现LRU算法的呢?

    接下来从Map的初始化构造、put、get这三个方面结合源码展开

    初始化构造函数:

    初始化构造在前面已经提到过,这里直接贴上LinkedHashMap的几个构造函数

    public LinkedHashMap() {
            super();
            accessOrder = false;
        }

      构造一个以插入顺序排序的空LinkedHashMap,,其默认初始容量为16,并且负载系数为0.75

    public LinkedHashMap(int initialCapacity) {
            super(initialCapacity);
            accessOrder = false;
        }

      构造一个以插入顺序排序的空LinkedHashMap,,其负载系数为0.75,根据传入的参数参数决定其初始容量

     public LinkedHashMap(int initialCapacity, float loadFactor) {
            super(initialCapacity, loadFactor);
            accessOrder = false;
        }

      构建一个以插入顺序排序的空LinkedHashMap,根据传入的参数决定其初始容量和负载系数。

     public LinkedHashMap(int initialCapacity,
                             float loadFactor,
                             boolean accessOrder) {
            super(initialCapacity, loadFactor);
            this.accessOrder = accessOrder;
        }

      构建一个空LinkedHashMap,根据传入的参数决定其初始容量、负载系统及排序方式。

    public LinkedHashMap(Map<? extends K, ? extends V> m) {
            super();
            accessOrder = false;
            putMapEntries(m, false);
        }

      而最后这种构造函数则是构建一个指定Map的LinkedHashMap,默认负载系统为0.75,而初始容量则足够容纳指定的Map。

    Put:

    通过查看源码发现LinkedHashMap并没有重写父类HashMap的put方法,下面我们先看一下HashMap的put方法。

    public V put(K key, V value) {
            return putVal(hash(key), key, value, false, true);
        }

      发现它调用了putVal(hash(key), key, value, false, true),下面的即是其调用的putVal方法:

    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                       boolean evict) {
            Node<K,V>[] tab; Node<K,V> p; int n, i;
            if ((tab = table) == null || (n = tab.length) == 0)
                n = (tab = resize()).length;
            if ((p = tab[i = (n - 1) & hash]) == null)
                tab[i] = newNode(hash, key, value, null);
            else {
                Node<K,V> e; K k;
                if (p.hash == hash &&
                    ((k = p.key) == key || (key != null && key.equals(k))))
                    e = p;
                else if (p instanceof TreeNode)
                    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                else {
                    for (int binCount = 0; ; ++binCount) {
                        if ((e = p.next) == null) {
                            p.next = newNode(hash, key, value, null);
                            if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                                treeifyBin(tab, hash);
                            break;
                        }
                        if (e.hash == hash &&
                            ((k = e.key) == key || (key != null && key.equals(k))))
                            break;
                        p = e;
                    }
                }
                if (e != null) { // existing mapping for key
                    V oldValue = e.value;
                    if (!onlyIfAbsent || oldValue == null)
                        e.value = value;
                    afterNodeAccess(e);
                    return oldValue;
                }
            }
            ++modCount;
            if (++size > threshold)
                resize();
            afterNodeInsertion(evict);
            return null;
        }

    其中调用了两个关键的方法

     void afterNodeAccess(Node<K,V> p)和 void afterNodeInsertion(boolean evict),而这两个方法实现关于插入节点和节点访问的细节,
    void afterNodeInsertion(boolean evict) { // possibly remove eldest
            LinkedHashMap.Entry<K,V> first;
            if (evict && (first = head) != null && removeEldestEntry(first)) {
                K key = first.key;
                removeNode(hash(key), key, null, false, true);
            }
        }
     void afterNodeAccess(Node<K,V> e) { // move node to last
            LinkedHashMap.Entry<K,V> last;
            if (accessOrder && (last = tail) != e) {
                LinkedHashMap.Entry<K,V> p =
                    (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;
                p.after = null;
                if (b == null)
                    head = a;
                else
                    b.after = a;
                if (a != null)
                    a.before = b;
                else
                    last = b;
                if (last == null)
                    head = p;
                else {
                    p.before = last;
                    last.after = p;
                }
                tail = p;
                ++modCount;
            }
        }

    从   if (evict && (first = head) != null && removeEldestEntry(first))  ,我们就能看到了调用了  removeEldestEntry(first)。即当该方法返回为真时,会调用方法来删除链表头。

    而另一个重要的方法afterNodeAccess()则完成了在每一次节点访问后节点顺序的管理,想必这个方法会在get()方法中得到调用,下面我们就来看一下get()方法。

    get():

    LinkedHashMap重写了get()方法和getOrDefault()方法。

    public V get(Object key) {
            Node<K,V> e;
            if ((e = getNode(hash(key), key)) == null)
                return null;
            if (accessOrder)
                afterNodeAccess(e);
            return e.value;
        }
     public V getOrDefault(Object key, V defaultValue) {
           Node<K,V> e;
           if ((e = getNode(hash(key), key)) == null)
               return defaultValue;
           if (accessOrder)
               afterNodeAccess(e);
           return e.value;
       }

    对比HashMap中的get()

    public V get(Object key) {
            Node<K,V> e;
            return (e = getNode(hash(key), key)) == null ? null : e.value;
        }

    这里添加了对accessOrder的判断,即当为LRU模式下,会调用afterNodeAccess();这个方法会管理链表的排序,将最近访问过的结点放到链表末尾。

    到这里我们应该基本上理清了LinkedHashMap对LRU算法的支持的实现手段。

    即通过构造函数中的accessOrder参数来选择建Map模式,通过 afterNodeAccess(Node<K,V> p)在结点被访问后的顺序管理,

    afterNodeInsertion(boolean evict)方法实现结点插入后,根据removeEldestEntry(first)的返回结果来进行结点的删除操作。

    后记:

    当然直接继承LinkedHashMap来实现LRU,在多线程环境下极有可能会出现问题,因为LinkedHashMap不是一个线程安全的容器,所以如果我们想要基于这种容器实现并发环境下的LRU的话,需要增加线程同步的处理。

    其中一种处理方式是调用Collections.synchronizedMap()。

    而另外一种方法不通过继承来重写LinkedHashMap,而是通过组合的方式实现,并且对map的get()、put()、remove()、size()等操作进行加锁(synchronized),或者在此基础上进行同步上的优化。

     

  • 相关阅读:
    日志/异常处理(nnlog+traceback)
    Excel操作
    商品管理系统
    大乐透作业
    随机生成密码作业
    时间相关的模块
    os模块
    sys模块
    Pytho中dict(或对象)与json之间的互相转化
    Python三元表达式和列表生成式
  • 原文地址:https://www.cnblogs.com/hustzhb/p/6846461.html
Copyright © 2011-2022 走看看