zoukankan      html  css  js  c++  java
  • Java基础随笔3

    转载自https://github.com/crossoverJie/Java-Interview/blob/master/MD/HashMap.md

    HashMap 底层分析

    以下基于 JDK1.7 分析。

    如图所示,HashMap 底层是基于数组和链表实现的。其中有两个重要的参数:

    • 容量
    • 负载因子

    容量的默认大小是 16,负载因子是 0.75,当 HashMap 的 size > 16*0.75 时就会发生扩容(容量和负载因子都可以自由调整)。

    put 方法

    首先会将传入的 Key 做 hash 运算计算出 hashcode,然后根据数组长度取模计算出在数组中的 index 下标。

    由于在计算中位运算比取模运算效率高的多,所以 HashMap 规定数组的长度为 2^n 。这样用 2^n - 1 做位运算与取模效果一致,并且效率还要高出许多。

    由于数组的长度有限,所以难免会出现不同的 Key 通过运算得到的 index 相同,这种情况可以利用链表来解决,HashMap 会在 table[index]处形成环形链表,采用头插法将数据插入到链表中。

    get 方法

    get 和 put 类似,也是将传入的 Key 计算出 index ,如果该位置上是一个链表就需要遍历整个链表,通过 key.equals(k) 来找到对应的元素。

    遍历方式

     Iterator<Map.Entry<String, Integer>> entryIterator = map.entrySet().iterator();
            while (entryIterator.hasNext()) {
                Map.Entry<String, Integer> next = entryIterator.next();
                System.out.println("key=" + next.getKey() + " value=" + next.getValue());
            }
    Iterator<String> iterator = map.keySet().iterator();
            while (iterator.hasNext()){
                String key = iterator.next();
                System.out.println("key=" + key + " value=" + map.get(key));
    
            }
    map.forEach((key,value)->{
        System.out.println("key=" + key + " value=" + value);
    });

    强烈建议使用第一种 EntrySet 进行遍历。

    第一种可以把 key value 同时取出,第二种还得需要通过 key 取一次 value,效率较低, 第三种需要 JDK1.8 以上,通过外层遍历 table,内层遍历链表或红黑树。

    notice

    在并发环境下使用 HashMap 容易出现死循环。

    并发场景发生扩容,调用 resize() 方法里的 rehash() 时,容易出现环形链表。这样当获取一个不存在的 key 时,计算出的 index 正好是环形链表的下标时就会出现死循环。

    所以 HashMap 只能在单线程中使用,并且尽量的预设容量,尽可能的减少扩容。

    在 JDK1.8 中对 HashMap 进行了优化: 当 hash 碰撞之后写入链表的长度超过了阈值(默认为8),链表将会转换为红黑树。

    假设 hash 冲突非常严重,一个数组后面接了很长的链表,此时重新的时间复杂度就是 O(n) 。

    如果是红黑树,时间复杂度就是 O(logn) 。

    大大提高了查询效率。

    多线程场景下推荐使用 ConcurrentHashMap

    HashSet

    HashSet 是一个不允许存储重复元素的集合,它的实现比较简单,只要理解了 HashMapHashSet 就水到渠成了。

    成员变量

    首先了解下 HashSet 的成员变量:

        private transient HashMap<E,Object> map;
    
        // Dummy value to associate with an Object in the backing Map
        private static final Object PRESENT = new Object();

    发现主要就两个变量:

    • map :用于存放最终数据的。
    • PRESENT :是所有写入 map 的 value 值。

    构造函数

        public HashSet() {
            map = new HashMap<>();
        }
        
        public HashSet(int initialCapacity, float loadFactor) {
            map = new HashMap<>(initialCapacity, loadFactor);
        }    

    构造函数很简单,利用了 HashMap 初始化了 map 。

    add

        public boolean add(E e) {
            return map.put(e, PRESENT)==null;
        }

    比较关键的就是这个 add() 方法。 可以看出它是将存放的对象当做了 HashMap 的健,value 都是相同的 PRESENT 。由于 HashMap 的 key 是不能重复的,所以每当有重复的值写入到 HashSet 时,value 会被覆盖,但 key 不会收到影响,这样就保证了 HashSet 中只能存放不重复的元素。

    总结

    HashSet 的原理比较简单,几乎全部借助于 HashMap 来实现的。

    所以 HashMap 会出现的问题 HashSet 依然不能避免。

    ——————————————————————————————————————————————————————————————————————————————————————

    补充:

    HashMap 是一个散列表,它存储的内容是键值对(key-value)映射。
    HashMap 继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口。
    HashMap 的实现不是同步的,这意味着它不是线程安全的。它的key、value都可以为null。此外,HashMap中的映射不是有序的。

  • 相关阅读:
    利用matplotlib进行数据可视化
    《操作系统》课程笔记(Ch11-文件系统实现)
    《操作系统》课程笔记(Ch10-文件系统)
    《数据库原理》课程笔记 (Ch06-查询处理和优化)
    《计算机网络》课程笔记 (Ch05-网络层:控制平面)
    《计算机网络》课程笔记 (Ch04-网络层:数据平面)
    《计算机网络》课程笔记 (Ch03-运输层)
    东南大学《软件测试》课程复习笔记
    《数据库原理》课程笔记 (Ch05-数据库存储结构)
    《操作系统》课程笔记(Ch09-虚拟内存)
  • 原文地址:https://www.cnblogs.com/Aurel1ano/p/9187414.html
Copyright © 2011-2022 走看看