zoukankan      html  css  js  c++  java
  • HashSet底层存储元素的源码分析

    此类实现 Set 接口,由哈希表(实际上是一个 HashMap 实例)支持。它不保证 set 的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用 null 元素。 

    HashSet<String> set = new HashSet<String>();
    set.add("abc");

     1      private transient HashMap<E,Object> map;
     2     /**
     7      * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
     8      * default initial capacity (16) and load factor (0.75).
     9      */
    10     public HashSet() {
    11         map = new HashMap<>();
    12     }

    点击

    HashSet

    进入 看Hash源码,证明 它确实是 由一个 HashMap 实例支持。

    众所周知,set是无序,不重复的。那么它是如何保证元素唯一性的呢?

    先看源码。点击 add方法进入。

    public boolean add(E e) {
            return map.put(e, PRESENT)==null;
        }
    public V put(K key, V value) {
            return putVal(hash(key), key, value, false, true);
        }
     1 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
     2                    boolean evict) {
     3         Node<K,V>[] tab; Node<K,V> p; int n, i;
     4         if ((tab = table) == null || (n = tab.length) == 0)
     5             n = (tab = resize()).length;
     6         if ((p = tab[i = (n - 1) & hash]) == null)
     7             tab[i] = newNode(hash, key, value, null);
     8         else {
     9             Node<K,V> e; K k;
    10             if (p.hash == hash &&
    11                 ((k = p.key) == key || (key != null && key.equals(k))))
    12                 e = p;
    13             else if (p instanceof TreeNode)
    14                 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
    15             else {
    16                 for (int binCount = 0; ; ++binCount) {
    17                     if ((e = p.next) == null) {
    18                         p.next = newNode(hash, key, value, null);
    19                         if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
    20                             treeifyBin(tab, hash);
    21                         break;
    22                     }
    23                     if (e.hash == hash &&
    24                         ((k = e.key) == key || (key != null && key.equals(k))))
    25                         break;
    26                     p = e;
    27                 }
    28             }
    29             if (e != null) { // existing mapping for key
    30                 V oldValue = e.value;
    31                 if (!onlyIfAbsent || oldValue == null)
    32                     e.value = value;
    33                 afterNodeAccess(e);
    34                 return oldValue;
    35             }
    36         }
    37         ++modCount;
    38         if (++size > threshold)
    39             resize();
    40         afterNodeInsertion(evict);
    41         return null;
    42     }
    1 static final int hash(Object key) {
    2         int h;
    3         return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    4     }

    通过以上源码,可以发现为保证唯一性。

    1.将传入的元素进行hashCode方法调用,得到该元素的hash值。拿到hash值还需要和数组的长度进行运算,获取元素存储的下标值。

    获取元素存储的下标值,尝试将传入的元素存储到对应的下标中。

    2.如果计算出来的下标中,不存在元素,则直接存储。否则执行第3步的equals方法。

    3.如果存储对象的equals方法返回true,说明是一样的,所以不存。如果返回false,说明不一样,要存储起来。

    4.使用“单链表”将存储数据链接起来。

    那么单链表是什么样子的代码呢? 

    Node<K,V> next; 这就是单链表的数据结构
     1  static class Node<K,V> implements Map.Entry<K,V> {
     2         final int hash;
     3         final K key;
     4         V value;
     5         Node<K,V> next;
     6 
     7         Node(int hash, K key, V value, Node<K,V> next) {
     8             this.hash = hash;
     9             this.key = key;
    10             this.value = value;
    11             this.next = next;
    12         }
    13 
    14         public final K getKey()        { return key; }
    15         public final V getValue()      { return value; }
    16         public final String toString() { return key + "=" + value; }
    17 
    18         public final int hashCode() {
    19             return Objects.hashCode(key) ^ Objects.hashCode(value);
    20         }
    21 
    22         public final V setValue(V newValue) {
    23             V oldValue = value;
    24             value = newValue;
    25             return oldValue;
    26         }
    27 
    28         public final boolean equals(Object o) {
    29             if (o == this)
    30                 return true;
    31             if (o instanceof Map.Entry) {
    32                 Map.Entry<?,?> e = (Map.Entry<?,?>)o;
    33                 if (Objects.equals(key, e.getKey()) &&
    34                     Objects.equals(value, e.getValue()))
    35                     return true;
    36             }
    37             return false;
    38         }
    39     }

     这个就是hashSet的存储图。其中红色的线就是链表线。

    这个单链表具体长这样的:

     最后结论:HashSet底层依赖HashMap来实现。使用Node数组与单链表来实现元素的存储。

    ps:听说jdk1.8以后当单链表大于8的长度时,会添加红黑树来实现。

  • 相关阅读:
    递归--数字黑洞--蓝桥杯
    王、后问题
    递归--简单题--求二项式值
    有问题的题
    LeetCode----994. 腐烂的橘子「深度优先搜索」
    SpringBoot ---- MyBatis Plus 入门
    Spring Boot ---- 整合 MyBatis (注解方式)
    Android笔记
    LeetCode----跳跃游戏Ⅱ「动态规划」
    2020年米哈游秋季招聘程序 B卷编程题
  • 原文地址:https://www.cnblogs.com/daiwei1981/p/9087473.html
Copyright © 2011-2022 走看看