zoukankan      html  css  js  c++  java
  • 仔细瞄一下HashMap是怎么干活的

    以下分析基于jdk11.0.2

     

    先画一张图

     

    1. 创建HashMap时发生了什么?

       HashMap(),HashMap(int initialCapacity),HashMap(int initialCapacity, float loadFactor)。这三个方法都直接或间接地会初始化loadFactor(加载因子)和threshold(扩容阈值)。其中threshold=capacity*loadFactor。

       1.1 threshold如何确定?

          当调用HashMap()创建HashMap时,threshold的值会在第一次resize()时赋值。由DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY可知threshold=0.75*16=12

          当调用HashMap(int initialCapacity)/HashMap(int initialCapacity, float loadFactor) 创建HashMap时,threshold由 loadFactor*tableSizeFor(int cap) 计算得出。

    2. 调用put(K key, V value)时发生了什么?

       int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); 

      该方法首先调用了hash()方法获取key对应的hash值,然后调用putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict)…

       2.1. hash(Object key)做了些什么?

      该方法将key的hashCode的高16位与低16位进行了一次异或位运算(hashCode为32bit的int类型)。v1.8+中该方法的实现较之前版本更容易发生hash碰撞(之前版本为4次异或运算),这是权衡性能和红黑树的优化…

       2.2. putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict)做了什么?

      该方法除了供put()调用,也提供给putIfAbsent()调用。在此暂时讨论put()调用的情况,即 boolean onlyIfAbsent=false; boolean evict=true; 

      下面列出用无参构造函数new HashMap()创建的对象进行put的几种情况:

          2.2.1. 第一次put时,执行步骤如下:

             1. 执行resize(),将map中的table初始化为大小为DEFAULT_INITIAL_CAPACITY的Node数组;threshold赋值为DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY。

             2. 使用hash, key, value创建Node节点,作为链表的头节点存于table[i]中,下标为  i = (n - 1) & hash 。

          2.2.2. 当put后table[]内节点数<=threshold(默认threshold=12,而此时table[].size也就是capacity应为16,这两个值会随着resize更新)时,执行步骤如下:

             1. 找到hash对应table[]中的链表/树

             2. 当table[]存的是链表时,把key-value存入链表尾节点或替换key对应节点的value值,并判断链表长度是否>TREEIFY_THRESHOLD(默认值8),如果是则调用treeifyBin()。调用treeifyBin()时会判断是否需要将该链表转为树。

         而在treeifyBin()方法中,只有当table[].size>=MIN_TREEIFY_CAPACITY(默认值64)会转为树,否则只是resize()扩容;而当table[]存的是树时,调用TreeNode.putTreeVal()在树中存入/替换数据。

          2.2.3. 当put后table[]内节点数>threshold时:

             执行完2.2.2的操作后,执行执行resize():capacity翻倍(<<1),threshold也重新计算。

    画了张流程图用来精简表示putVal:

      

    3. 调用resize()时发生了什么?

       在putVal途中调用有两种情况下HashMap会调用resize()进行扩容和table[]数据迁移(迁移几率50%):

       3.1. 第一次调用putVal后调用resize():

          3.1.1. 未指定initialCapacity或loadFactor值:

             创建table[],大小为DEFAULT_INITIAL_CAPACITY(默认值16);赋值threshold=DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY(默认值12)。

          3.1.2. 已指定initialCapacity或loadFactor值:

             创建容量为tableSizeFor(initialCapacity)的table[];给扩容阈值赋值 threshold = loadFactor * tableSizeFor(initialCapacity)。

             简单说明一下tableSizeFor(int cap)函数:返回值为大于等于cap且与cap差值最小的2^n的值。例如3->4,4->4,9->16,65->128。

          

       3.3. table[]内节点数>threshold时,执行步骤如下:

          3.3.1. 重新计算table[]容量capacity和扩容阈值threshold,值皆为原值的2倍(<<1),创建新table[capacity]

          3.3.2. 遍历原table[]中的链表/树,

      当链表为单节点时:将该节点放至新table[],下标为hash&(capacity-1) ;

      当链表为多节点时:遍历该链表并分离出一条需要移动位置的链表,将2条链表放至新table[]。可根据hash&oldCapacity==0判断Node是否需要移动;

      当链表为红黑树时:调用TreeNode.split()将树拆分/移动。当树的大小<=UNTREEIFY_THRESHOLD(默认6)时会退化成链表。

  • 相关阅读:
    [二分][dp] Jzoj P3463 军训
    [树状数组] Jzoj P3462 休息
    [期望] Jzoj P3459 TheSwaps
    [dp] Jzoj P3460 Mixing Chemicals
    [数位dp][状压dp] Jzoj P3458 密码
    [匈牙利] Jzoj P1156 使命的召唤
    [bfs][状压] Jzoj P2121 分球
    [dp] Jzoj P1187 最大公共子串
    [树套树] Jzoj P5699 【gdoi2018 day1】涛涛接苹果
    [枚举] Jzoj P3387 终极武器
  • 原文地址:https://www.cnblogs.com/niceboat/p/10279308.html
Copyright © 2011-2022 走看看