关于HashMap的源码分析,网上已经有很多写的非常好的文章了,虽然多是基于java1.8版本以下的。Java1.8版本的HashMap源码做了些改进,理解起来更复杂点,但也不脱离其桶+链表或树的重心思想。下面贴出1.8代码的源码解析,至于更详细内容以后补充。另外补充一点大家看源码一定要看看源码开头的注释,它对我们理解源码有很大帮助。
本文代码解析围绕着 get和put操作进行。
public V get(Object key) { Node<K,V> e; return (e = getNode(hash(key), key)) == null ? null : e.value; }
final Node<K,V> getNode(int hash, Object key) { Node<K,V>[] tab; Node<K,V> first, e; int n; K k; if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) {//判断table不为null,tab.len>0且hash不为0,因为tab.len永远为二次幂 if (first.hash == hash && // always check first node//所以n-1的二进制永远是1111111…… ((k = first.key) == key || (key != null && key.equals(k))))//如果hash相同且key==或equals其中一个相等返回first return first; if ((e = first.next) != null) {//如果转为树形按此查找 if (first instanceof TreeNode) return ((TreeNode<K,V>)first).getTreeNode(hash, key); do {//一般按链式查找 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; } while ((e = e.next) != null); } } return null; }
public V put(K key, V value) { return putVal(hash(key), key, value, false, true); }
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; if ((tab = table) == null || (n = tab.length) == 0)//还没初始resize()化,resize初始化大小 n = (tab = resize()).length; if ((p = tab[i = (n - 1) & hash]) == null)//数组上没有对应节点,p为对应bucket第一个节点 tab[i] = newNode(hash, key, value, null);//直接数组赋值 else { Node<K,V> e; K k; if (p.hash == hash && //如果传入节点与第一个节点相同key,e指向第一个节点 ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode)//如果p是tree节点,e指向转型相同key的p e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else {//与第一个节点没有相同key,也不是tree节点。顺着跟节点找到链表尾端看有没有相同key,没有创建新节点,有则p指向e(与传入节点相同的节点) for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) {//e指向p.next,为null是创建新节点 p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st//如果超过tree结构转型阈值,则转型 treeifyBin(tab, hash); break; } //下列成立说明完成创建动作,退出 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } if (e != null) { // existing mapping for key //如果e不为空,说明在链表中找到了相同key的节点,将它值更改 V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold)//超过阈值扩容 resize(); afterNodeInsertion(evict); return null; }
resize()
final Node<K,V>[] resize() { Node<K,V>[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length;//原数组odlcap长度 int oldThr = threshold;/ /原阈值 int newCap, newThr = 0; if (oldCap > 0) {//如果数组长度大于0 if (oldCap >= MAXIMUM_CAPACITY) {//如果大于最大值,阈值提高,返回原数组 threshold = Integer.MAX_VALUE; return oldTab; } else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && //如果容量小于最大容量1/2,大于默认初始容量,容量加倍,新阈值=原阈值加倍。 oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold } //如果数组长度不大于0,原阈值>0,新容量等于原阈值。(注意构造Hashmap设置初始容量时,阈值一定为大于等于且最接近初始容量的2的次幂 else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; else { //数组长度不大于0,构造时也没设初始容量。 // zero initial threshold signifies using defaults newCap = DEFAULT_INITIAL_CAPACITY;//容量为默认容量 newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//新阈值=默认容量*默认负载因子 } if (newThr == 0) {//数组没初始化,构造函数设了初始容量,会有阈值,阈值=原阈值*加载因子(同上,构造时阈值一定是2的次幂。) float ft = (float)newCap * loadFactor;//新容量*加载因子 newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE);//新阈值等于ft或Integer最大值 } threshold = newThr;//阈值更改为新阈值 @SuppressWarnings({"rawtypes","unchecked"}) Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) {//如果原数组某个位置有值 oldTab[j] = null;//首先清零该值 if (e.next == null)//如果只有单值,不是链表或tree newTab[e.hash & (newCap - 1)] = e;//新数组根据hash到指定位置添加该值 else if (e instanceof TreeNode)//如果数组该位置上是tree节点,进行处理 ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // preserve order //如果是链表节点 Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; do {//这段代码主要将原数组一个桶内的链表分为两个链表(根据而二进制hash高分位数值。)。 next = e.next; if ((e.hash & oldCap) == 0) {//newCap等于oldcap*2,所以newcap在二进制中比oldcap高一位,所以hash与cap位运算时要考虑新增位上对应的hash if (loTail == null)//loHead指向该节点 //是0还是1,0保持oldcap上的位置,1则放入oldcap位置+oldcap大小 loHead = e; //的位置。 else loTail.next = e;//将低链表的节点连起来 loTail = e; } else {//如果高分位为1 if (hiTail == null)//hiHead指向e hiHead = e; else hiTail.next = e;//将高链表的节点连起来 hiTail = e; } } while ((e = next) != null);//当(e指向next)不为null时, if (loTail != null) {//将高分位0返回到原j位置中 loTail.next = null; newTab[j] = loHead; } if (hiTail != null) {//将高分位为1的返回到j+oldcap位置中 hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; }