jdk1.8 HashMap的实现

zoukankan html css js c++ java

jdk1.8 HashMap的实现
在了解HashMap之前，我们先进行位运算知识的补充

1.Java 位运算：(都是二进制的运算)
- 　　<< :相当于乘以2的倍数 --->1<<4 =1*2*2*2*2 =16
- 　　>> :相当于处以2的倍数 ----> 8>>3 = 8/8 =1
- 　　>>> :空位都用0 来补位；
- 　　2的次幂-1 的二进制低位都是1； 1-->1 3-->11 7 -->111 15-->1111
在了解ArrayList 和LinkedList 数据结构时候，我们知道arraylist 的查询数据上很快的，LinkedList 的增删速度是很快的所以--

HashMap 所使用的数据结构是综合了ArrayList 查询速度快和LinkedList 增删速度快快的优点，使用了数组加单向链表的结构进行数据的存储，再加上

在1.8 中，为了避免链表数据过于庞大，在链表数据超过一定的值之后，会将链表的结构转换为红黑树来提升效率，如下图：

所以它的内部肯定也维护了像LinkedList 一样的node 节点，只不过是单向节点,如下：Node节点维护了key,value ,hash 值，以及用于链接下一个Node 节点的next；
/** * Basic hash bin node, used for most entries. (See below for * TreeNode subclass, and in LinkedHashMap for its Entry subclass.) */ static class Node<K,V> implements Map.Entry<K,V> { final int hash; final K key; V value; Node<K,V> next; Node(int hash, K key, V value, Node<K,V> next) { this.hash = hash; this.key = key; this.value = value; this.next = next; }
那么链表在什么情况下转换成红黑树，红黑树什么时候转换为链表呢？

HashMap 提供了默认的阈值静态常量进行切换；节点数大于8时候会使用红黑树，小于6时候会使用单向链表
/** * The bin count threshold for using a tree rather than list for a * bin. Bins are converted to trees when adding an element to a * bin with at least this many nodes. The value must be greater * than 2 and should be at least 8 to mesh with assumptions in * tree removal about conversion back to plain bins upon * shrinkage. */ static final int TREEIFY_THRESHOLD = 8; /** * The bin count threshold for untreeifying a (split) bin during a * resize operation. Should be less than TREEIFY_THRESHOLD, and at * most 6 to mesh with shrinkage detection under removal. */ static final int UNTREEIFY_THRESHOLD = 6;
接下来我们揭开HashMap（1.8）的神秘面纱：

（一）.在HashMap 默认构造函数中，只进行了加载因子的初始化，不同于1.5中，在构造的时候会初始化一个16大小容量的数组；

关于加载因子上什么，这个一开始肯定很懵逼，这个我们后面说

（二）.我们直接看HashMap 的put 方法干了什么，这个了解了，其他的都迎刃而解；
- 1. 算出一个hashcode 值
　　在里面又进行了hash 函数的调用-->用于进行算出一个hash值，这一步也是一个很关键的一步，

进行了code 值的高16位与低16位的一个异或运算，>>> 应该不陌生吧，向右位移16 位，前16高位会被0补齐；

这样算出来的code值能会很好被散列的填充到数组中；
- 2.接下来就是真正的添加操作了，
-->首先是定义了一个Node 数组以及Node 对象
Node<K,V>[] tab; Node<K,V> p; int n, i;
-->在判断table 是否为空，这个table 是在HashMap的全局变量中维护，在第一使用的时候被初始化，有必要的话，会被改变大小，它的长度是2的次幂

-->第一次使用的时候肯定是空，所以 resize() 方法进行了对table 的初始化，当然了resize() 这里是进行初始化的，它的作用还有很多，下面讲；
if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length;
接下来就是 resize()方法在这里干了什么操作呢？内容很多，这里的初始化table 主要是进行了

成员变量 threshold 赋值操作：这里的加载因子0.75就起了作用了，加载因子作用就是用于标示当数组里的数据size 到达数组的大小乘以加载因子的大小时候，会进行

数组的扩充；这里就是一些默认的赋值操作；

默认的 DEFAULT_INITIAL_CAPACITY = 1 << 4; 即 1*2*2*2*2 = 16

16*0.75 =12 ，所以 newThr =12

初始化数组table 的大小：

---> 初始化完成之后，我们有了Node数组，接下来又进行了一个与运算的操作；是不是很迷茫，为什么还要进行与运算呢？

　　哈哈是为了保证数组的下标不越界，比如我们初始化的数组大小为16 ，那么下标一定要是在【0-15】之间，一般是有两种方法（只适合2的次幂），能够保证

　　命中率很高的进行元素的散列分布；不浪费数组空间，提升查询的效率

　　　　% 运算：任意一个值%16 --> 取到的值肯定是在0-16之内，不包含16；

　　　　& 与运算：（16-1）& 任意一个值--> 取到的值也肯定是在0-16 之内，不包含16；

　　　　这两种运算结果是一模一样，一般 &与运算的效率会高一些；890 % 16 等于 15& 890

---> 如果数组下标为空，直接进行数组赋值

---> 如果数组下标元素不为空，则就行链表操作

解读：当数组下标元素不为空时候，下标元素Node 维护的hash 值等于要添加进来的键的hash 且key 值相等的时候，大家都知道新值会替代旧值，源码操作如下：

保存旧值返回，新的value 替代旧的value ；

当不是红黑树的时候进行链表操作，进行一个循环（p=e）,一直向下循环取next 对象的Node 节点，如果next 返回空，然后进行链表的引用；完成链表；当然了链表

也会进行判断相同key 的 value 替换；

关于红黑树，我研究好了，再讲。。。。

3.刚才说了 resize() 进行数组初始化功能，它还有进行数组扩容，在添加元素的时候当数组元素size 大于我们设定的阈值时候，就会触发 resize() 进行数组扩容；

双倍扩容；

当然，扩容完之后，并没有结束，而是又进行了散列的重组，重新计算填充数组

重组之后元素的位置要么在原来数组的位置，要么在【原数组索引+扩容之前数组的长度】

原理如下：需要自己去好好的想，位运算；
查看全文

相关阅读:
python中break、continue 、exit() 、pass终止循环的区别
 pandas 数据处理
 分布式爬虫
 crawlSpider全站数据爬取
 scrapy 中间件
 scrapy框架的日志等级和请求传参
 scrapy 递归解析和post请求
 scrapy管道持久化存储
 scrapy框架简介和基础应用
 高性能的异步爬虫

原文地址：https://www.cnblogs.com/iscys/p/10012187.html

jdk1.8 HashMap的实现

在了解HashMap之前，我们先进行位运算知识的补充

1. 算出一个hashcode 值

2.接下来就是真正的添加操作了，

3.刚才说了 resize() 进行数组初始化功能，它还有进行数组扩容，在添加元素的时候当数组元素size 大于我们设定的阈值时候，就会触发 resize() 进行数组扩容；