HashMap基本介绍

zoukankan html css js c++ java

HashMap基本介绍

1.HashMap简介（本文是按照JDK1.8进行解析）

HashMap位于JDK自带jar包rt.jar的java.util目录下。 HashMap是一个散列表，存储的内容是键值对<key,value>映射。

HashMap继承于AbstractMap，实现了Map、Cloneable、Serializable接口 HashMap是线程不安全的，其中key、value都可以为null，且是无序的。

2.HashMap的数据结构

通常的数据结构有数组和链表两种，他们各有优缺点。

数组：如下图示：

数组的存储区间是连续的，即使对应位置值为空也需要分配内存，所以占用内存较多，但是数组查找数据很容易，只需要知道对应的下标值即可，二分查找时间复杂度为O(1)；

但是数组新增和删除元素比较复杂，比如现在需要删除下标为3的Arr4，下标为3后面的元素全部需要左移一位，在下标为3后面插入一条数据同理，后面的数据全部需要右移。

总结

数组的优点是：查找容易

数组的缺点是：新增和删除复杂、占用内存严重

链表：如下图示：

链表的存储区间很离散，占用内存的数据都是有效数据，占用内存较少，插入数据容易，比如在节点2和节点3之间插入一条数据，只需将节点2的next指向新节点，新节点的next指向节点3即可；

删除节点3，则值需将节点2的next指向节点4即可，都不影响其他的节点，但是如果需要查询一个节点比较困难，需要从节点1开始遍历每个节点，才可以找到需要查询的节点位置。

总结

链表的优点是：新增和删除容易、占用内存较少

链表的缺点是：查询比较复杂

而HashMap是综合了数组和链表的特性，实现了即查询容易，插入和删除也容易的数据结构；如下图示：

可见HashMap的数据结构其实还是数组，只是数组里存储的数据是一个链表。

那么HashMap是怎么做到的呢？

首先HashMap需要有一个链表的线性数组，Node<K,V>[] table

Node是HashMap的内部类，存储在数组指定位置的节点，主要属性有hash、key、value和next

接下来再分析下HashMap是怎么工作的？

1.HashMap初始化

HashMap主要有四个构造方法，主要是初始化HashMap的loadFactor（加载因子）和threshold （扩容长度）

loadFactor是HashMap的加载因子，默认是0.75，HashMap默认长度是16，当HashMap中存入的数据长度达到总长度size*loadFactor的时候就需要开始扩容，

也就是说当HashMap使用到12的时候就需要开始扩容，默认是对数组进行2倍的扩容，扩容后的总长度table的长度，threshold就等于当前总长度的 * loadFactor。

2.put的流程

当HashMap存入数据调用put方法，先根据传入的key值，取对应的哈希码，获取到一个int类型的hash值，这个hash值对应的数字就是该数据需要存入到数组对应的下标位置，

如存入一个key通过计算得到hash值为2，则该数据就存入table[2]中。这里会有两种情况，一种是插入之前table[2]的位置还没有存入数据，则直接将数据存入table[2]的位置，当是如果

此时table[2]的位置已经存有数据，则通过链表的形式，将数据插入到table[2]的链表尾，如下图示：

当key获取到的hash值对应的位置已经存在数据的时候，不是立马将数据存入到对应链表的尾部，而是先判断这个key是否已经存在table中，比如现在再重新put一遍<"赵五","30岁">，通过key的hash值知道需要放在table[1]的位置，那么会从链表头开始挨个判断key值是否等于当前的key值，如果两个key和hash值都相等，则不会加入到链表尾，而是直接更新value值

3.get的流程

现在由于知道了HashMap是如何存入数据的，现在从HashMap取数据就相对比较容易理解了，先是通过key取对应的hash值，就可以很容易定位到数据是存在table的那个位置，如果对应的位置链表长度只有1，且key相等，则取出value；如果链表长度不为1，则遍历链表，挨个判断key是否等于需要查找的key，找到了便返回对应的value

4.扩容resize的流程

当HashMap一直put操作，HashMap容量是有限的，就需要进行扩容，HashMap会有一个阈值，就是当前数组的长度 * 加载因子(默认是0.75)

由于数组是无法自动扩容的，所以需要创建新的数组来替换旧的数组。如果不进行扩容，还是默认的长度16的话，如果插入160条数据的话，那么数组每一个位置的链表长度平均都为10，会影响查询的效率；

hashMap扩容的时候默认是对当前数组进行2倍扩容，也就是默认是长度为16，则扩容一次后长度为32,扩容两次就是64。

另外扩容之后原先的table中的数据位置可能会进行改变，因为通过hash值获取到的位置可能已经不再是原来的位置了，每个元素都需要重新计算新的位置，所以resize方法是比较消耗性能的。

tips：

1.HashMap的长度和HashMap中的数组长度是两个概念，比如新建一个HashMap，put一条数据，此时数组的长度是默认的16，而HashMap的size则为1.

如果put进10条数据，且10条数据的hash值都一样，则会存入数组的同一个链表下，此时数组只有一个位置存有数据，但是HashMap的size则为10

查看全文

相关阅读:
UI Automation
TextBlock can't be find in DataTemplate when use Coded UI Test
windows Phone本地化
 需要反射时使用dynamic
npm发包流程
 mockjs介绍
 oracle job不自动执行，手动可以执行
 第一章线性结构顺序存储结构
 Java连接MySQL数据库
 阿里云服务器部署Java开发环境JDK和mysql

原文地址：https://www.cnblogs.com/jackion5/p/9474505.html