一、前言
上个月花了点时间研究了一下HashMap
的源码,对HashMap
的实现原理有了一个较为深入的了解,今天突然想到有一个常考的面试题——HashMap
与Hashtable
的区别,于是又花了点时间研究了一下Hashtable
的源码。今天这篇博客就来简单介绍一下两者的区别,以下内容将主要从Hashtable
的角度,描述它和HashMap
有什么不同,而且将分两个方面来叙述——使用方面和实现细节方面。如果对HashMap
不是很了解的,可以阅读一下这篇博客:HashMap源码解读——深入理解HashMap高效的原因。
二、正文
2.1 使用上的不同
(1)Hashtable线程安全,HashMap线程不安全
这是这两个容器最根本的区别。HashMap
是一个线程不安全的容器,它并没有实现线程同步,所以不应该在多线程的环境下使用。而Hashtable
实现了线程同步,是一个线程安全的容器,但是它实现同步的方式比较拙劣——直接在大部分的public方法上添加synchronized关键字进行同步,这样对于同一个Hashtable
对象,每次只能有一个线程调用它的实例方法。这种拙劣的同步方式使得Hashtable
的效率要远远低于HashMap
,而且在很多情况下,这种同步是没有意义的,比如在没有写操作发生的情况下,完全可以多个线程同时对Hashtable
进行读操作,并不会造成危害。
(2)Hashtable不允许key或value为null,HashMap可以
在Hashtable
的很多方法中(比如put
方法),特判了value
为null
的情况,此时将直接抛出一个NullPointerException
;而对于key
为null
的情况却没有特判,但是若在其中加入一个key
为null
的元素,依旧会抛出NullPointerException
,因为Hashtable
中获取key
的hash
值是直接调用key.hashCode
方法,所有key
不能为null
。我们看Hashtable
中的put
方法即可知晓(多余的代码被删除):
public synchronized V put(K key, V value) {
// Make sure the value is not null
if (value == null) {
throw new NullPointerException();
}
// ......
int hash = key.hashCode();
// ......
}
但是HashMap
中,无论是key
还是value
,都可以为null
,因为它对null
做了特殊处理。HashMap
实现中,判断key
为null
,则不会调用key.hashCode
获取它的hash
值,而是将0
作为它的hash
值;而在get
方法获取value
时,如果找到的节点为null
,则直接返回null
,否则返回node.value
。同样看HashMap
中的两段代码来验证这一点:
// 此方法为HashMap中获取key的hash值的方法,特判了key == null的情况
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
// HashMap中的get方法,特判了value为null的情况
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
2.2 实现细节上的不同
(1)Hashtable使用头插法,JDK1.8之后的HashMap使用尾插法
先简单说一说什么是头插和尾插:
- 头插法:在链表中插入一个新的节点时,将新节点作为链表的头节点,然后将新节点的
next
指向旧头节点; - 尾插法:在链表中插入一个新的节点时,让链表的尾节点的
next
指向新节点;
Hashtable
使用的是头插法,而HashMap
在JDK1.8
之前,使用的也是头插法。但是,有人发现在并发情况下,若没有进行线程同步,头插法有很小的概率会导致死循环(这个问题我就不展开描述了,可以自己去查一查),于是从JDK1.8
开始,为HashMap
添加节点改为了尾插法。
(2)HashMap的容量必须是2^n,而Hashtable的容量没有这个限制
这是两者之间非常大的一个区别,就这一点,让HashMap
和Hashtble
在实现上有很大的不同。HashMap
的容量一定是2^n
,其原因我在前言中推荐的博客里面做了详细的描述,这里就简单说一下。容量定为2^n
是为了对取余运算做优化,因为2^n
满足一个性质:
num % 2^n == num & (2^n - 1)
不论是HashMap
还是Hashtable
,要获取节点在数组中的下标,都需要用key
的hash
值对数组长度取余,而HashMap
将数组长度限制为2^n
,就是为了用上面公式中的&
替代%
进行取余操作,因为&
的效率要比%
更高,而获取下标又是一个频繁的操作,所以这一步优化让HashMap
的查找速度有了很大的提升。而在Hashtable
中,就是直接用%
取余。我们看两者取余的源码:
// HashMap中的取余:tab为存放节点的数组,n为数组长度,hash变量存的是key的哈希值
// 这一步就是获取哈希值为hash的key在tab中的位置
// HashMap中的hash值不会是负数,因为HashMap中自己实现了hash方法求hash值
tab[(n - 1) & hash]
// Hashtable中的取余:hash & 0x7FFFFFFF其实就是取hash的绝对值,然后直接对tab.length取余
// 0x7FFFFFFF转换成二进制就是第一位为0,后31位为1,这个操作也就是将符号位转为0(第一位为符号位),
// 而二进制中,符号位为0表示表示正数,这一步是防止计算出负数的下标,因为hash值可能为负
// 不用Math.abs是因为Math.abs(Integer.MAX_VALUE)越界,结果还是负数
int index = (hash & 0x7FFFFFFF) % tab.length;
而正是这个优化,导致了HashMap
和Hashtable
的许多其他区别:
HashMap
的默认初始容量为16
,也就是2^4
,如果指定了一个容量,则HashMap
不会直接用它,而是先找出第一个大于这个指定容量的2^n
;而Hashtable
的默认初始容量是11
,11
是一个质数,根据hash
求下标时,质数能够让下标分配更加均匀,Hashtable
会直接接收指定的初始容量;HashMap
扩容时直接将数组大小乘2
,因为(2^n)×2 == 2^(n+1)
,仍然满足2^n
;而Hashtable
扩容是乘2加1
,因为这样可以让一个质数很大概率还是一个质数;
(3)JDK1.8开始,HashMap结构变为数组+链表+红黑树
在JDK1.7
以前,HashMap
和Hashtable
的结构都是数组+链表的实现,但是从JDK1.8
开始,HashMap
变成了数组+链表+红黑树。这是因为,在hash
取余的结果不均匀的情况下,节点可能集中在数组中的某几条链表上,导致链表过长。比如举一个极端的例子,所有的节点通过hash
值计算出的下标都相等,此时所有的节点都在一条链表上,这个时候HashMap
或者Hashtable
就退化成了一个链表,查询的时间复杂度退化为了O(n)
。为了避免这种情况的发生,从JDK1.8
开始,HashMap
中若某条链表的节点数达到了8
个,就会将这条链表转换为红黑树,此时,对这条链表的查询效率就从O(n)
提升为O(logn)
。而Hashtable
作为一个已经过时的容器,自然不会花时间对它进行复杂的优化。
三、总结
Hashtable
是一个过时的容器,在开发当中,我们应该少去使用它,甚至根本不要使用它。在单线程的环境下,我们最好使用HashMap
,而在多线程的环境下,应该使用ConcurrentHashMap
,它的效率要远远高于Hashtable
。上面最后提到的几点都和HashMap的实现有关,建议阅读我在前言中推荐的博客,了解HashMap
的具体实现。