HashMap根据键的hashCode值存储数据,大多数情况下可以直接定位到它的值,因而具有很快的访问速度,但遍历顺序却不是确定的,HashMap最多只允许一条记录的key为null,允许多条记录的value为null,HashMap非线程安全,即任一时刻可以有多个线程同时写HashMap,可能会导致数据的不一致,如果需要满足线程安全,可以用Collections的synchronizedMap方法使HashMap具有线程安全的能力,或者使用ConcurrentHashMap。大方向上,HashMap 是一个数组,然后数组中每个元素是一个单向链表,很多实体都是嵌套类Entry的实例,Entry包含四个属性:key、value、hash值和用于单向链表的next。
图为 Java 7中HashMap的结构
- capacity:当前数组容量,始终保持 2^n,可以扩容,扩容后数组大小为当前的 2 倍。
- loadFactor:负载因子,默认为 0.75。
- threshold:扩容的阈值,等于 capacity * loadFactor。
比如当前的容器容量是16,负载因子是0.75,16*0.75=12,也就是说,当容量达到了12(扩容阈yu值)的时候,容器就会扩为当前容量大小的 2倍。
负载因子是0.75的时候,空间利用率比较高,而且避免了相当多的Hash冲突,使得底层的链表或者是红黑树的高度比较低,提升了空间效率。
上面是Java 7 对HashMap的实现,在JAVA 8中,利用了红黑树,所以在JAVA 8 是由数组+链表+红黑树组成。从JAVA 7中得知,在查找元素时候,可以根据hash值快速定位到数组具体的下标,但是后面的操作需要顺着链表一个一个的比较下去才能找到所需值,时间复杂度取决于链表的长度,为O(n),为了降低这一部分处理的开销,在JAVA 8中,当链表中的元素超过8个之后,会将链表转换为红黑树,在这些位置进行查找的时候可降低时间复杂度 为O(logn),
图为 JAVA 8中HashMap的结构
HashTable是一个线程安全的遗留类,很多映射的功能跟HashMap类似,不同的是它继承Dictionary类,并且是线程安全的,任一时间只有一个线程可写HashTable,并发行不好,可以在不需要线程安全的时候替换为HashMap,需要线程安全的时候可以用ConcurrentHashMap替换。
TreeMap可排序,实现了SortedMap接口,可以把它保存的记录根据键排序,它默认是按键的升序排序,可以指定排序的比较器,当用迭代器(Iterator)遍历TreeMap时,得到的记录是排序过的。
在使用 TreeMap 时,key 必须实现 Comparable 接口或者在构造 TreeMap 传入自定义的 Comparator,否则会在运行时抛出java.lang.ClassCastException类型的异常。 参考:https://www.ibm.com/developerworks/cn/java/j-lo-tree/index.html,写的很好这个。
LinkedHashMap 是 HashMap 的一个子类,保存了记录的插入顺序,在用 Iterator 遍历 LinkedHashMap时,先得到的记录肯定是先插入的,也可以在构造时带参数,按照访问次序排序。