zoukankan      html  css  js  c++  java
  • 深入理解HashMap和TreeMap的区别

    深入理解HashMap和TreeMap的区别

    简介

    HashMap和TreeMap是Map家族中非常常用的两个类,两个类在使用上和本质上有什么区别呢?本文将从这两个方面进行深入的探讨,希望能揭露其本质。

    HashMap和TreeMap本质区别

    先看HashMap的定义:

    public class HashMap<K,V> extends AbstractMap<K,V>
        implements Map<K,V>, Cloneable, Serializable
    

    再看TreeMap的定义:

    public class TreeMap<K,V>
        extends AbstractMap<K,V>
        implements NavigableMap<K,V>, Cloneable, java.io.Serializable
    

    从类的定义来看,HashMap和TreeMap都继承自AbstractMap,不同的是HashMap实现的是Map接口,而TreeMap实现的是NavigableMap接口。NavigableMap是SortedMap的一种,实现了对Map中key的排序。

    这样两者的第一个区别就出来了,TreeMap是排序的而HashMap不是。

    再看看HashMap和TreeMap的构造函数的区别。

    public HashMap(int initialCapacity, float loadFactor) 
    

    HashMap除了默认的无参构造函数之外,还可以接受两个参数initialCapacity和loadFactor。

    HashMap的底层结构是Node的数组:

    transient Node<K,V>[] table
    

    initialCapacity就是这个table的初始容量。如果大家不传initialCapacity,HashMap提供了一个默认的值:

    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    

    当HashMap中存储的数据过多的时候,table数组就会被装满,这时候就需要扩容,HashMap的扩容是以2的倍数来进行的。而loadFactor就指定了什么时候需要进行扩容操作。默认的loadFactor是0.75。

    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    

    再来看几个非常有趣的变量:

    static final int TREEIFY_THRESHOLD = 8;
    static final int UNTREEIFY_THRESHOLD = 6;
    static final int MIN_TREEIFY_CAPACITY = 64;
    

    上面的三个变量有什么用呢?在java 8之前,HashMap解决hashcode冲突的方法是采用链表的形式,为了提升效率,java 8将其转成了TreeNode。什么时候会发送这个转换呢?

    这时候就要看这两个变量TREEIFY_THRESHOLD和UNTREEIFY_THRESHOLD。

    有的同学可能发现了,TREEIFY_THRESHOLD为什么比UNTREEIFY_THRESHOLD大2呢?其实这个问题我也不知道,但是你看源代码的话,用到UNTREEIFY_THRESHOLD时候,都用的是<=,而用到TREEIFY_THRESHOLD的时候,都用的是>= TREEIFY_THRESHOLD - 1,所以这两个变量在本质上是一样的。

    MIN_TREEIFY_CAPACITY表示的是如果table转换TreeNode的最小容量,只有capacity >= MIN_TREEIFY_CAPACITY的时候才允许TreeNode的转换。

    TreeMap和HashMap不同的是,TreeMap的底层是一个Entry:

    private transient Entry<K,V> root
    

    他的实现是一个红黑树,方便用来遍历和搜索。

    TreeMap的构造函数可以传入一个Comparator,实现自定义的比较方法。

    public TreeMap(Comparator<? super K> comparator) {
            this.comparator = comparator;
        }
    

    如果不提供自定义的比较方法,则使用的是key的natural order。

    排序区别

    我们讲完两者的本质之后,现在举例说明,先看下两者对排序的区别:

        @Test
        public void withOrder(){
            Map<String, String> books = new HashMap<>();
            books.put("bob", "books");
            books.put("c", "concurrent");
            books.put("a", "a lock");
            log.info("{}",books);
        }
    
        @Test
        public void withOrder(){
            Map<String, String> books = new TreeMap<>();
            books.put("bob", "books");
            books.put("c", "concurrent");
            books.put("a", "a lock");
            log.info("{}",books);
        }
    

    同样的代码,一个使用了HashMap,一个使用了TreeMap,我们会发现TreeMap输出的结果是排好序的,而HashMap的输出结果是不定的。

    Null值的区别

    HashMap可以允许一个null key和多个null value。而TreeMap不允许null key,但是可以允许多个null value。

        @Test
        public void withNull() {
            Map<String, String> hashmap = new HashMap<>();
            hashmap.put(null, null);
            log.info("{}",hashmap);
        }
    
        @Test
        public void withNull() {
            Map<String, String> hashmap = new TreeMap<>();
            hashmap.put(null, null);
            log.info("{}",hashmap);
        }
    

    HashMap会报出: NullPointerException。

    性能区别

    HashMap的底层是Array,所以HashMap在添加,查找,删除等方法上面速度会非常快。而TreeMap的底层是一个Tree结构,所以速度会比较慢。

    另外HashMap因为要保存一个Array,所以会造成空间的浪费,而TreeMap只保存要保持的节点,所以占用的空间比较小。

    HashMap如果出现hash冲突的话,效率会变差,不过在java 8进行TreeNode转换之后,效率有很大的提升。

    TreeMap在添加和删除节点的时候会进行重排序,会对性能有所影响。

    共同点

    两者都不允许duplicate key,两者都不是线程安全的。

    本文的例子https://github.com/ddean2009/learn-java-collections

    欢迎关注我的公众号:程序那些事,更多精彩等着您!
    更多内容请访问 www.flydean.com

  • 相关阅读:
    3.1 history跳转页面产生跨域问题
    2021年6月7日 团队冲刺第二阶段04
    2021年6月6日 团队冲刺第二阶段03
    2021年6月5日 团队冲刺第二阶段02
    2021年6月4日 团队冲刺第二阶段01
    2021年6月3日
    2021年6月2日
    2021年6月1日
    2021年5月31日
    2021年5月30日
  • 原文地址:https://www.cnblogs.com/flydean/p/hashmap-vs-treemap.html
Copyright © 2011-2022 走看看