zoukankan      html  css  js  c++  java
  • HashMap的底层实现原理? HashMap 和 Hashtable的异同? 负载因子值的大小,对HashMap有什么影响?

     1. HashMap的底层实现原理

          HashMap的底层:数组+链表 (jdk7及之前)

                        数组+链表+红黑树 (jdk 8)

    HashMap的底层实现原理?以jdk7为例说明:
          HashMap map = new HashMap():
    在实例化以后,底层创建了长度是16的一维数组Entry[] table。
    ...可能已经执行过多次put...
    map.put(key1,value1):
    首先,调用key1所在类的hashCode()计算key1哈希值,此哈希值经过某种算法计算以后,得到在Entry数组中的存放位置。
    如果此位置上的数据为空,此时的key1-value1添加成功。 ----情况1
    如果此位置上的数据不为空,(意味着此位置上存在一个或多个数据(以链表形式存在)),比较key1和已经存在的一个或多个数据
    的哈希值:
    如果key1的哈希值与已经存在的数据的哈希值都不相同,此时key1-value1添加成功。----情况2
    如果key1的哈希值和已经存在的某一个数据(key2-value2)的哈希值相同,继续比较:调用key1所在类的equals(key2)方法,比较:
    如果equals()返回false:此时key1-value1添加成功。----情况3
    如果equals()返回true:使用value1替换value2。

    补充:关于情况2和情况3:此时key1-value1和原来的数据以链表的方式存储。

    在不断的添加过程中,会涉及到扩容问题,当超出临界值(且要存放的位置非空)时,扩容。默认的扩容方式:扩容为原来容量的2倍,并将原有的数据复制过来。

    jdk8 相较于jdk7在底层实现方面的不同:
    1. new HashMap():底层没有创建一个长度为16的数组
    2. jdk 8底层的数组是:Node[],而非Entry[]
    3. 首次调用put()方法时,底层创建长度为16的数组
    4. jdk7底层结构只有:数组+链表。jdk8中底层结构:数组+链表+红黑树。
    4.1 形成链表时,七上八下(jdk7:新的元素指向旧的元素。jdk8:旧的元素指向新的元素)
    4.2 当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时,此时此索引位置上的所数据改为使用红黑树存储。

    DEFAULT_INITIAL_CAPACITY : HashMap的默认容量,16
    DEFAULT_LOAD_FACTOR:HashMap的默认加载因子:0.75
    threshold:扩容的临界值,=容量*填充因子:16 * 0.75 => 12
    TREEIFY_THRESHOLD:Bucket中链表长度大于该默认值,转化为红黑树:8
    MIN_TREEIFY_CAPACITY:桶中的Node被树化时最小的hash表容量:64



    2.HashMap 和 Hashtable的异同?
    *  |----Map:双列数据,存储key-value对的数据   ---类似于高中的函数:y = f(x)
    * |----HashMap:作为Map的主要实现类;线程不安全的,效率高;存储null的key和value
    * |----LinkedHashMap:保证在遍历map元素时,可以按照添加的顺序实现遍历。
    * 原因:在原有的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素。
    * 对于频繁的遍历操作,此类执行效率高于HashMap。
    * |----TreeMap:保证按照添加的key-value对进行排序,实现排序遍历。此时考虑key的自然排序或定制排序
    * 底层使用红黑树
    * |----Hashtable:作为古老的实现类;线程安全的,效率低;不能存储null的key和value
    * |----Properties:常用来处理配置文件。key和value都是String类型




    3.负载因子值的大小,对HashMap有什么影响?

     负载因子的大小决定了HashMap的数据密度。
     负载因子越大密度越大,发生碰撞的几率越高,数组中的链表越容易长,
    造成查询或插入时的比较次数增多,性能会下降。
     负载因子越小,就越容易触发扩容,数据密度也越小,意味着发生碰撞的
    几率越小,数组中的链表也就越短,查询和插入时比较的次数也越小,性
    能会更高。但是会浪费一定的内容空间。而且经常扩容也会影响性能,建
    议初始化预设大一点的空间。
     按照其他语言的参考及研究经验,会考虑将负载因子设置为0.7~0.75,此
    时平均检索长度接近于常数。

    不积跬步,无以至千里;不积小流,无以成江海。
  • 相关阅读:
    poj 1321 棋盘问题 (DFS深度优先搜索)
    HDOJ1312 Red and black(DFS深度优先搜索)
    《数据结构》例1.3
    hdoj1905 Pseudoprime numbers (基础数论)
    百练4003 十六进制转十进制(水题)
    第二天——2.23
    第一天——2.22
    返校——2.21
    被盗号了——2.19
    继续咸鱼——2.18
  • 原文地址:https://www.cnblogs.com/CCTVCHCH/p/14810202.html
Copyright © 2011-2022 走看看