zoukankan      html  css  js  c++  java
  • HashMap理解

    hashCode() 和equals() 方法的重要性体现在什么地方?

    Java中的HashMap使用hashCode()和equals()方法设置值,根据键获取值的时候也会用到这两个方法。

    • 怎样设置的值?

      • hashCode()获得 hash值。而hash值用来确定hashmap中内部 Node数组的下标。
      • 之后通过比较hash值与该下标处的key的hash值是不是相等,并使用equals方法比较两个对象是否相同
        • 如果hash和equals 都相等的话,说明两个键是等价的
        • 如果只有hash值相等的话,此时是 hash冲突了,需要用链地址法解决
        • (这里可以引出,如果只修改了equals方法的话而没有修改hash方法,是不行的。两个对象可能equals相等,但是由于没有重写hash方法,有可能导致hash不同。放入元素的key是hash1,取元素的key是hash2,虽然两个key的equals重写之后是相等的,但是key的hash没有重写,所以会取不出来)

      来看源码:

      1 (前导)hash方法调用key的hashCode()方法(如果key的hashCode()方法没有重写的话,就是用的Object的hashCode()方法)

          static final int hash(Object key) {
              int h;
              return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
          }
      

      2 当往HashMap中存入一个值的时候,调用的其实是下面这个方法。预先计算了hash(key)

          public V put(K key, V value) {
              return putVal(hash(key), key, value, false, true);
          }
      

      3 比较 hash(通过hashCode()方法得到)是否相同 和 比较 equals()是否相等。依据情况存入值

         final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                         boolean evict) {
              // 如果数组为空的话,进行初始化
              if ((tab = table) == null || (n = tab.length) == 0)
                  n = (tab = resize()).length;
              // 通过 (hash值和数组长度-1) 得到key的下标,
              if ((p = tab[i = (n - 1) & hash]) == null)
                  // 如果该下标处的值为空存入元素
                  tab[i] = newNode(hash, key, value, null);
              else {
                  Node<K,V> e; K k;
                  // 通过比较hash值和判断equals是否相等,如果相等覆盖该值
                  if (p.hash == hash &&
                      ((k = p.key) == key || (key != null && key.equals(k))))
                      e = p;
                  else if (p instanceof TreeNode)
                      ...
                  else {
                      // HashMap采用的是链定址法
                      for (int binCount = 0; ; ++binCount) {
                          // 一般情况下,如果链表的下一个是空的话,就插入到下一个中
                          if ((e = p.next) == null) {
                              p.next = newNode(hash, key, value, null);
                              if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                                  treeifyBin(tab, hash);
                              break;
                          }
                          // 如果链表中间存在相同的键,就覆盖该值,并跳出循环
                          if (e.hash == hash &&
                              ((k = e.key) == key || (key != null && key.equals(k))))
                              break;
                          p = e;
                      }
                  }
      

    Java中的HashMap的工作原理是什么?

    HashMap采用的是 数组+链定址法 ,HashMap的内部中有一个叫做Node的内部类。HashMap其实就是维护了这个Node内部类数组 Node<K,V>[]。通过hashCode()方法得到hash址,然后通过和 数组长度-1 做位运算 存入数组的下标值。

    • 如果该下标值处的位置没有值,就填入该位置

    • 如果有值了,就比较 hash值是否相同和 equals()是否相等,相等就可以覆盖该值

    • 否则将递归到该处的链表的最末尾(中间有相等的也可以覆盖)

    什么是hashmap?

    hashmap是一个散列表,存储的内容是 键值对(key-value)映射,

    • HashMap 继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口。

    hashmap 是线程不安全的,所以它的内部有一个 modCount 变量,表示修改次数。其它线程可能会修改hashmap的结构(删除、增加),而此线程在迭代此时就会抛出 ConcurrentModifiedException。

    初始容量大小是16,加载因子是0.75。也就是说在map到达12的时候,会扩容到两倍

        /**
         * Constructs an empty <tt>HashMap</tt> with the default initial capacity
         * (16) and the default load factor (0.75).
         */
        public HashMap() {
            this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
        }
    

    使用的是通过类似于数组下标的方式查找、删除、更新元素等操作,非常高效。但是,当hash的冲突比较多的时候,那么一个数组下标处有多个元素。此时java中的hashmap使用的是链定址法。就是数组+链表。发生hash冲突的时候,就在该下标处的链表末尾添加(如果中间有相等的键,就会覆盖)

    如何构造一致性 哈希算法。

    ???

    Object作为HashMap的key的话,对Object有什么要求吗?

    要求Object中hashcode不能变。

    简单的说就是 Object的equals方法和hashCode方法需要满足一致性要求。而Object的equals方法是比较两个对象的地址,而 hashCode则是 C/C++的原生方法(也是获取内存地址值)。

    两者刚好对应,hashcode改变了就可能和equals对应不上。

    解释

    HashMap中是同时通过 hahsCode() 方法 和 equals() 方法确定 key位置的

    而 Object的 equals方法比较的是两个变量的内存地址是否相同

        public boolean equals(Object obj) {
            return (this == obj);
        }
    

    Object 的 hashCode是原生方法

        public native int hashCode();
    

    hashCode方法的一致约定要求
    (1)、 在java应用的一次执行过程中,对于同一个对象的hashCode方法的多次调用,他们应该返回同样的值(前提是该对象的信息没有发生变化);
    (2)、对于两个对象来说,如果使用equals方法比较返回true,那么这两个对象的hashCode值一定是相同的;
    (3) 对于两个对象来说,如果使用equals方法返回false,那么这两个对象的hashCode值不要求一定不同(可以相同,可以不同),但是如果不同则可以提高应用的性能。
    (4)、 对于Object类来说,不同Object对象的hashCode值是不同的(Object类的hashcode值表示的是对象的地址)。

    hashset 存的数是有序的吗?

    hashset 是无序的

    为什么HashMap的长度一定是 2 的次幂

    通过源码,我们可以发现每次扩容的时候,如果没有超过最大容量的话。每次 newCap都会 << 1 (增加两倍)

            if (oldCap > 0) {
                if (oldCap >= MAXIMUM_CAPACITY) {
                    threshold = Integer.MAX_VALUE;
                    return oldTab;
                }
                else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                         oldCap >= DEFAULT_INITIAL_CAPACITY)
                    newThr = oldThr << 1; // double threshold
            }
    

    HashMap是通过 hash值 和 数组长度 - 1 的 &运算 得到数组下标的,这样可以很好的将数据分散开。而每次扩容的时候。

    而 (n - 1) & hash 这个操作如果在n为2的N次幂的情况下是等同于 hash % n 取余数的值。

            if ((tab = table) == null || (n = tab.length) == 0)
                n = (tab = resize()).length;
             // 计算数组下标 i = 数组长度 & 哈希值
            if ((p = tab[i = (n - 1) & hash]) == null)
                tab[i] = newNode(hash, key, value, null);
    

    重写equals方法的时候,为什么需要重写hashCode方法

    因为,如果不重写hashCode方法。那么在获取对象的hash值的时候,会默认使用Object类的hashCode()方法。

    而 HashMap()中需要通过 hashCode() 和 equals 方法 设置键值对 或者 根据键获取值。

    只重写了其中的一个的话,无法保证 hashCode方法的一致约定要求

    • 在java应用的一次执行过程中,对于同一个对象的hashCode方法的多次调用,他们应该返回同样的值(前提是该对象的信息没有发生变化);
    • 对于两个对象来说,如果使用equals方法比较返回true,那么这两个对象的hashCode值一定是相同的;
    • 对于两个对象来说,如果使用equals方法返回false,那么这两个对象的hashCode值不要求一定不同(可以相同,可以不同),但是如果不同则可以提高应用的性能。
    • 对于Object类来说,不同Object对象的hashCode值是不同的(Object类的hashcode值表示的是对象的地址)。

    参考资料: HashMap实现原理及源码分析

  • 相关阅读:
    SLF4J: Failed to load class "org.slf4j.impl.StaticLoggerBinder"
    Tomcat跨域
    Invalid bean definition with name 'dataSource' defined in class path resource [applicationContext.xml]
    网速测试
    程序员实用工具网站
    安装wls报(主清单位置 "/u01/app/oracle/inventory" 无效 (无法读取/写入/执行))
    pom.xml
    CUDA -- 内存分配
    最长上升子序列(LIS: Longest Increasing Subsequence)
    实例化渲染
  • 原文地址:https://www.cnblogs.com/llf7/p/12952367.html
Copyright © 2011-2022 走看看