zoukankan      html  css  js  c++  java
  • HashCode与Equals回顾

    HashSet和HashMap一直都是JDK中最常用的两个类,HashSet要求不能存储相同的对象,HashMap要求不能存储相同的键。 那么Java运行时环境是如何判断HashSet中相同对象、HashMap中相同键的呢?当存储了“相同的东西”之后Java运行时环境又将如何来维护呢? 
    在研究这个问题之前,首先说明一下JDK对equals(Object obj)和hashcode()这两个方法的定义和规范:

    (1)在Java中任何一个对象都具备equals(Object obj)和hashcode()这两个方法,因为他们是在Object类中定义的。 equals(Object obj)方法用来判断两个对象是否“相同”,如果“相同”则返回true,否则返回false。 hashcode()方法返回一个int数,在Object类中的默认实现是“将该对象的内部地址转换成一个整数返回”。

    (2)接下来有两个个关于这两个方法的重要规范(我只是抽取了最重要的两个,其实不止两个):

    规范1若重写equals(Object obj)方法,有必要重写hashcode()方法(避免不必要的麻烦),确保通过equals(Object obj)方法判断结果为true的两个对象具备相等的hashcode()返回值。说得简单点就是:“如果两个对象相同,那么他们的hashcode应该 相等”。不过请注意:这个只是规范,如果你非要写一个类让equals(Object obj)返回true而hashcode()返回两个不相等的值,编译和运行都是不会报错的。不过这样违反了Java规范,程序也就埋下了BUG。

    规范2:如果equals(Object obj)返回false,即两个对象“不相同”,并不要求对这两个对象调用hashcode()方法得到两个不相同的数。说的简单点就是:“如果两个对象不相同,他们的hashcode可能相同”。 根据这两个规范,

    可以得到如下推论

    1、如果两个对象equals,Java运行时环境会认为他们的hashcode一定相等。

    2、如果两个对象不equals,他们的hashcode有可能相等。

    3、如果两个对象hashcode相等,他们不一定equals。

    4、如果两个对象hashcode不相等,他们一定不equals

    (3)

    对于一般类的对象(除String等封装类型对象外):

    若普通类没有重写hashcode()和equals()方法,,那么其对象在比较时,是继承的object类中的hashcode()方法,object类中的hashcode()方法是一个本地方法,对该方法的返回值进行比较时,比较的是对象的地址(引用地址),使用new方法创建内容相同的对象,两次生成的当然是不同的对象。除非重写hashcode()方法。在object类中定义的equals()方法也是对对象地址的比较。一句话总结:若不重写普通类的hashcode()和equals()方法,在Set集合中对象引用地址不一样,对象即不重复。

     对于String等对象(String、Integer、Double····等等):

    由于这些封装类本身已经重写了hashcode()方法,并且重写的方法的返回值跟对象的内容相关,而不是跟引用地址相关。这些封装类中的equals()方法同样进行了重写,比较的是对象的内容,而非引用地址。一句话总结:String等类的对象在集合中均比较他们的内容,内容相同则覆盖已存在的对象

    (4)set集合为什么可以保证元素的不重复性,根本是:在添加元素时会进行是否相等的判断。根源是:

    Java中的Set集合 怎么保障不重复? 

    大家可能都知道Set是一个无序的不可以重复的集合。凡事想一个为什么? 
    打开源码看一眼: 
    Set是一个接口,常用的Set实现类那就是HashSet了。 
    ------------------------------------------------- 
    public HashSet() { 
    map = new HashMap<E,Object>(); 
        } 
    ------------------------------------------------- 

    这是HashSet的构造方法。 可以看到HashSet内部其实就是一个HashMap 
    【添加元素的方法】 
    /**  
         * 如果此set中尚未包含指定元素,则添加指定元素。  
         * 更确切地讲,如果此 set 没有包含满足(e==null ? e2==null : e.equals(e2))  
         * 的元素e2,则向此set 添加指定的元素e。  
         * 如果此set已包含该元素,则该调用不更改set并返回false。  
         *  
         * 底层实际将将该元素作为key放入HashMap。  
         * 由于HashMap的put()方法添加key-value对时,当新放入HashMap的Entry中key  
         * 与集合中原有Entry的key相同(hashCode()返回值相等,通过equals比较也返回true),  
         * 新添加的Entry的value会将覆盖原来Entry的value,但key不会有任何改变,  
         * 因此如果向HashSet中添加一个已经存在的元素时,新添加的集合元素将不会被放入HashMap中,  
         * 原来的元素也不会有任何改变,这也就满足了Set中元素不重复的特性。  
         * @param e 将添加到此set中的元素。  
         * @return 如果此set尚未包含指定元素,则返回true。  
         */ 
    public boolean add(E e) { 
    return map.put(e, PRESENT)==null; 
        } 
    看一下map的定义: 
    HashSet 中定义了这样的两个变量: 
        private transient HashMap<E,Object> map; 
        private static final Object PRESENT = new Object(); 
    我们再看一下上面的 add() 方法。 
    map.put(o, PRESENT)==null 
    实际执行的是 map 的方法,并且我们添加的对象是 map 中的 key,value 是执行的同一个对象 PRESENT. 
    因为map中的key是不允许重复的,所以set中的元素不能重复。 
    ============================================================================== 
    根本问题还是没有解决那继续问?为什么HashMap中的Key不允许重复? 
    HashMap的往里放元素的源码!!! 

    public V put(K key, V value) { 
            if (key == null) 
                return putForNullKey(value); 
            int hash = hash(key.hashCode()); 
            int i = indexFor(hash, table.length); 
            //遍历链表 
            for (Entry<K,V> e = table[i]; e != null; e = e.next) { 
                Object k; 
                //如果key在链表中已存在,则替换为新value  HashMap 可以重复put同一个Key值不同的对象。 
                if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { 
                    V oldValue = e.value; 
                    e.value = value; 
                    e.recordAccess(this); 
                    return oldValue; 
                } 
            } 

            modCount++; 
            addEntry(hash, key, value, i); 
            return null; 
        } 

    分步骤判断添加的Key值: 
    1、取到新添加Key值得hashCode值。 
    2、确定数组的index 根据Key的hashCode值和当前table的长度按位取并  h & (length-1); 
        按位取并,作用上相当于取模mod或者取余%。 
        这意味着数组下标相同,并不表示hashCode相同 
    3、这里的hashcode在equals前面,JVM会先判断或运算||的前部分,当这一前部分为true的时候判断终止,返回true(这是为了提高JVM的效率),所以当hashcode不同的时候,equals是不会执行的。 


    总结为什么Set里面不能有重复? 
    因为HashMap在put一个Key时会判断,将要放进去的Key的hash值与 目前HashMap中定位到的那个Key的hash值比较。 
    如果hash值相当,继续比较 这两个对象的地址或者内容是否相当。 
    如果相当:判断出来要添加的Key与HashMap中的Key重复,把Value的值给替换成最新的。 
    HashSet中的Value是一个固定值PRESENT。 所以修改不修改无所谓。 

  • 相关阅读:
    poj 2479
    纯CSS实现小圆点和三角形图案
    HDOJ1084 What Is Your Grade?
    4星|《一世富贵》:穿越到宋朝去抢了狄青、范仲淹的风头
    世界不是平的,发达国家在本地生产越来越合算。观点宏大,证据薄弱:3星|《后全球化时代》
    饥饿疗法是目前唯一确信能够延缓衰老的办法:4星|《三联生活周刊》2018年3期
    4星|《重塑》:消费者的信息能力是一个重要的经济变量。新颖的、有见地的国人原创经济理论
    3星|《高情商谈判》:谈判中控制情绪非常重要
    中间商赚差价让世界更美好:3.5星|《中间人经济》
    3.5星|《新零售的未来》:中美两国零售业的现状的分析和未来的展望
  • 原文地址:https://www.cnblogs.com/fengli9998/p/7871463.html
Copyright © 2011-2022 走看看