zoukankan      html  css  js  c++  java
  • (转)HashMap深入原理解析

    equals与“==”(可以参考自己的另一篇博文

     

    1,基本数据类型(byteshortcharintlongfloatdoubleboolean

    使用“== 对比的是具体的值是否相等


    2,复合数据类型

    “== ”对比的是内存中存放的地址

    object中的equals初始行为是比较内存中的地址,但在一些类库中被覆盖掉了如(StringIntegerDate等)

     

    故对于复合数据类型使用equals进行比较,未进行覆写的比较的是内存地址,覆写的一般是比较具体的值


    注:equals的底层实现

     

    1. /** 默认同==,直接比较对象 */    
    2. public boolean equals(Object obj) {    
    3.     return (this == obj);    

     

     

    重写equals要满足几个条件:

     

    自反性:对于任何非空引用值x,x.equals(x) 都应返回 true。

    对称性:对于任何非空引用值 x 和 y,当且仅当y.equals(x) 返回 true 时,x.equals(y) 才应返回 true。

    传递性:对于任何非空引用值 x、y 和 z,如果x.equals(y) 返回 true,并且 y.equals(z) 返回 true,那么 x.equals(z) 应返回 true。

    一致性:对于任何非空引用值 x 和 y,多次调用x.equals(y) 始终返回 true 或始终返回 false,前提是对象上 equals 比较中所用的信息没有被修改。

    对于任何非空引用值x,x.equals(null) 都应返回 false。

     

    对于重写equals就要重写hashCode的问题,可参考博客

    http://blog.csdn.net/hejingyuan6/article/details/22398151

     

    Java对于eqauls方法和hashCode方法是这样规定的:

     

        1.如果两个对象相同,那么它们的hashCode值一定要相同;

        2.如果两个对象的hashCode相同,它们并不一定相同(这里说的对象相同指的是用eqauls方法比较)。如不按要求去做了,会发现相同的对象可以出现在Set集合中,同时,增加新元素的效率会大大下降。

         3.equals()相等的两个对象,hashcode()一定相等;equals()不相等的两个对象,却并不能证明他们的hashcode()不相等。   

     

            HashMap中我们最常用的就是put(K,V)和get(K)。我们都知道,HashMap的K值是唯一的,那如何保证唯一性呢?

           我们首先想到的是用equals比较,没错,这样可以实现,但随着内部元素的增多,put和get的效率将越来越低,这里的时间复杂度是O(n),假如有1000个元素,put时需要比较1000次。实际上,HashMap很少会用到equals方法,因为其内通过一个哈希表管理所有元素,哈希是通过hash单词音译过来的,也可以称为散列表,哈希算法可以快速的存取元素,当我们调用put存值时,HashMap首先会调用K的hashCode方法,获取哈希码,通过哈希码快速找到某个存放位置,这个位置可以被称之为bucketIndex,通过上面所述hashCode的协定可以知道,如果hashCode不同,equals一定为false,如果hashCode相同,equals不一定为true。

           所以理论上,hashCode可能存在冲突的情况,有个专业名词叫碰撞,当碰撞发生时,计算出的bucketIndex也是相同的,这时会取到bucketIndex位置已存储的元素,最终通过equals来比较,equals方法就是哈希码碰撞时才会执行的方法,所以前面说HashMap很少会用到equals。

           HashMap通过hashCode和equals最终判断出K是否已存在,如果已存在,则使用新V值替换旧V值,并返回旧V值,如果不存在,则存放新的键值对<K, V>到bucketIndex位置。

     

    put过程流程图:(这个图很形象啊



     

     

    现在我们知道,执行put方法后,最终HashMap的存储结构会有这三种情况,情形3是最少发生的,哈希码发生碰撞属于小概率事件。到目前为止,我们了解了两件事:

     

         HashMap通过键的hashCode来快速的存取元素。

        当不同的对象hashCode发生碰撞时,HashMap通过单链表来解决,将新元素加入链表表头,通过next指向原有的元素。单链表在Java中的实现就是对象的引用(复合)。

    HashMap的长度为什么要是2的n次方

        /** 
         * "按位与"来获取数组下标 
         */  
        static int indexFor(int h, int length) {  
            return h & (length - 1);  
        }  

    HashMap的长度为什么要是2的n次方

    当容量一定是2^n时,h & (length - 1) == h % length

    位运算比取余高效且未2的n次方时候能够有效的减少碰撞

  • 相关阅读:
    Chapter 4
    Chapter 3
    chapter 2
    Python编程指南 chapter 1
    BASE64 编码和解码
    生成 PDF 全攻略【2】在已有PDF上添加内容
    IDEA 和 Eclipse 使用对比
    web 前端常用组件【06】Upload 控件
    聊聊 Web 项目二维码生成的最佳姿势
    依附大系统 【数据实时获取】解决方案
  • 原文地址:https://www.cnblogs.com/lixuwu/p/5676185.html
Copyright © 2011-2022 走看看