zoukankan      html  css  js  c++  java
  • Java & hashCode作用

    首先,想要明白hashCode的作用,你必须要先知道Java中的集合。
      总的来说,Java中的集合(Collection)有两类,一类是List,再有一类是Set。你知道它们的区别吗?前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。那么这里就有一个比较严重的问题了:要想保证元素不重复,可两个元素是否重复应该依据什么来判断呢?这就是Object.equals方法了。但是,如果每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。也就是说,如果集合中现在已经有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。
        于是,Java采用了哈希表的原理。哈希(Hash)实际上是个人名,由于他提出一哈希算法的概念,所以就以他的名字命名了。哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上。如果详细讲解哈希算法,那需要更多的文章篇幅,我在这里就不介绍了。初学者可以这样理解,hashCode方法实际上返回的就是对象存储的物理地址(实际可能并不是)。
        这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。所以这里存在一个冲突解决的问题。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。
        所以,Java对于eqauls方法和hashCode方法是这样规定的:
    1、如果两个对象相同,那么它们的hashCode值一定要相同;
    2、如果两个对象的hashCode相同,它们并不一定相同
        上面说的对象相同指的是用eqauls方法比较。
        你当然可以不按要求去做了,但你会发现,相同的对象可以出现在Set集合中。同时,增加新元素的效率会大大下降。

     
     
    1.public boolean equals(Object obj),和hashcode()方法是object对象中的方法。
    
    
    2.equals与hashcode间的关系是这样的:

    1、如果两个对象相同(即用equals比较返回true),那么它们的hashCode值一定要相同;

    2、如果两个对象的hashCode相同,它们并不一定相同(即用equals比较返回false)   

    即:
    (1)当obj1.equals(obj2)为true时,obj1.hashCode() == obj2.hashCode()必须为true 
    (2)当obj1.hashCode() == obj2.hashCode()为false时,obj1.equals(obj2)必须为false
    
    
    3为啥重写equals?
    如果不重写equals,那么比较的将是对象的引用是否指向同一块内存地址,重写之后目的是为了比较两个对象的value值是否相等。
    特别指出利用equals比较八大包装对象(如int,float等)和String类(因为该类已重写了equals和hashcode方法)对象时,
    默认比较的是值,在比较其它自定义对象时都是比较的引用地址
    4.什么是hashcode?
    hashcode是用于散列数据的快速存取,如利用HashSet/HashMap/Hashtable类来存储数据时,
    都是根据存储对象的hashcode值来进行判断是否相同的。
    由于为了提高程序的效率才实现了hashcode方法,先进行hashcode的比较,如果不同,
    那没就不必在进行equals的比较了,这样就大大减少了equals比较的次数,这对比需要比较的数量很大的效率提高是很明显的,
    一个很好的例子就是在集合中的使用;我们都知道java中的List集合是有序的,因此是可以重复的,而set集合是无序的,
    因此是不能重复的,那么怎么能保证不能被放入重复的元素呢,但靠equals方法一样比较的话,
    如果原来集合中以后又10000个元素了,那么放入10001个元素,难道要将前面的所有元素都进行比较,
    看看是否有重复,欧码噶的,这个效率可想而知,因此hashcode就应遇而生了,java就采用了hash表,
    利用哈希算法(也叫散列算法),就是将对象数据根据该对象的特征使用特定的算法将其定义到一个地址上,
    那么在后面定义进来的数据只要看对应的hashcode地址上是否有值,那么就用equals比较,如果没有则直接插入,
    只要就大大减少了equals的使用次数,执行效率就大大提高了。继续上面的话题,为什么必须要重写hashcode方法,
    其实简单的说就是为了保证同一个对象,保证在equals相同的情况下hashcode值必定相同,
    如果重写了equals而未重写hashcode方法,可能就会出现两个没有关系的对象equals相同的
    (因为equal都是根据对象的特征进行重写的),但hashcode确实不相同的
    
    5.那么如何保证这一点!!
    这样如果我们对一个对象重写了euqals,意思是只要对象的成员变量值都相等那么euqals就等于true,
    但不重写hashcode,那么我们再new一个新的对象,当原对象.equals(新对象)等于true时,两者的hashcode却是不一样的
    ,由此将产生了理解的不一致,如在存储散列集合时(如Set类),将会存储了两个值一样的对象,导致混淆,
    因此,就也需要重写hashcode()
     
    当要比较对象的内容而不比较引用时便重写equals方法  但重写equals方法便一定要重写hashcode方法,java机制会在调用equals方法时自动调用hashcode方法
     
    注意:当此方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 
    方法的常规协定,该协定声明相等对象必须具有相等的哈希码。 
     
    HashMap中,如果要比较key是否相等,要同时使用这两个函数!因为自定义的类的hashcode()方法继承于Object类,其hashcode码为默认的内存地址,这样即便有相同含义的两个对象,比较也是不相等的,例如,生成了两个“羊”对象,正常理解这两个对象应该是相等的,但如果你不重写 hashcode()方法的话,比较是不相等的!
    
    
    Object类 (JDK API 1.6.0)

    toString

    public String toString()
    返回该对象的字符串表示。通常,toString 方法会返回一个“以文本方式表示”此对象的字符串。结果应是一个简明但易于读懂的信息表达式。建议所有子类都重写此方法。

    Object 类的 toString 方法返回一个字符串,该字符串由类名(对象是该类的一个实例)、at 标记符“@”和此对象哈希码的无符号十六进制表示组成。换句话说,该方法返回一个字符串,它的值等于:

    getClass().getName() + '@' + Integer.toHexString(hashCode())
    返回:
    该对象的字符串表示形式。
    Java  hashCode作用 - darrell - DARRELL的博客
     
  • 相关阅读:
    Coursera台大机器学习课程笔记8 -- Linear Regression
    近两年跟踪速度较快的算法小结(转)
    hdu 4278 Faulty Odometer
    hdu 2571 命运
    hdu 6168 Numbers
    Codeforces 888C:K-Dominant Character
    poj 3061 Subsequence
    poj 1852 Ants
    1115. Counting Nodes in a BST (30)
    1064. Complete Binary Search Tree (30)
  • 原文地址:https://www.cnblogs.com/xiarongjin/p/8306713.html
Copyright © 2011-2022 走看看