hashCode() 和equals() 方法的重要性体现在什么地方?
Java中的HashMap使用hashCode()和equals()方法设置值,根据键获取值的时候也会用到这两个方法。
-
怎样设置的值?
- hashCode()获得 hash值。而hash值用来确定hashmap中内部 Node数组的下标。
- 之后通过比较hash值与该下标处的key的hash值是不是相等,并使用equals方法比较两个对象是否相同
- 如果hash和equals 都相等的话,说明两个键是等价的
- 如果只有hash值相等的话,此时是 hash冲突了,需要用链地址法解决
- (这里可以引出,如果只修改了equals方法的话而没有修改hash方法,是不行的。两个对象可能equals相等,但是由于没有重写hash方法,有可能导致hash不同。放入元素的key是hash1,取元素的key是hash2,虽然两个key的equals重写之后是相等的,但是key的hash没有重写,所以会取不出来)
来看源码:
1 (前导)hash方法调用key的hashCode()方法(如果key的hashCode()方法没有重写的话,就是用的Object的hashCode()方法)
static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); }
2 当往HashMap中存入一个值的时候,调用的其实是下面这个方法。预先计算了hash(key)
public V put(K key, V value) { return putVal(hash(key), key, value, false, true); }
3 比较 hash(通过hashCode()方法得到)是否相同 和 比较 equals()是否相等。依据情况存入值
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { // 如果数组为空的话,进行初始化 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; // 通过 (hash值和数组长度-1) 得到key的下标, if ((p = tab[i = (n - 1) & hash]) == null) // 如果该下标处的值为空存入元素 tab[i] = newNode(hash, key, value, null); else { Node<K,V> e; K k; // 通过比较hash值和判断equals是否相等,如果相等覆盖该值 if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) ... else { // HashMap采用的是链定址法 for (int binCount = 0; ; ++binCount) { // 一般情况下,如果链表的下一个是空的话,就插入到下一个中 if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } // 如果链表中间存在相同的键,就覆盖该值,并跳出循环 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } }
Java中的HashMap的工作原理是什么?
HashMap采用的是 数组+链定址法 ,HashMap的内部中有一个叫做Node的内部类。HashMap其实就是维护了这个Node内部类数组 Node<K,V>[]。通过hashCode()方法得到hash址,然后通过和 数组长度-1 做位运算 与 存入数组的下标值。
-
如果该下标值处的位置没有值,就填入该位置
-
如果有值了,就比较 hash值是否相同和 equals()是否相等,相等就可以覆盖该值
-
否则将递归到该处的链表的最末尾(中间有相等的也可以覆盖)
什么是hashmap?
hashmap是一个散列表,存储的内容是 键值对(key-value)映射,
- HashMap 继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口。
hashmap 是线程不安全的,所以它的内部有一个 modCount 变量,表示修改次数。其它线程可能会修改hashmap的结构(删除、增加),而此线程在迭代此时就会抛出 ConcurrentModifiedException。
初始容量大小是16,加载因子是0.75。也就是说在map到达12的时候,会扩容到两倍
/**
* Constructs an empty <tt>HashMap</tt> with the default initial capacity
* (16) and the default load factor (0.75).
*/
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
使用的是通过类似于数组下标的方式查找、删除、更新元素等操作,非常高效。但是,当hash的冲突比较多的时候,那么一个数组下标处有多个元素。此时java中的hashmap使用的是链定址法。就是数组+链表。发生hash冲突的时候,就在该下标处的链表末尾添加(如果中间有相等的键,就会覆盖)
如何构造一致性 哈希算法。
???
Object作为HashMap的key的话,对Object有什么要求吗?
要求Object中hashcode不能变。
简单的说就是 Object的equals方法和hashCode方法需要满足一致性要求。而Object的equals方法是比较两个对象的地址,而 hashCode则是 C/C++的原生方法(也是获取内存地址值)。
两者刚好对应,hashcode改变了就可能和equals对应不上。
解释:
HashMap中是同时通过 hahsCode() 方法 和 equals() 方法确定 key位置的
而 Object的 equals方法比较的是两个变量的内存地址是否相同
public boolean equals(Object obj) {
return (this == obj);
}
Object 的 hashCode是原生方法
public native int hashCode();
hashCode方法的一致约定要求
(1)、 在java应用的一次执行过程中,对于同一个对象的hashCode方法的多次调用,他们应该返回同样的值(前提是该对象的信息没有发生变化);
(2)、对于两个对象来说,如果使用equals方法比较返回true,那么这两个对象的hashCode值一定是相同的;
(3) 对于两个对象来说,如果使用equals方法返回false,那么这两个对象的hashCode值不要求一定不同(可以相同,可以不同),但是如果不同则可以提高应用的性能。
(4)、 对于Object类来说,不同Object对象的hashCode值是不同的(Object类的hashcode值表示的是对象的地址)。
hashset 存的数是有序的吗?
hashset 是无序的
为什么HashMap的长度一定是 2 的次幂
通过源码,我们可以发现每次扩容的时候,如果没有超过最大容量的话。每次 newCap都会 << 1 (增加两倍)
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
HashMap是通过 hash值 和 数组长度 - 1 的 &运算
得到数组下标的,这样可以很好的将数据分散开。而每次扩容的时候。
而 (n - 1) & hash 这个操作如果在n为2的N次幂的情况下是等同于 hash % n 取余数的值。
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 计算数组下标 i = 数组长度 & 哈希值
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
重写equals方法的时候,为什么需要重写hashCode方法
因为,如果不重写hashCode方法。那么在获取对象的hash值的时候,会默认使用Object类的hashCode()方法。
而 HashMap()中需要通过 hashCode() 和 equals 方法 设置键值对 或者 根据键获取值。
只重写了其中的一个的话,无法保证 hashCode方法的一致约定要求
- 在java应用的一次执行过程中,对于同一个对象的hashCode方法的多次调用,他们应该返回同样的值(前提是该对象的信息没有发生变化);
- 对于两个对象来说,如果使用equals方法比较返回true,那么这两个对象的hashCode值一定是相同的;
- 对于两个对象来说,如果使用equals方法返回false,那么这两个对象的hashCode值不要求一定不同(可以相同,可以不同),但是如果不同则可以提高应用的性能。
- 对于Object类来说,不同Object对象的hashCode值是不同的(Object类的hashcode值表示的是对象的地址)。
参考资料: HashMap实现原理及源码分析