1、HashMap里的hashcode方法和equal方法什么时候需要重写?
当使用HashMap时,如果key类型是一个对象类型,则需要在这个对象类型中重写hashcode()和equals()方法
HashMap存储数据的时候,会对key取hash值,如果key存在,则会把old value替换
如果不重写hashcode()和equals()方法,即时new 两个所有属性值相同对象,但是其hash值也会不同,所以存储到hashmap中也会对应两条不同的数据
当使用其中一个对象作为key从map中取值得时候,就会取不到值,返回为null。
2、HashTable HashMap ConcurrentHashMap区别
HashTable:
(1)底层数组+链表实现,无论key还是value都不能为null,线程安全,实现线程安全的方式是在修改数据时锁住整个HashTable,效率低,ConcurrentHashMap做了相关优化
(2)初始size为11,扩容:newsize = oldsize*2
HashMap:
(1)底层数组+链表实现,可以存储null键和null值,线程不安全
(2)初始size为16,扩容:newsize = oldsize*2,newsize一定为2的n次幂
(3)扩容针对整个Map,每次扩容时,原来数组中的元素依次重新计算存放位置,并重新插入
(4)插入元素后才判断该不该扩容,有可能无效扩容(插入后如果扩容,如果没有再次插入,就会产生无效扩容)
(5)当Map中元素总数超过Entry数组的75%,触发扩容操作,为了减少链表长度,元素分配更均匀
ConcurrentHashMap:
(1)底层采用分段的数组+链表实现,线程安全
(2)通过把整个Map分为N个Segment,可以提供相同的线程安全,但是效率提升N倍,默认提升16倍。(读操作不加锁,由于HashEntry的value变量是 volatile的,也能保证读取到最新的值。)
(3)Hashtable的synchronized是针对整张Hash表的,即每次锁住整张表让线程独占,ConcurrentHashMap允许多个修改操作并发进行,其关键在于使用了锁分离技术
(4)有些方法需要跨段,比如size()和containsValue(),它们可能需要锁定整个表而而不仅仅是某个段,这需要按顺序锁定所有段,操作完毕后,又按顺序释放所有段的锁
(5)扩容:段内扩容(段内元素超过该段对应Entry数组长度的75%触发扩容,不会对整个Map进行扩容),插入前检测需不需要扩容,有效避免无效扩容
ConcurrentHashMap详解:
ConcurrentHashMap比HashMap多出了一个类Segment,而Segment是一个可重入锁,ConcurrentHashMap是使用了锁分段技术来保证线程安全的。
锁分段技术:首先将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问
ConcurrentHashMap默认将hash表分为16个桶,诸如get、put、remove等常用操作只锁住当前需要用到的桶。这样,原来只能一个线程进入,现在却能同时有16个写线程执行,并发性能的提升是显而易见的。
ConcurrentHashMap是由Segment数组结构和HashEntry数组结构组成。Segment是一个可重入锁(ReentrantLock),在ConcurrentHashMap里扮演锁的角色;HashEntry则用于存储键值对数据。一个ConcurrentHashMap里包含一个Segment数组。Segment的结构和HashMap类似,是一种数组和链表结构。一个Segment里包含一个HashEntry数组,每个HashEntry是一个链表结构的元素,每个Segment守护着一个HashEntry数组里的元素。当对HashEntry数组的数据进行修改时,必须首先获得与它对应的segment锁。