Java面试题-Collection框架

zoukankan html css js c++ java

Java面试题-Collection框架
1，ArrayList中基础数据域Object[] elementData使用transient修饰的，那它是怎么序列化的？为什么？

答案：ArrayList在被序列化为文件、网络io等时，会调用被序列化类中的writeObject方法，找不到writeObject则调用工具类中defaultWriteFields方法，在ArrayList中writeObject私有的，序列化时使用反射调用。之所以不使用类中属性elementData直接来序列化，主要原因是elementData是一个缓存数组，为了性能考虑，它通常会预留一些容量，因此可能有大量空间没有实际存储元素。不直接序列化elementData可以保证序列化实际有值的那些元素，而不是序列化整个数组。

2，ArrayList的扩容机制是什么？

答案：ArrayList在创建的时候，如果不指定初始容量，默认容量minCapacity为0，在add方法中，首先调用ensureInternalCapacity（如果minCapacity小于10，设置为10），然后调用ensureExplicitCapacity（如果现需容量minCapacity大于elementData容量，则扩容），grow的逻辑很简单。首先找出当前容量，把新容量设置为旧容量的1.5倍（通过位运算左移实现），如果扩容后容量newCapacity比minCapacity还小，则设置newCapacity=minCapacity，如果newCapacity比极限容量（Integer.MAX_VALUE-8）要大，则设置新容量=Integer.MAX_VALUE，接着使用该新容量初始化一个新的数组，使用Arrays.copyOf(elementData, newCapacity)将原有elementData中的元素等位复制为一个新数组。

引申：

　　在ArrayList中使用了大量的Arrays.copyOf和System.arrayCopy方法，它们的主要区别为前者默认创建一个新数组，而后者需要指定目标数组。
1 //elementData:源数组;index:源数组中的起始位置;elementData：目标数组；index + 1：目标数组中的起始位置； size - index：要复制的数组元素的数量； 2 System.arraycopy(elementData, index, elementData, index + 1, size - index); 3 //elementData：要复制的数组；size：要复制的长度 4 Arrays.copyOf(elementData, size);
　　ArrayList使用的优化：
- 在new ArrayList时指定初始化容量，以减少扩容次数
- 在add大量元素之前手动调用ensureCapacity方法，以减少增量重新分配次数
3，LinkedList和ArrayList有什么区别？

答案：LinkedList底层是双向链表结构，属于顺序访问序列，ArrayList底层结构是数组，属于随机访问序列。LinkedList增删效率高，ArrayList改查效率高。存储同样大小的数据，LinkedList需要更多的内存。

引申：

LinkedList继承AbstractSequentialList，提供了顺序访问的存储结构。还实现了Deque双向队列接口，因为Queue特性是FIFO，而Deque则可以同时在头尾处完成读写操作，而LinkedList还可以操作头尾之间的任意节点。

4，介绍一下Vector和Stack

答案：Vector的实现和ArrayList基本一致，vector的所有public方法都是用了synchronized关键字，保证线程安全。Vector根据capacityIncrement的数值扩容（new时指定），而不是每次扩容1.5倍。Stack时Vector的子类，提供了一些栈操作的方法。

引申：

Vector和Stack使用了大量synchronized关键字来保证线程安全，但这并不是当下推荐的方式，因为这种实现效率比较低，在java.util.Collections工具类中提供了synchronizedList方法可以提供线程安全的列表，拥有更好的性能，因此这两个类被看作已经过时的容器。

5，谈谈对Hash函数的认识以及JDK1.8中hash算法的实现。

　　Hash函数要尽可能保证哈希松散，所谓哈希松散，就是指数值尽可能平均分布的hashCode，在Java语言中，一般会认为hashCode是一个int值，int是一个32bit整型数，比如一个8位16进制数1A54F2C0就比C8600000要松散。HashMap的默认容量是16，hashCode如果超过length-1，就会执行取余运算。如果一组数据其hashCode集中在000A0000-FFFF0000之间，那么计算indexFor时其取余结果全部为0。这种hashCode重复的现象称为哈希碰撞，当哈希碰撞发生，碰撞的键值对会被存入到同一条链表中，导致HashMap效率低下。松散哈西可以减少哈希碰撞。JDK1.8之前利用大量异或操作与无符号右移操作构建特定哈希松散算法hash(Object k），JDK1.8后，简化了哈希松散算法，之前版本多次位移异或并不能避免过多哈希碰撞，反倒增加了计算次数，Hashmap的效率问题主要集中在链表部分的遍历，这是一个经验性质的改进。
1 //JDK1.8的hash算法 2 static final int hash(Object key) { 3 int h; 4 return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); 5 }
6，jdk1.8之前和之后的HashMap底层数据结构有什么不同？他们put的流程各是什么？

答案：在jdk1.8以前，HashMap的底层实现是数组和链表，而从1.8开始使用数组+链表+红黑树来实现。

Jkd1.8以前的put流程：

a)      计算键key的hash值。

b)      根据hash值和table长度来确定下标。（利用hashCode与table的长度使用&运算构建索引算法indexFor(int,int)，检测哈希冲突，确定数据地址），根据key值和hash值对比，确定是存入数组，还是创建链表节点还是替代之前的链表值。

c)      通过size>=threshold，确定是否需要扩容resize(2*table.length)，确定下一个扩容阈值size*loadFactor(加载因子，常量0.75)，确定useAltHashing改变算法标志，决定是否需要rehash重构哈希，使用新容量构建新的Entry<K,V>table数组，调用transfer(newTable,rehash)来重新计算所有节点并转移到新数组table下。

Jdk1.8以后的put流程：

a)      获取key值的hashCode。

b)      调用putVal方法进行存值。该方法主要流程为：使用table的长度-1&hash来计算下标，table为空或超过阈值进行扩容，根据下标位置的节点类型保存数据，决定插入数组还是链节点或树节点，如果链表深度超过建树阈值(TREEIFY_THRESHOLD-1)，即7，则调用treeifyBin把整个链表重构成树。

c)      Resize即重新规划table长度和阈值，如果数量超过阈值，扩容两倍（最小16，最大1<<30），阈值为容量*加载因子0.75。重新排列数据节点，遍历所以节点普通节点重新计算哈希值，树节点调用split方法，决定是否需要将其退化为链表。

对Hash函数的认识：

引申：

　　HashMap使用的优化：
- 在new HashMap时指定容量，合适的initCapacity=(需要存储的元素个数/加载因子)+1
7，TreeMap和HashMap有什么区别？

答案：TreeMap是有序Map，需要指定比较器或使用默认比较器。与HashMap组合了数组、链表、红黑树不同，TreeMap时完全有红黑树实现的。

引申：

       TreeMap的Put方法：

a)      如果TreeMap是空的，那么指定数据作为根节点。

b)      如果comparator不为空，使用comparator决定插入位置，否则认为key实现了Comparable，调用compareTo决定插入位置。

c)      插入完成，修复红黑树。

8，LinkedHashMap和HashMap有什么区别？

答案：LinkedHashMap的存储中包含了一个额外的双向链表结构，private transient Entry<K,V>header既是头又是尾（JDK1.8后有单独的tail），可以看成是一个环状链表，Hash桶中的每个节点都被这个环状链表的某个节点引用，从而达到有序访问目的。

9，HashTable与HashMap有什么区别？

答案：HashTable的实现方式被synchronized修饰，因此HashTable是线程安全的，而HashMap不是。此外HashTable不能存放null作为key，HashMap会把null key存在下标为0的位置。

引申：

       虽然Hashtable是线程安全的，但在多线程环境下并不推荐使用，因为采用synchronized方式实现的多线程安全容器在大量并发的情况下效率比较低，Java还引入了专门在大并发量情况下使用的并发容器，这种容器由于在实现时使用了更加细粒度的锁，由此在大并发量的情况下有着更好的性能。

10，什么是Java中Collectors的fast-fail特性？

答案：Java集合框架Iterator具有fast-fail的特性，在创建Iterator后，其它线程对Collection做了修改或当前线程调用非Iterator接口对集合做了修改，导致类似modCount!=expectedModCount，那么会抛出ConcurrentModificationException异常，产生fast-fail事件。

引申：

       针对ArrayList，fast-fail的实现是在其父类AbastractList中，当执行add、remove、clear等方法时，modCount会发生改变，expectedodCount不变，调用checkForModification检测是否modCount==expectedModCount。而JUC中的CopyOnWriteArrayList没有继承AbstractList，仅仅实现了List接口，进行增删改时没有所谓checkForModification。
查看全文

相关阅读:
BeanUtils在web项目中的应用
 BeanUtils的日期问题
 使用BeanUtils组件
 调用数据库过程函数mysql
sql注入
 如何取SO中的特性
 Read config detail from SO
Parts-Ufida ERP project 1
常用医疗英语
 April 24th 2020

原文地址：https://www.cnblogs.com/guanghe/p/13440571.html

Java面试题-Collection框架

1，ArrayList中基础数据域Object[] elementData使用transient修饰的，那它是怎么序列化的？为什么？

2，ArrayList的扩容机制是什么？

3，LinkedList和ArrayList有什么区别？

4，介绍一下Vector和Stack

5，谈谈对Hash函数的认识以及JDK1.8中hash算法的实现。

6，jdk1.8之前和之后的HashMap底层数据结构有什么不同？他们put的流程各是什么？

7，TreeMap和HashMap有什么区别？

8，LinkedHashMap和HashMap有什么区别？

9，HashTable与HashMap有什么区别？

10，什么是Java中Collectors的fast-fail特性？