前言
之前搜索面试题的时候,出现了一个题:一个ArrayList在循环过程中删除,会不会出问题,为什么?心里想的答案是肯定会有问题但是又不知道是为什么,在搜索到答案后,发现里面其实并不简单,所以专门写篇文章研究一下。
for循环正向删除
先看示例,再解析原因:
public static void main(String[] args){ List<String> list = new ArrayList<String>(); list.add("111"); list.add("222"); list.add("222"); list.add("333"); list.add("444"); list.add("333"); //for循环正向循环删除 for (int i = 0;i < list.size();i++){ if (list.get(i).equals("222")){ list.remove(i); } } System.out.println(Arrays.toString(list.toArray())); }
运行后,输出结果:
[111, 222, 333, 444, 333]
发现,相邻的字符串“222”没有删除,这是为什么呢?画图解释:
解释:删除元素“222”,当循环到下标为1的元素的的时候,发现此位置上的元素是“222”,此处元素应该删除,根据上图中的元素移动可知,在删除元素后面的所有元素都要向前移动一个位置,那么移动之后,原来下标为2的元素“222”,此时下标为1,这是在i = 1,时的循环操作,在下一次的循环中,i = 2,此时就遗漏了第二个元素“222”。
那么再做下一个测试,删除元素“333”,结果将如何?
public static void main(String[] args){ List<String> list = new ArrayList<String>(); list.add("111"); list.add("222"); list.add("222"); list.add("333"); list.add("444"); list.add("333"); //for循环正向循环删除 for (int i = 0;i < list.size();i++){ if (list.get(i).equals("333")){ list.remove(i); } } System.out.println(Arrays.toString(list.toArray())); }
运行结果:
[111, 222, 222, 444]
发现,没有问题。原理在上一个测试已经说了,就不再赘述。
总结:for循环正向删除,会遗漏连续重复的元素。
for循环反向删除
public static void main(String[] args){ List<String> list = new ArrayList<String>(); list.add("111"); list.add("222"); list.add("222"); list.add("333"); list.add("444"); list.add("333"); //for循环反向循环删除 for (int i = list.size() - 1;i >= 0;i--){ if (list.get(i).equals("222")){ list.remove(i); } } System.out.println(Arrays.toString(list.toArray())); }
运行结果:
[111, 333, 444, 333]
发现,没有问题。还是画图解释:
反向删除的时候,循环遍历完了的元素下标才有可能移动(已经遍历的元素,下标变化了也没有影响),所以没有遍历的下标不会移动,自反向删除会遍历到所有的元素,正向会跳过一些元素。
总结:反向遍历删除,没有问题(单线程)。
反向遍历删除(多线程)
public static void main(String[] args) { ArrayList<String> list = new ArrayList<String>(); list.add("111"); list.add("222"); list.add("222"); list.add("333"); list.add("444"); list.add("333"); Thread thread1 = new Thread() { @Override public void run() { remove(list,"111"); try { Thread.sleep(1000); } catch (InterruptedException e) { e.printStackTrace(); } } }; Thread thread2 = new Thread() { @Override public void run() { remove(list, "222"); try { Thread.sleep(1000); } catch (InterruptedException e) { e.printStackTrace(); } } }; Thread thread3 = new Thread() { @Override public void run() { remove(list, "333"); try { Thread.sleep(1000); } catch (InterruptedException e) { e.printStackTrace(); } } }; // 使各个线程处于就绪状态 thread1.start(); thread2.start(); thread3.start(); // 等待前面几个线程完成 try { thread1.join(); thread2.join(); } catch (InterruptedException e) { e.printStackTrace(); } System.out.println(Arrays.toString(list.toArray())); } public static void remove(ArrayList<String> list, String elem) { // 普通for循环倒序删除,删除过程中元素向左移动,不影响连续删除 for (int i = list.size() - 1; i >= 0; i--) { if (list.get(i).equals(elem)) { list.remove(list.get(i)); } } }
运行结果:
[444]
总结:多线程反向遍历删除,没有问题。
Iterator循环删除
public static void main(String[] args){ List<String> list = new ArrayList<String>(); list.add("111"); list.add("222"); list.add("222"); list.add("333"); list.add("444"); list.add("333"); //foreach循环删除 Iterator iterator = list.iterator(); while (iterator.hasNext()){ if (iterator.next().equals("222")){ list.remove(iterator.next()); } } System.out.println(Arrays.toString(list.toArray())); }
运行结果:
Exception in thread "main" java.util.ConcurrentModificationException at java.util.ArrayList$Itr.checkForComodification(ArrayList.java:909) at java.util.ArrayList$Itr.next(ArrayList.java:859) at joe.effective.Test.main(Test.java:20)
这个问题就要借助源码来分析了(JDK1.8):
public E remove(int index) { rangeCheck(index); modCount++; E oldValue = elementData(index); int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; // clear to let GC do its work return oldValue; } public boolean remove(Object o) { if (o == null) { for (int index = 0; index < size; index++) if (elementData[index] == null) { fastRemove(index); return true; } } else { for (int index = 0; index < size; index++) if (o.equals(elementData[index])) { fastRemove(index); return true; } } return false; } private void fastRemove(int index) { modCount++; int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; // clear to let GC do its work }
可以看出,ArrayList的remove方法,一种是根据下标删除,一种是根据元素删除。
发现即使看了remove方法的源码也不能找到报错的原因,由于我们使用了Iterator迭代器,那么再看看迭代器的源码,果不其然,就发现了问题所在:
private class Itr implements Iterator<E> private class ListItr extends Itr implements ListIterator<E>
public void remove() { if (lastRet < 0) throw new IllegalStateException(); checkForComodification(); // 检查修改次数 try { ArrayList.this.remove(lastRet); cursor = lastRet; lastRet = -1; expectedModCount = modCount; } catch (IndexOutOfBoundsException ex) { throw new ConcurrentModificationException(); } } final void checkForComodification() { if (modCount != expectedModCount) throw new ConcurrentModificationException(); }
Itr和ListItr是ArrayList的两个私有内部类,Itr实现了Iterator接口,ListItr继承了Itr类和实现了ListIterator接口。Itr类中也有一个remove方法,迭代器实际调用的也正是这个remove方法,上述源码也就是这个方法的源码。
由源码的第二段代码可以看出,这个remove方法中调用了ArrayList中的remove方法,在这个方法中我们注意到了expectedModCount变量和modCount变量,modCount在前面的代码中也见到了,它记录了ArrayList修改的次数,而前面的变量expectedModCount,这个变量的初值和modCount是相等的;同时在ArrayList.this.remove(lastRet);代码面前,调用了检查次数的方法checkForComodification(),这个方法做的事情很简单,就是如果expectedModCount和modCount不相等,那么就抛出异常ConcurrentModificationException。
我们在用Iterator循环删除的时候,调用的是ArrayList里面的remove方法,删除元素后modCount会增加,expectedModCount则不变,这样就造成了expectedModCount != modCount,那么就抛出异常了。
再用Iterator中的remove方法来测试:
public static void main(String[] args){ List<String> list = new ArrayList<String>(); list.add("111"); list.add("222"); list.add("222"); list.add("333"); list.add("444"); list.add("333"); Iterator iterator = list.iterator(); while (iterator.hasNext()){ if (iterator.next().equals("222")){ iterator.remove(); } } System.out.println(Arrays.toString(list.toArray())); }
运行结果:
[111, 333, 444, 333]
发现,删除成功且没有报错。
什么原因呢?我们调用的了Iterator中的迭代器删除元素,在这个方法中有:expectedModCount = modCount这样一句代码,所以当我们每删除一次元素,就同步一次,所以调用checkForComodification()时,就不会报错。如果换到多线程中,这个方法不能保证两个变量修改的一致性,结果具有不确定性,所以不推荐这种方法。
总结:Iterator调用ArrayList的删除方法报错,Iterator调用迭代器自己的删除方法,单线程不会报错,多线程会报错。
forEach循环删除
public static void main(String[] args){ List<String> list = new ArrayList<String>(); list.add("111"); list.add("222"); list.add("222"); list.add("333"); list.add("444"); list.add("333"); //foreach循环删除 for (String str : list){ if (str.equals("222")){ list.remove(str); } } System.out.println(Arrays.toString(list.toArray())); }
运行结果:
Exception in thread "main" java.util.ConcurrentModificationException at java.util.ArrayList$Itr.checkForComodification(ArrayList.java:909) at java.util.ArrayList$Itr.next(ArrayList.java:859) at joe.effective.Test.main(Test.java:20)
报错。
foreach原理是因为这些集合类都实现了Iterable接口,该接口中定义了Iterator迭代器的产生方法,并且foreach就是通过Iterable接口在序列中进行移动。也就是说:在编译的时候编译器会自动将对for这个关键字的使用转化为对目标的迭代器的使用
明白了原理就跟上述的Iterator删除调用ArrayList中remove一样了。
总结:forEach循环删除报错。