通常情况下,ArrayList和LinkedList的区别有以下几点:
1. ArrayList是实现了基于动态数组的数据结构,而LinkedList是基于链表的数据结构
2. 对于随机访问get和set,ArrayList要优于LinkedList,因为LinkedList要移动指针
3. 对于添加和删除操作add和remove,一般大家都会说LinkedList要比ArrayList快,因为ArrayList要移动数据
实际情况并非这样,对于添加或删除,LinkedList和ArrayList并不能明确说明谁快谁慢,结合之前分析的源码,来看看为什么是这样的,ArrayList中的随机访问、添加和删除部分源码如下:
LinkedList中的随机访问、添加和删除部分源码如下:
从源码可以看出,ArrayList想要get(int index)元素时,直接返回index位置上的元素,而LinkedList需要通过for循环进行查找,虽然LinkedList已经在查找方法上做了优化,比如index < size / 2,则从左边开始查找,反之从右边开始查找,但是还是比ArrayList要慢。这点是毋庸置疑的。
ArrayList想要在指定位置插入或删除元素时,主要耗时的是System.arraycopy动作,会移动index后面所有的元素;LinkedList主耗时的是要先通过for循环找到index,然后直接插入或删除。这就导致了两者并非一定谁快谁慢,下面通过一个测试程序来测试一下两者插入的速度:
public class ArrayOrLinked { static List<Integer> array=new ArrayList<Integer>(); static List<Integer> linked=new LinkedList<Integer>(); public static void main(String[] args) { //首先分别给两者插入10000条数据 for(int i=0;i<10000;i++){ array.add(i); linked.add(i); } //获得两者随机访问的时间 System.out.println("array time:"+getTime(array)); System.out.println("linked time:"+getTime(linked)); //获得两者插入数据的时间 System.out.println("array insert time:"+insertTime(array)); System.out.println("linked insert time:"+insertTime(linked)); } public static long getTime(List<Integer> list){ long time=System.currentTimeMillis(); for(int i = 0; i < 10000; i++){ int index = Collections.binarySearch(list, list.get(i)); if(index != i){ System.out.println("ERROR!"); } } return System.currentTimeMillis()-time; } //插入数据 public static long insertTime(List<Integer> list){ /* * 插入的数据量和插入的位置是决定两者性能的主要方面, * 我们可以通过修改这两个数据,来测试两者的性能 */ long num = 10000; //表示要插入的数据量 int index = 1000; //表示从哪个位置插入 long time=System.currentTimeMillis(); for(int i = 1; i < num; i++){ list.add(index, i); } return System.currentTimeMillis()-time; } }
主要有两个因素决定他们的效率,插入的数据量和插入的位置。我们可以在程序里改变这两个因素来测试它们的效率。
当数据量较小时,测试程序中,大约小于30的时候,两者效率差不多,没有显著区别;当数据量较大时,大约在容量的1/10处开始,LinkedList的效率就开始没有ArrayList效率高了,特别到一半以及后半的位置插入时,LinkedList效率明显要低于ArrayList,而且数据量越大,越明显。比如我测试了一种情况,在index=1000的位置(容量的1/10)插入10000条数据和在index=5000的位置以及在index=9000的位置插入10000条数据的运行时间如下:
在index=1000出插入结果:
array time:4
linked time:240
array insert time:20
linked insert time:18
在index=5000处插入结果:
array time:4
linked time:229
array insert time:13
linked insert time:90
在index=9000处插入结果:
array time:4
linked time:237
array insert time:7
linked insert time:92
从运行结果看,LinkedList的效率是越来越差
所以当插入的数据量很小时,两者区别不太大,当插入的数据量大时,大约在容量的1/10之前,LinkedList会优于ArrayList,在其后就劣与ArrayList,且越靠近后面越差。所以个人觉得,一般首选用ArrayList,由于LinkedList可以实现栈、队列以及双端队列等数据结构,所以当特定需要时候,使用LinkedList,当然咯,数据量小的时候,两者差不多,视具体情况去选择使用;当数据量大的时候,如果只需要在靠前的部分插入或删除数据,那也可以选用LinkedList,反之选择ArrayList反而效率更高。
但是,这个实验结果明显不对,增加和删除数据的时候,ArrayList都是在末尾添加数据,arraycopy的开销是最低的,LinkedList添加数据总是在末尾,每次都要遍历整个链表,ArrayList比LinkedList效率要高,而实际随机添加和删除,从大概率上来讲,ArrayList性能还是低于LinkedList
建议测试用例考虑三个因素:
1)被测试的list的长度,可分为min, max两种情况
2)插入的list的长度,也可分为较小,较大两种情况
3)插入的位置,不妨考虑第二个位置,倒数第二个位置。 然后做组合出8种情况,测试的结果填写表格,得出初步结论:大数据量插入linked比较快,小数据量arraylist比较快