此文章转载https://www.jianshu.com/p/53cf2a3bf3da
一、ArrayList的数据结构:
ArrayList的数据结构如下:
说明:通过查看源码可以知道ArrayList底层的数据结构是数组,数组元素的类型是Object类型,即可以存放所有类型的数据,所有对ArrayList类的实例的操作底层都是基于数组实现。
二、ArrayList源码分析:
1、ArrayList的继承关系:
public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable
说明:ArrayList继承了AbstractList抽象父类,实现了List接口(规定List的操作规范)、RandomAccess(可随机访问)、Cloneable(可拷贝)、Serializable(可序列化)
2、ArrayList类的属性:
说明:类的属性中核心属性为elementData,类型是Object[],用于存放实际元素,并且标记为transient,意味着在序列化的时候,此此段不会被序列化。
public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable { // 版本号 private static final long serialVersionUID = 8683452581122892189L; // 缺省容量 private static final int DEFAULT_CAPACITY = 10; // 空对象数组 private static final Object[] EMPTY_ELEMENTDATA = {}; // 缺省空对象数组 private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; // 元素数组 transient Object[] elementData; // 实际元素大小,默认为0 private int size; // 最大数组容量 private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8; }
3、ArrayList类构造函数:
//指定elementData数组的大小,不允许初始化大小<0,否则抛出异常 public ArrayList(int initialCapacity) { if (initialCapacity > 0) { // 初始容量大于0 this.elementData = new Object[initialCapacity]; // 初始化元素数组 } else if (initialCapacity == 0) { // 初始容量为0 this.elementData = EMPTY_ELEMENTDATA; // 为空对象数组 } else { // 初始容量小于0,抛出异常 throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); } } //ArrayList()构造函数: //当为指定初始大小时,会给elementData赋值为空集合 public ArrayList() { // 无参构造函数,设置元素数组为空 this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; } //ArrayList(Collection<?extends E>)构造函数 //当传递的参数为集合类型时,会把集合类型转化为数组类型,并赋值给elementData public ArrayList(Collection<? extends E> c) { // 集合参数构造函数 elementData = c.toArray(); // 转化为数组 if ((size = elementData.length) != 0) { // 参数为非空集合 if (elementData.getClass() != Object[].class) // 是否成功转化为Object类型数组 elementData = Arrays.copyOf(elementData, size, Object[].class); // 不为Object数组的话就进行复制 } else { // 集合大小为空,则设置元素数组为空 this.elementData = EMPTY_ELEMENTDATA; } }
4、核心方法分析:
4.1、add()方法:
public boolean add(E e) { ensureCapacityInternal(size + 1); // Increments modCount!! elementData[size++] = e; return true; }
可以看到,add方法里面调用了ensureCapacityInternal()方法,该方法可以理解为为确保elementData数组有合适的大小,其具体实现如下:
private void ensureCapacityInternal(int minCapacity) { ensureExplicitCapacity(calculateCapacity(elementData, minCapacity)); }
private static int calculateCapacity(Object[] elementData, int minCapacity) { if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {//判断该数组是否是空数组 return Math.max(DEFAULT_CAPACITY, minCapacity);//取较大值 } return minCapacity; }
在ensureCapacityInternal()方法中,调用了 ensureExplicitCapacity()方法,该方法也是为了确保数组有合适的大小,具体实现如下:
private void ensureExplicitCapacity(int minCapacity) { // 结构性修改加1 modCount++; if (minCapacity - elementData.length > 0) grow(minCapacity); }
而ensureExplicitCapacity()方法中,又调用了grow()方法,具体实现如下:
private void grow(int minCapacity) { int oldCapacity = elementData.length; // 旧容量 int newCapacity = oldCapacity + (oldCapacity >> 1); // 新容量为旧容量的1.5倍,此处用了位运算提高效率 if (newCapacity - minCapacity < 0) // 新容量小于参数指定容量,修改新容量 newCapacity = minCapacity; if (newCapacity - MAX_ARRAY_SIZE > 0) // 新容量大于最大容量 newCapacity = hugeCapacity(minCapacity); // 指定新容量 // 拷贝扩容 elementData = Arrays.copyOf(elementData, newCapacity); }
总结:通过以上方法跟踪,我们可以发现add()方法最终调用了grow()方法,其他均为过程方法,grow()方法里面定义了数组元素的存储以及扩容方式。
4.2、set()方法:需要设置下标
public E set(int index, E element) { // 检验索引是否合法 rangeCheck(index); // 旧值 E oldValue = elementData(index); // 赋新值 elementData[index] = element; // 返回旧值 return oldValue; }
4.3、indexOf()方法:
// 从首开始查找数组里面是否存在指定元素 public int indexOf(Object o) { if (o == null) { // 查找的元素为空 for (int i = 0; i < size; i++) // 遍历数组,找到第一个为空的元素,返回下标 if (elementData[i]==null) return i; } else { // 查找的元素不为空 for (int i = 0; i < size; i++) // 遍历数组,找到第一个和指定元素相等的元素,返回下标 if (o.equals(elementData[i])) return i; } // 没有找到,返回空 return -1; }
说明:从头开始查找与指定元素相等的元素,可以查找null元素,即ArrayList中可以存null元素,与该方法对应的lastIndexOf()方法,表示从尾部元素开始查找。
4.4、get()方法:
E elementData(int index) { return (E) elementData[index]; }
说明:get方法会坚持索引是否合法(只检查是否大于size,而没有检查是否小雨0),非法则抛出数组越界异常,值得注意的是,在get方法中通过调用elementData方法返回具体元素,
elementData方法实现如下:
E elementData(int index) { return (E) elementData[index]; }
注意:返回的值都经过了向下转型(Object->E),这是应用程序设计中屏蔽的小细节
4.5、remove()方法:
public E remove(int index) { // 检查索引是否合法 rangeCheck(index); modCount++; E oldValue = elementData(index); // 需要移动的元素的个数=数组总长度-(该元素所在的位置索引+1) int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); // 赋值为空,有利于进行GC elementData[--size] = null; // 返回旧值 return oldValue; }
说明:remove方法用于移除指定下标的元素,此时会把指定下标到数组末尾的元素向前移动一个单位,并且会把数组最后一个元素设置为null,这样做是为了方便之后整个数组不使用时,会被GC,这是个小技巧。
三、总结:
ArrayList和LinkedList的区别:
1、ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。
2、对于随机访问get和set,ArrayList优于LinkedList,因为LinkedList要移动指针。
3、对于新增和删除操作add和remove(不是在尾部添加删除),LinkedList比较占优势,因为ArrayList要移动数据。
ArrayList和Vector的区别:
1、Vector和ArrayList几乎是完全相同的,唯一的区别在于Vector是同步类(synchronized),属于强同步类。因此开销就比ArrayList要大,访问要慢。正常情况下,大多数的Java程序员使用ArrayList而不是Vector,因为同步完全可以由程序员自己来控制。
2、 Vector每次扩容请求其大小的2倍空间,而ArrayList是1.5倍。
3、Vector还有一个子类Stack.
总结
ArrayList总体来说比较简单,不过ArrayList还有以下一些特点:
-
ArrayList基于数组方式实现,无容量的限制(会扩容)
-
添加元素时可能要扩容(所以最好预判一下),删除元素时不会减少容量(若希望减少容量,trimToSize()),删除元素时,将删除掉的位置元素置为null,下次gc就会回收这些元素所占的内存空间。
-
线程不安全,会出现fall-fail。下一篇文章会详细讲,
-
add(int index, E element):添加元素到数组中指定位置的时候,需要将该位置及其后边所有的元素都整块向后复制一位
-
get(int index):获取指定位置上的元素时,可以通过索引直接获取(O(1))
-
remove(Object o)需要遍历数组
-
public boolean remove(Object o) { if (o == null) { for (int index = 0; index < size; index++) if (elementData[index] == null) { fastRemove(index); return true; } } else { for (int index = 0; index < size; index++) if (o.equals(elementData[index])) { fastRemove(index); return true; } } return false; }
-
remove(int index)不需要遍历数组,只需判断index是否符合条件即可,效率比remove(Object o)高
-
contains(E)需要遍历数组
-
public boolean contains(Object o) { return indexOf(o) >= 0; } public int indexOf(Object o) { if (o == null) { for (int i = 0; i < size; i++) if (elementData[i]==null) return i; } else { for (int i = 0; i < size; i++) if (o.equals(elementData[i])) return i; } return -1; }
-
使用iterator遍历可能会引发多线程异常