zoukankan      html  css  js  c++  java
  • Java基础系列--集合之ArrayList

    原创作品,可以转载,但是请标注出处地址:http://www.cnblogs.com/V1haoge/p/8494618.html

    一、概述

      ArrayList是Java集合体系中最常使用,也是最简单的集合类,是以数组实现的线性表。

      数组在内存中是以一段连续的内存来进行存放的,同样,ArrayList也是如此,初始化时可以指定初始容量,也可以以默认容量(10)创建底层数组,由于ArrayList属于可变长列表,采用可变数组实现,数组本身是不变的,一旦定义就无法变长,可变数组使用创建新数组拷贝旧数据的方式间接实现可变长,习惯称为扩容。

      ArrayList底层数组的扩容算法依据的是一个扩容算法来计算新的数组长度,扩容的条件是当前底层数组不足以容纳新的元素。

    二、继承结构 

      ArrayList的类结构如下所示:

    三、底层实现

    3.1 底层结构

      如前所述,ArrayList底层采用的是数组结构。

    1     private transient Object[] elementData;

      elementData就是定义在ArrayList底层的数组,而数组就是一连串连续的内存,其逻辑结构如下:

      上图表示初始容量为10的ArrayList的底层数组,默认的初始容量为10,而列表长度用size来定义:

    1     private int size;

      这个表示的是列表中元素的数量,与数组的长度不同,size默认为0,表示列表为空。

    3.2 添加元素

      初始化的ArrayList的底层数组是没有元素的,即数组的各位均为null。使用add方法我们可以为列表添加元素,ArrayList中的添加单个元素有两种方式,一种是直接添加,另一种是定位添加。还有添加一组元素的两种方法,一种是定组直接添加,一种是定位定组添加

    3.2.1 直接添加

      所谓直接添加就是将新元素添加到列表末尾,其实现逻辑如下:

    1     public boolean add(E e) {
    2         ensureCapacityInternal(size + 1);  // Increments modCount!!
    3         elementData[size++] = e;
    4         return true;
    5     }

      上面的逻辑很简单,首先进行列表容量检测(容后详述),然后直接将新元素放置到底层数组中即可。

      图中显示添加新元素到列表中,添加之后size的值会增加,这个size即指向数组最新空位的下标,有代表数组中元素的个数。

    3.2.2 定位添加

      所谓定位添加,就是我们将新元素,添加到列表指定下标处。

    复制代码
    1     public void add(int index, E element) {
    2         rangeCheckForAdd(index);
    3 
    4         ensureCapacityInternal(size + 1);  // Increments modCount!!
    5         System.arraycopy(elementData, index, elementData, index + 1,
    6                          size - index);
    7         elementData[index] = element;
    8         size++;
    9     }
    复制代码

      首先进行index参数校验,校验通过后进行列表容量检测(容后详述),然后将指定下标处开始到结尾的所以元素整体后移以为,下标处空出来后填充新添加的元素。这个添加操作涉及到一部分元素的整体移动,较为耗时,具体视实际移动的元素数量而定。

      实例:原始列表中由e1-e5共5个元素,现在执行add(2,e6),表示在下标2处添加元素e6,执行步骤如下:

      注意:add(int,E)方法底层数组元素的后移操作采用的是System.arraycopy()方法实现的,不仅此处,后面还会多次使用这个方法来实现数组元素的拷贝。

    3.2.3 定组直接添加

      定组直接添加方法为:addAll(Collection<? extends E>),直接将给定的集合中的元素依次添加到当前列表的后面。

    复制代码
    1     public boolean addAll(Collection<? extends E> c) {
    2         Object[] a = c.toArray();
    3         int numNew = a.length;
    4         ensureCapacityInternal(size + numNew);  // Increments modCount
    5         System.arraycopy(a, 0, elementData, size, numNew);
    6         size += numNew;
    7         return numNew != 0;
    8     }
    复制代码

      首先进行集合转化,将其转化为数组,获取其长度(元素个数),进行列表容量检测(容后详述),将转化好的数组元素复制到当前列表的底层数组后面,计算size。

      明显类似于直接添加,只是添加的数量不同而已,做个简单的图示:

      只是这里讲给定的集合简化为数组形式,其实在源码中我们也能发现,在第2行对集合进行了数组转化,便于操作。元素的添加还是使用数组拷贝的形式实现。

    3.2.4 定位定组添加

       定位定组添加类似于定位添加,同样只是添加的元素个数不同。

    复制代码
     1     public boolean addAll(int index, Collection<? extends E> c) {
     2         rangeCheckForAdd(index);
     3 
     4         Object[] a = c.toArray();
     5         int numNew = a.length;
     6         ensureCapacityInternal(size + numNew);  // Increments modCount
     7 
     8         int numMoved = size - index;
     9         if (numMoved > 0)
    10             System.arraycopy(elementData, index, elementData, index + numNew,
    11                              numMoved);
    12 
    13         System.arraycopy(a, 0, elementData, index, numNew);
    14         size += numNew;
    15         return numNew != 0;
    16     }
    复制代码

      首先进行index参数校验,然后将集合转化为数组,获取其中元素个数numNew,再进行列表容量检测,获取需要后移的元素的个数,使用数组复制的方式将这些元素后移,再将转化的数组元素复制迁移到空出的空位处。计算size。

      参照下方实例,原始列表有两个元素:e1、e2,现在给定集合包含3个元素,e3、e4、e5,现在执行add(1,Collection<? extends E>)

      也就是将给定集合的元素嵌入到当前列表中。

     3.3 获取元素

      获取指定下标处的元素,复杂度O(1),只要获取数组执行下标处的元素就可以。

    1     public E get(int index) {
    2         rangeCheck(index);
    3 
    4         return elementData(index);
    5     }

      首先进行index参数校验,然后获取返回数组执行下标的元素。

    3.4 修改元素

      修改元素需要提供修改下标和新值,直接用新值替换旧值即可。

    复制代码
    1     public E set(int index, E element) {
    2         rangeCheck(index);
    3 
    4         E oldValue = elementData(index);
    5         elementData[index] = element;
    6         return oldValue;
    7     }
    复制代码

      首先进行index参数校验,然后保存指定下标的旧值,替换为新值,将旧值返回。

    3.5 删除元素

      删除元素的操作挺多的,针对不同的情况:

    3.5.1 定位删除

      定位删除,即删除指定下标的元素,需要提供删除的元素的下标。

    复制代码
     1     public E remove(int index) {
     2         rangeCheck(index);
     3 
     4         modCount++;
     5         E oldValue = elementData(index);
     6 
     7         int numMoved = size - index - 1;
     8         if (numMoved > 0)
     9             System.arraycopy(elementData, index+1, elementData, index,
    10                              numMoved);
    11         elementData[--size] = null; // Let gc do its work  
    12 
    13         return oldValue;
    14     }
    复制代码

      首先进行index参数校验,modCount自增1,保存指定下标处的旧值,然后将指定下标的下一个元素到结尾的元素整体前移一位,后面元素覆盖前面元素,指定下标处的旧值被删除,然后将原来的末尾元素置空,size自减1,最后将旧值返回。

      同样数组元素的移动采用数组复制的方式实现。

      实例:原始列表拥有5个元素,e1-e5,现移除下标2处的元素:remove(2)

     

     3.5.2 定元素删除

      指定要删除的元素的值,在列表中查询该值,删除查询到的第一个。即该方法只会删除符合条件的首个元素(即使列表中存在多个符合条件的元素)。

    复制代码
     1     public boolean remove(Object o) {
     2         if (o == null) {
     3             for (int index = 0; index < size; index++)
     4                 if (elementData[index] == null) {
     5                     fastRemove(index);
     6                     return true;
     7                 }
     8         } else {
     9             for (int index = 0; index < size; index++)
    10                 if (o.equals(elementData[index])) {
    11                     fastRemove(index);
    12                     return true;
    13                 }
    14         }
    15         return false;
    16     }
    17 
    18     private void fastRemove(int index) {
    19         modCount++;
    20         int numMoved = size - index - 1;
    21         if (numMoved > 0)
    22             System.arraycopy(elementData, index+1, elementData, index,
    23                              numMoved);
    24         elementData[--size] = null; // Let gc do its work
    25     }
    复制代码

      指定元素进行删除的情况,较为复杂,需要针对元素的情况进行分析,如果指定元素为null,则删除第一个null元素,若指定元素非null,则查询首个符合条件的元素进行删除。

      欲删除元素,必须先找到要删除元素的下标,这个过程由循环实现(第3行和第9行),找到下标之后,调用内部方法fastRemove(int),进行指定下标元素的删除,即定位删除,然后返回true,表示删除成功。

      还有一种情况那就是指定的元素在列表中查询不到,这是直接返回false即可。

      这种删除底层使用的仍然是定位删除。不在画图举例了。

     3.5.3 定组删除

      所谓定组删除,就是删除当前列表中所以与给定集合中元素相同的元素,该操作需要制定一个欲要删除的元素的集合(Collection)。

    复制代码
     1     public boolean removeAll(Collection<?> c) {
     2         return batchRemove(c, false);
     3     }
     4 
     5     private boolean batchRemove(Collection<?> c, boolean complement) {
     6         final Object[] elementData = this.elementData;
     7         int r = 0, w = 0;
     8         boolean modified = false;
     9         try {
    10             for (; r < size; r++)
    11                 if (c.contains(elementData[r]) == complement)
    12                     elementData[w++] = elementData[r];
    13         } finally {
    14             // Preserve behavioral compatibility with AbstractCollection,
    15             // even if c.contains() throws.
    16             if (r != size) {
    17                 System.arraycopy(elementData, r,
    18                                  elementData, w,
    19                                  size - r);
    20                 w += size - r;
    21             }
    22             if (w != size) {
    23                 for (int i = w; i < size; i++)
    24                     elementData[i] = null;
    25                 modCount += size - w;
    26                 size = w;
    27                 modified = true;
    28             }
    29         }
    30         return modified;
    31     }
    复制代码

      定组删除的complement传值为false,用于第11行比较,表示如果给定集合中不包含当前列表的当前下标的元素的情况下,执行内部语句块,将这个元素保留下来(亦即若包含该元素则不保留该元素,最后查遗补漏时,会将其消失【finally块逻辑】)

    实例:当前列表是包含5个元素e1-e5,给定集合元素包括e2,e3,e5三个元素,则定位删除的图示为:

      从第二步开始循环,每次循环结束,r就会自增1,而w表示的是下一个保留元素的下标或者保留元素的个数。循环在第七步r自增到5,不满足循环条件时结束,最后r=5,w=2,亦即共删除3个元素,modCount需要自增(r-w=5-2=3)次。

      最后finally中执行第二个if块,将多余的元素位置置null,再计算modCount和size。

    3.5.4 定组保留删除

      定组保留删除逻辑与定组删除正好相反,需要将给定集合中包含的当前列表的元素保留下来,将不包含的删除。

    1     public boolean retainAll(Collection<?> c) {
    2         return batchRemove(c, true);
    3     }

      实例,同上,图示如下:

      执行过程同上。

    3.5.5 范围删除

      ArrayList中还有一个范围删除方法:removeRange(int,int),根据给定的两个下标,删除下标范围之内的所有元素。该方法是protected修饰的,那么很明显,这个方法并不是面向ArrayList使用者的,而是面向JDK实现者的,这里只做简单介绍。

    复制代码
     1     protected void removeRange(int fromIndex, int toIndex) {
     2         modCount++;
     3         int numMoved = size - toIndex;
     4         System.arraycopy(elementData, toIndex, elementData, fromIndex,
     5                          numMoved);
     6 
     7         // Let gc do its work
     8         int newSize = size - (toIndex-fromIndex);
     9         while (size != newSize)
    10             elementData[--size] = null;
    11     }
    复制代码

      很简单,将toIndex到结尾的元素复制到fromIndex,空出的位置全部置空即可。

    3.6 查找元素

      查找元素包括3个方法:

        contains(Object)  检查当前列表是否包含某个元素

        indexOf(Object)  检查给定元素在当前列表中首次出现的下标

        lastIndexOf(Object)  检查给定元素在当前列表中最后出现的下标

    3.6.1 包含方法

    1     public boolean contains(Object o) {
    2         return indexOf(o) >= 0;
    3     }

      好家伙,自己啥也不干,就靠后面了...

    3.6.2 前序查找

      前序查找就是从头开始查找元素,返回首次出现的下标。

    复制代码
     1     public int indexOf(Object o) {
     2         if (o == null) {
     3             for (int i = 0; i < size; i++)
     4                 if (elementData[i]==null)
     5                     return i;
     6         } else {
     7             for (int i = 0; i < size; i++)
     8                 if (o.equals(elementData[i]))
     9                     return i;
    10         }
    11         return -1;
    12     }
    复制代码

      源码显示,需要分两种情况考虑,如果给定元素为null,则查找首个null元素的下标并返回,如果给定元素非null,则查找首次出现的下标并返回,如果列表中不包含该元素,则返回-1。

    3.6.3 后序查找

       后序查找就是前序查找的反向查找方式:

    复制代码
     1     public int lastIndexOf(Object o) {
     2         if (o == null) {
     3             for (int i = size-1; i >= 0; i--)
     4                 if (elementData[i]==null)
     5                     return i;
     6         } else {
     7             for (int i = size-1; i >= 0; i--)
     8                 if (o.equals(elementData[i]))
     9                     return i;
    10         }
    11         return -1;
    12     }
    复制代码

      参考前后查找的源码不难发现,模式一致,只是查找的方向不同而已。

    3.7 列表扩容

      列表的扩容是底层自动进行的,对列表的使用者是完全透明的,因此其方法都是私有的。扩容的条件与算法并不复杂:

    复制代码
     1     private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
     2 
     3     private void ensureCapacityInternal(int minCapacity) {
     4         modCount++;
     5         // overflow-conscious code
     6         if (minCapacity - elementData.length > 0)
     7             grow(minCapacity);
     8     }
     9 
    10     private void grow(int minCapacity) {
    11         // overflow-conscious code
    12         int oldCapacity = elementData.length;
    13         int newCapacity = oldCapacity + (oldCapacity >> 1);
    14         if (newCapacity - minCapacity < 0)
    15             newCapacity = minCapacity;
    16         if (newCapacity - MAX_ARRAY_SIZE > 0)
    17             newCapacity = hugeCapacity(minCapacity);
    18         // minCapacity is usually close to size, so this is a win:
    19         elementData = Arrays.copyOf(elementData, newCapacity);
    20     }
    21 
    22     private static int hugeCapacity(int minCapacity) {
    23         if (minCapacity < 0) // overflow
    24             throw new OutOfMemoryError();
    25         return (minCapacity > MAX_ARRAY_SIZE) ?
    26             Integer.MAX_VALUE :
    27             MAX_ARRAY_SIZE;
    28     }
    复制代码

      扩容条件:拿给定的容量(长度值)minCapacity与当前列表的底层数组的容量elementData.length进行比较,如果前者大,则说明容量不足,需要扩容,调用grow(minCapacity)进行扩容。

      扩容算法:扩容时存在三种情况,第一种就是普通的自动扩容,按照oldCapacity + (oldCapacity >> 1)算法进行扩容,上式计算得出的即为新的数组容量,一般针对的是单个元素添加的情况,即直接添加和定位添加的情况,这种情况下,每次只添加一个元素,不会出现第14行成功的可能,但是如果是定组直接添加和定位定组添加的时候,由于添加的集合元素数量未知,一旦给定的minCapacity比计算得出的新容量要大,说明计算得出的容量不足以容纳所有的元素,这是直接使用minCapacity作为新容量进行扩容。即优先使用算法计算的容量进行扩容,一旦计算容量还不足以容纳新元素,则使用给定的容量进行扩容。

      还有一种特殊情况,当本次扩容时,计算得到的容量,或者给定的容量大于MAX_ARRAY_SIZE(=Integer.MAX_VALUE - 8)的情况下,需要调用hugeCapacity(minCapacity)方法进行人为限制容量超限,将容量限制在整形的最大值之内。

      最后进行数组扩容,创建新数组,拷贝数据。

    3.8 迭代器

      列表的迭代必不可少,而且这里还会用到一个出现很久的变量modCount,此前我们对它一无所知。

      modCount记录的是列表结构发生变化的次数,所谓结构变化包括:新增元素,删除元素,清空元素,扩容等。

      ArrayList的迭代器有两种,ListIterator和Iterator。二者虽然都是迭代器,但是还是有些不同的。

  • 相关阅读:
    Linux-进程描述(1)—进程控制块
    C++中的继承(2)类的默认成员
    Linux系统date命令的参数及获取时间戳的方法
    new/new[]和delete/delete[]是如何分配空间以及释放空间的
    golang垃圾回收
    golang内存分配
    go中的关键字-reflect 反射
    go中的关键字-go(下)
    go中的关键字-go(上)
    go中的关键字-defer
  • 原文地址:https://www.cnblogs.com/pierkakaluo/p/8497079.html
Copyright © 2011-2022 走看看