zoukankan      html  css  js  c++  java
  • Java集合:ArrayList (JDK1.8 源码解读)

    ArrayList

    ArrayList几乎是每个java开发者最常用也是最熟悉的集合,看到ArrayList这个名字就知道,它必然是以数组方式实现的集合

    关注点

    说一下ArrayList的几个特点,也是面试喜欢问的几个点:

    1.是否允许为空:是

    2.是否允许重复数据:是

    3.是否有序:是

    4.是否线程安全:否

    主要声明

    看一下ArrayList的声明:

    public class ArrayList<E> extends AbstractList<E>
            implements List<E>, RandomAccess, Cloneable, java.io.Serializable

    ArrayList继承自AbstractList,并且实现了List接口(还实现了RandomAccess、Cloneable、Serializable),List接口又继承自顶层集合接口Cellection,实现了List接口就代表它是一个有序的集合

    再看一下ArrayList声明的主要变量:

    // 默认容量
    private static final int DEFAULT_CAPACITY = 10;
    
    // 一个空的数组
    private static final Object[] EMPTY_ELEMENTDATA = {};
    
    // 默认容量的空数组,搞这么多空数组干嘛?|_・)
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
    
    // ArrayList的核心,elemenData就是底层的数组
    transient Object[] elementData;
    
    // 数组所包含的元素数量
    private int size;

    这里做一下几个主要变量的说明:

    1.DEFAULT_CAPACITY 并不是ArrayList的初始大小,只是默认大小

    2.EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA 就是两个空的对象数组,后面会在构造方法里面用到

    3.ArrayList是基于数组的一个实现,elementData就是底层的数组

    4.size数组所包含的元素的数量,ArrayList的size()方法返回的就是这个size的值

    看完这些,我们来写个例子实际操作一下:

    public static void main(String[] args)
    {
        List<String> list = new ArrayList<>();
        //List<String> list = new ArrayList<>(10);
        list.add("111"); 
        list.add("222"); 
    }

    构造方法

    1.无参构造器

    public ArrayList() {
      this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;// this(10)  jdk1.6写法
    }

    直接把声明的空数组丢给elementData,也就是说ArrayList在jdk1.8中初始化的时候大小是0,并不是10,这和jdk1.6有区别

    2.带初始化容量大小的构造器,上面例子中注释掉的代码的用法

    public ArrayList(int initialCapacity) {
            if (initialCapacity > 0) {
                this.elementData = new Object[];
            } else if (initialCapacity == 0) {
                this.elementData = EMPTY_ELEMENTDATA;
            } else {
                throw new IllegalArgumentException("Illegal Capacity: "+
                                                   initialCapacity);
            }
        }

    传递一个int类型的参数initialCapacity作为ArrayList的初始化大小,如果initialCapacity大于0,则声明一个initialCapacity大小的对象数组给elementData赋值,如果initialCapacity为0就把声明的空对象数组给elementData,如果小于0你懂的

    3. 还有一种构造器例子中未展示的 public ArrayList(Collection<? extends E> c) 传一个集合进去,也比较简单就是把集合转成数组赋值给elementData

    添加元素

    照着例子继续往下看,添加元素的时候,ArrayList会做什么,看看add的源码:

     1 public boolean add(E e) {
     2     ensureCapacityInternal(size + 1); 
     3     elementData[size++] = e;
     4     return true;
     5 }   
     6 
     7 private void ensureCapacityInternal(int minCapacity) {
     8      if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
     9          minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    10      }
    11      ensureExplicitCapacity(minCapacity);
    12 }
    13 
    14 private void ensureExplicitCapacity(int minCapacity) {
    15      modCount++;
    16      if (minCapacity - elementData.length > 0)
    17          grow(minCapacity);
    18 } 

    第二行代码是扩容用的我们先不管,直接看第三行,第三行告诉我们再调用add方法往集合里面添加元素的时候只是给对象数组加了一个元素而已,画图来说明一下

    扩容

    new ArrayList()的时候构造方法只给了一个DEFAULTCAPACITY_EMPTY_ELEMENTDATA声明的空对象数组,为什么例子的add方法的第三行还能执行往elementData里面添加元素,那么扩容就出现了

    看第七行的ensureCapacityInternal(int minCapacity)方法(注:size表示数组内元素个数,那么我要往数组添加一个元素,minCapacity就是数组执行添加时最小需要的容量),执行add("111"),ArrayList的size初始值为0,那么minCapacity的值就为1,看第8行此时elementData是不是就是那个空的对象数组DEFAULTCAPACITY_EMPTY_ELEMENTDATA,

    继续往下,把minCapacity赋值为minCapacity和默认容量两者的最大值,minCapacity的值就成了10,然后minCapacity最小容量和数组长度去比较,数组的长度已经不能满足添加元素后的最小容量,数组就会去执行扩容的grow(minCapacity)方法进行数组扩容,所以ArrayList触发扩容的条件就是数组长度不够了或者说数组已经装满了看一下grow方法具体:

    1 private void grow(int minCapacity) {
    2      int oldCapacity = elementData.length;
    3      int newCapacity = oldCapacity + (oldCapacity >> 1);
    4      if (newCapacity - minCapacity < 0)
    5          newCapacity = minCapacity;
    6      if (newCapacity - MAX_ARRAY_SIZE > 0)
    7          newCapacity = hugeCapacity(minCapacity);
    8      elementData = Arrays.copyOf(elementData, newCapacity);
    9 }

    简单的说一下,第三行:新的数组长度=原数组长度 + 原数组长度的一半,这里使用的位运算>>1 ,oldCapacity是偶数就是一半,基数就是(oldCapacity-1)/2,因为长度必须得是整数,jdk1.6中使用的是 newCapacity = (oldCapacity * 3)/2 + 1,所以当别人问你ArrayList每次扩容多少时,你可以说扩容了二分之一的大小

    问题:至于为什么要扩容二分之一?

    可以看第八行代码,当确定了新数组长度之后,会把旧的elementData复制到一个新的长度为newCapacity的数组中去然后赋值给原来的elementData数组,如图

    1.如果扩容的太少,则必须频繁的进行扩容操作,频繁的复制数组这必然会降低效率

    2.如果扩容的太多,数组内就会有很多空闲的位置,就会造成空间上的浪费

    所以JDK的开发人员必定是经过考量和权衡才会决定扩容的大小

    插入元素

    ArrayList在进行插入操作的时候也是使用的add方法,举个例子:

    1     List<String> list = new ArrayList<>();
    2     list.add("11"); 
    3     list.add("33"); 
    4     list.add("44");
    5     list.add("55");
    6     list.add(2,"22");//插入元素

    第六行便是往ArrayList里面插入元素,看一下list.add(2,"22")执行的操作:

    1 public void add(int index, E element) {
    2     rangeCheckForAdd(index);
    3 
    4     ensureCapacityInternal(size + 1); 
    5     System.arraycopy(elementData, index, elementData, index + 1,size - index);
    7     elementData[index] = element;
    8     size++;
    9 }

    先检查插入的下标是否小于0或者大于数组内元素的个数,如果不在这个范围内抛出数组下标越界IndexOutOfBoundsException

    判断下标合法性之后和添加元素一样判断是否需要扩容,然后按照下标指定的位置,把elementData数组内从指定位置开始的所有元素利用System.arraycopy方法做一个整体复制,向后移动一个位置,并且为指定下标位置插入对应的元素,画图表示一下这个过程:

    删除元素

     ArrayList提供了两种删除元素的方法:

    1.通过指定下标删除

    2.通过指定元素删除

    先看第一种:

     1 public E remove(int index) {
     2     rangeCheck(index);
     3 
     4     modCount++;
     5     E oldValue = elementData(index);
     6 
     7     int numMoved = size - index - 1;
     8     if (numMoved > 0)
     9         System.arraycopy(elementData, index+1, elementData, index,
    10                              numMoved);
    11     elementData[--size] = null; // clear to let GC do its work
    12 
    13     return oldValue;
    14}

    同样的先检查指定下标的合法性,是否在可删除范围内,记录要删除的元素,return的时候返回删除的元素,然后获取需要复制的数组长度,除非你指定删除的位置就是数组的最后一个元素,否则就是同样的套路,复制指定下标+1位置开始的元素,向前移动一个位置,并且给数组元素最后一个元素赋值null,让GC来回收它,来个图表示一下:

    再来看第二种按照元素删除:

     1 public boolean remove(Object o) {
     2         if (o == null) {
     3             for (int index = 0; index < size; index++)
     4                 if (elementData[index] == null) {
     5                     fastRemove(index);
     6                     return true;
     7                 }
     8         } else {
     9             for (int index = 0; index < size; index++)
    10                 if (o.equals(elementData[index])) {
    11                     fastRemove(index);
    12                     return true;
    13                 }
    14         }
    15      return false;
    16 }

    遍历数组寻找匹配的元素,只不过元素为null的时候使用的==判断其他类型都使用equals方法判断,如果匹配了就执行fastRemove,fastRemove干了啥呢?

    1 private void fastRemove(int index) {
    2         modCount++;
    3         int numMoved = size - index - 1;
    4         if (numMoved > 0)
    5             System.arraycopy(elementData, index+1, elementData, index,
    6                              numMoved);
    7         elementData[--size] = null; // clear to let GC do its work
    8     }

    这不就是按照下标删除的操作吗?所以这两种删除方式的差别就是第一种返回被删除的元素,第二种删除匹配元素返回true,没有匹配元素返回false

    到这里ArrayList的基本操作就讲完了,总结一下:

    ArrayList的优点:

    1.ArrayList层是数组实现的,支持随机访问,并且实现了RandomAccess接口,所以查找数据非常快

    2.顺序添加非常快,只是往数组尾部添加了一个元素

    3.从尾部删除也非常方便,只是把最后一个元素变成了null,等待GC回收

    ArrayList的缺点:

    1.如果从中间插入元素或者删除元素会涉及到数组元素的复制,如果复制的元素太多非常耗费性能

    2.ArrayList的底层数组是个动态数组,大小会随着元素的增加而进行扩容,扩容涉及到数组元素的复制,会消耗性能和空间,所以如果在使用ArrayList的时候能确定或者大概知道数据量大小,在new ArrayList的时候请一个合理的初始化大小,避免频繁扩容

    总的来说ArrayList适合顺序添加,随机访问的使用场景

    ArrayList和Vector的区别

     ArrayList里面的方法都不是线程同步的,所以ArrayList的线程是不安全的,在多线程情况下会有线程安全问题,可以使用Collections.synchronizedList方法把你的ArrayList变成一个线程安全的List

    List<String> synchronizedList = Collections.synchronizedList(list);

    还有一种方法就是使用Vector,Vector和ArrayList的实现方式几乎一样,只不过Vector的大部分public方法都是加了synchronized,ArrayList和Vector主要有两个区别:

    1.Vector线程安全

    2.Vector可以指定增长因子,扩容的时候原数组会增加增长因子个大小,如果增长因子缺省那么就会增加一倍的大小

    int newCapacity = oldCapacity + ((capacityIncrement > 0) ? capacityIncrement : oldCapacity);
  • 相关阅读:
    python_socket
    python_面向对象(其他)+异常处理+单实例
    并发编程——协程
    数据库开发——MySQL——数据类型——非数值类型
    ALGO-1 区间k大数查询
    数据库开发——MySQL——数据类型——数值类型
    BASIC-10 十进制转十六进制
    BASIC-9 特殊回文数
    BASIC-8 回文数
    BASIC-7 特殊的数字
  • 原文地址:https://www.cnblogs.com/saltiest/p/11421546.html
Copyright © 2011-2022 走看看