zoukankan html css js c++ java

ArrayList源码分析和缩减版手写ArrayList（jdk1.8和1.9）

参考：https://blog.csdn.net/weixin_38405253/article/details/100170568
https://www.cnblogs.com/gxl1995/p/7534171344218b3784f1beb90d621337.html
https://www.cnblogs.com/yonyong/p/9323546.html
https://www.cnblogs.com/mabingxue/p/9176324.html

看源码一定要有耐心，第一次看可能看不懂，后面再看可能还是看不懂，但是别放弃治疗，我还是要看。不过这ArrayList我还是看的懂一些的。我看了很久发现我的idea里面了源码和我查到的很多分析的源码都不一样，找了很久发现，原来大家都是jdk1.8版本的，我的是jdk1.9版本的，里面有一些不一样，发现大家都推荐jkd1.8，普遍推荐吧，应该。
https://segmentfault.com/a/1190000019326016?utm_source=tag-newest（这个好像是jdk1.9的ArrayList分析）

看了上面参考里的源码分析和自己看源码，就记录一下自己的所得，大多都是复制的，不过也加了自己的一些见解（文章中可能会有错误），所以写个随笔加深印象。

简介：

ArrayList也就是动态数组，底层是数组实现的。先说说数组，数组在内存中是连续存储的，它的索引速度非常快，赋值和修改元素很快捷。因为数组是连续存储的，所以Arraylist在内存中也是连续的。索引Arraylist的时候是要比原生数组慢的，因为你要用get方法，也就是函数调用，而数组就是直接[]访问，相当于直接操作内存地址，速度肯定比函数调用快。但是数组有不足，在数组的两个数据中间插入数据是很麻烦的，并且在声明数组的时候我们必须同时指定数组的长度，数组的长度过长，会造成内存浪费，数组的长度过短会造成数据的溢出错误。所以就有了Arraylist来有取舍的优化，ArrayList和Array各有优点和用处。

Array和ArrayList的一些不同点：

1、Array可以包含基本类型和对象类型，ArrayList只能包含对象类型。

2、Array大小是固定的，ArrayList的大小是动态变化的。

3、ArrayList提供了更多的方法和特性，比如：add()，removeAll()，iterator()等等。所以ArrayList的可操作性就更强了，可以对数据方便的添加、插入和删除。（其实它的插入、删除的效率不高，LinkedList的插入、删除高）

ArrayList还存在不安全类型和装箱和拆箱的缺点，可以用泛型解决这些缺点。ArrayList还是线程不安全的，因为它里面的方法不能保证操作的原子性。

ArrayList继承了AbstractList，实现了List、RandomAccess[随机访问], Cloneable[可克隆], java.io.Serializable[序列化]。

扩展：序列化是指：将对象转换成以字节序列的形式来表示，以便用于持久化和传输。

源码分析（不是很全）（jdk1.8）

1、属性分析

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    private static final long serialVersionUID = 8683452581122892189L;

    /**
     * Default initial capacity.默认初始化容量
     */

    private static final int DEFAULT_CAPACITY = 10;

    /**如果用户自定义容量为0，默认用下面这个来初始化ArrayList，空数组
     * Shared empty array instance used for empty instances.
     */
    private static final Object[] EMPTY_ELEMENTDATA = {};

    /**
     * Shared empty array instance used for default sized empty instances. We
     * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
     * first element is added.
     */这又来了一个空数组，当用户没有指定ArrayList的容量时（即调用无参构造函数），返回的是该
　　　　数组，当用户第一次添加元素是，该数组会扩容，变为默认容量为10的一个数组，在ensureCapacity（）实现
　　　　它与上一个的区别就是该数组是默认返回的，而上一个是在用户指定容量为0时返回
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

    /**
     * The array buffer into which the elements of the ArrayList are stored.
     * The capacity of the ArrayList is the length of this array buffer. Any
     * empty ArrayList with elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
     * will be expanded to DEFAULT_CAPACITY when the first element is added.
     */这是我们ArrayList底层用到的数组，用transient修饰
    transient Object[] elementData; // non-private to simplify nested class access

    /**
     * The size of the ArrayList (the number of elements it contains).
     *
     * @serial
     */ArrayList实际存储的数据数量
    private int size;

transient关键字解析：

Java中transient关键字的作用，简单地说，就是让某些被修饰的成员属性变量不被序列化。

有了transient关键字声明，则这个变量不会参与序列化操作，即使所在类实现了Serializable接口，反序列后该变量为空值。

那么问题来了：ArrayList中数组声明：transient Object[] elementData;，事实上我们使用ArrayList在网传输用的很正常，并没有出现空值。

原来：ArrayList在序列化的时候会调用writeObject()方法，将size和element写入ObjectOutputStream；反序列化时调用readObject()，从ObjectInputStream获取size和element，再恢复到elementData。

那为什么不直接用elementData来序列化，而采用上诉的方式来实现序列化呢？

原因在于elementData是一个缓存数组，它通常会预留一些容量，等容量不足时再扩充容量，那么有些空间可能就没有实际存储元素，采用上诉的方式来实现序列化时，就可以保证只序列化实际存储的那些元素，而不是整个数组，从而节省空间和时间。

2、构造方法分析

    /**
     * 创建一个初试容量的、空的ArrayList
     * @param  initialCapacity初始容量
     * @throws IllegalArgumentException当初始容量值非法(小于0)时抛出
     */
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                    initialCapacity);
        }
    }

    /**
     * 无参构造函数：
     * - 创建一个空的 ArrayList，此时其内数组缓冲区elementData = {}, 长度为 0
     * - 当元素第一次被加入时，扩容至默认容量 10
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    /**
     * 创建一个包含collection的ArrayList
     * @param c 要放入 ArrayList 中的集合，其内元素将会全部添加到新建的 ArrayList 实例中
     * @throws NullPointerException 当参数 c 为 null 时抛出异常
     */
    public ArrayList(Collection<? extends E> c) {
        //将集合转化成Object[]数组
        elementData = c.toArray();
        //把转化后的Object[]数组长度赋值给当前ArrayList的size，并判断是否为0
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            // 这句话意思是：c.toArray 可能不会返回 Object[]，可以查看 java 官方编号为 6260652 的 bug
            if (elementData.getClass() != Object[].class)
                // 若 c.toArray() 返回的数组类型不是 Object[]，则利用 Arrays.copyOf(); 来构造一个大小为 size 的 Object[] 数组
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // 替换空数组
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

3、主干方法

trimToSize（）方法，这个方法用来最小化实例存储

public void trimToSize() {
        // modCount 是 AbstractList 的属性值：protected transient int modCount = 0;
        modCount++;
        if (size < elementData.length) {
            elementData = (size == 0)
              ? EMPTY_ELEMENTDATA
              : Arrays.copyOf(elementData, size);
        }
    }

这个方法里面突然混进了一个modCount，这个数了作用是为了记录修改次数，而且这个数在本数据结构对应迭代器iterator中很重要，（Fail-Fast机制（快速失败机制））ArrayList是线程不安全的，在使用迭代器遍历List时有其他线程修改了List，会抛出java.util.ConcurrentModificationException异常。Itr类里有一个成员变量expectedModCount，它的值为创建Itr对象的时候List的modCount值。用此变量来检验在迭代过程中List对象是否被修改了，如果被修改了则抛出java.util.ConcurrentModificationException异常。更具体的可以看下面这个链接里面的
https://blog.csdn.net/ljw619/article/details/79150635（ArrayList中的modCount的作用）

下面是ArrayList的扩容机制

  public void ensureCapacity(int minCapacity) {
        // 最小扩充容量，默认是 10
        //判断是不是空的ArrayList,如果是的最小扩充容量10，否则最小扩充量为0
        int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
                ? 0
                : DEFAULT_CAPACITY;
        // 若用户指定的最小容量 > 最小扩充容量，则以用户指定的为准，否则还是 10
        if (minCapacity > minExpand) {
            ensureExplicitCapacity(minCapacity);
        }
    }

这上面一个ensureCapacity方法中minExpand这个参数我一开始没看懂，这个方法是提供给用户用的，感觉没啥用，在我的jkd1.9里面是把这个方法和下面一个方法合并了，在ArrayList的实现中并没有使用。我大概理解就是当我们的elementData为空的时候minExpand=10，我们指定的minCapacity如果大于minExpand（10），就会执行ensureExplicitCapacity（minCapacity）方法，如果elementData不为空则minExpand=0，我们指定的minCapacity大于minExpand（0），执行ensureExplicitCapacity（minCapacity）方法。如果有必要，增加ArrayList实例的容量，以确保它至少能容纳的数量。如果我们要看容量的话要用反射来看，size（）方法得到的是列表中的元素的个数而不是容量。

 private void ensureCapacityInternal(int minCapacity) {
        // 若 elementData == {}，则取 minCapacity 为 默认容量和参数 minCapacity 之间的最大值
        // 注：ensureCapacity() 是提供给用户使用的方法，在 ArrayList 的实现中并没有使用
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity= Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        ensureExplicitCapacity(minCapacity);
    }

上面这个ensureCapacityInternal方法是我们ArrayList实现中的方法，得到做小的扩容量

    /**
     * 私有方法：明确 ArrayList 的容量
     * - 用于内部优化，保证空间资源不被浪费：尤其在 add() 方法添加时起效
     * @param minCapacity    指定的最小容量
     */
    private void ensureExplicitCapacity(int minCapacity) {
        // 将“修改统计数”+1，该变量主要是用来实现fail-fast机制的
        modCount++;
        // 防止溢出代码：确保指定的最小容量 > 数组缓冲区当前的长度
        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

ensureExplicitCapacity（）判断是否需要扩容

在我的jdk1.9中是直接把上面这三个方法直接整合了，扩容直接就用grow（）和newCapacity（），在add方法里直接grow了可以在此看一看 https://segmentfault.com/a/1190000019326016?utm_source=tag-newest（jdk1.9的ArrayList分析）

MAX_ARRAY_SIZE常量

    /**
     * 数组缓冲区最大存储容量
     * - 一些 VM 会在一个数组中存储某些数据--->为什么要减去 8 的原因
     * - 尝试分配这个最大存储容量，可能会导致 OutOfMemoryError(当该值 > VM 的限制时)
     */
    private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

grow（）扩容方法

    /**
     * 私有方法：扩容，以确保 ArrayList 至少能存储 minCapacity 个元素
     * - 扩容计算：newCapacity = oldCapacity + (oldCapacity >> 1);  扩充当前容量的1.5倍
     * @param minCapacity    指定的最小容量
     */
    private void grow(int minCapacity) {
        // 防止溢出代码
        int oldCapacity = elementData.length;
        // 运算符 >> 是带符号右移. 如 oldCapacity = 10,则 newCapacity = 10 + (10 >> 1) = 10 + 5 = 15
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)  // 若 newCapacity 依旧小于 minCapacity
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)   // 若 newCapacity 大于最大存储容量，则进行大容量分配
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

hugeCapacity（）方法

    /**
     * 私有方法：大容量分配，最大分配 Integer.MAX_VALUE
     * @param minCapacity
     */
    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
                Integer.MAX_VALUE :
                MAX_ARRAY_SIZE;
    }

size（）、isEmpty（）、contains（）、indexOf（）、lastIndexOf（）

    /**
     * 返回ArrayList实际存储的元素数量
     */
    public int size() {
        return size;
    }

    /**
     * ArrayList是否有元素
     */
    public boolean isEmpty() {
        return size == 0;
    }

    /**
     * 是否包含o元素
     */
    public boolean contains(Object o) {
        // 根据 indexOf() 的值(索引值)来判断，大于等于 0 就包含
        // 注意：等于 0 的情况不能漏，因为索引号是从 0 开始计数的
        return indexOf(o) >= 0;
    }

    /**
     * 顺序查找，返回元素的最低索引值(最首先出现的索引位置)
     * @return 存在？最低索引值：-1
     */
    public int indexOf(Object o) {
        if (o == null) {
            for (int i = 0; i < size; i++)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = 0; i < size; i++)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

    /**
     * 逆序查找，返回元素的最低索引值(最首先出现的索引位置)
     * @return 存在？最低索引值：-1
     */
    public int lastIndexOf(Object o) {
        if (o == null) {
            for (int i = size-1; i >= 0; i--)
                if (elementData[i]==null)
                    return i;
        } else {
            for (int i = size-1; i >= 0; i--)
                if (o.equals(elementData[i]))
                    return i;
        }
        return -1;
    }

toArray()

    /**
     * 返回 ArrayList 的 Object 数组
     * - 包含 ArrayList 的所有储存元素
     * - 对返回的该数组进行操作，不会影响该 ArrayList（相当于分配了一个新的数组）==>该操作是安全的
     * - 元素存储顺序与 ArrayList 中的一致
     */
    public Object[] toArray() {
        return Arrays.copyOf(elementData, size);
    }

rangeCheck（）

    /**
     * 检查数组是否在界线内
     */
    private void rangeCheck(int index) {
        if (index >= size)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

add()

    public boolean add(E e) {
        // 确定ArrayList的容量大小---严谨
        // 注意：size + 1，保证资源空间不被浪费，
        // ☆☆☆按当前情况，保证要存多少个元素，就只分配多少空间资源
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

    /**
     *
     *在这个ArrayList中的指定位置插入指定的元素，
     *  - 在指定位置插入新元素，原先在 index 位置的值往后移动一位
     * @param index 指定位置
     * @param element 指定元素
     * @throws IndexOutOfBoundsException
     */
    public void add(int index, E element) {
        rangeCheckForAdd(index);//判断角标是否越界
        //看上面的，size+1，保证资源空间不浪费，按当前情况，保证要存多少元素，就只分配多少空间资源
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        //第一个是要复制的数组，第二个是从要复制的数组的第几个开始，
        // 第三个是复制到那，四个是复制到的数组第几个开始，最后一个是复制长度
        System.arraycopy(elementData, index, elementData, index + 1,
                size - index);
        elementData[index] = element;
        size++;
    }

还有很多方法就不列举了，可以去上面的参考链接里面有。

在add（）方法中的size+1问题

size+1代表的含义是：

1、如果集合添加元素成功后，集合中的实际元素个数。

2、为了确保扩容不会出现错误。

假如不加一处理，如果默认size是0，则0+0>>1还是0。
如果size是1，则1+1>>1还是1。有人问:不是默认容量大小是10吗?事实上，jdk1.8版本以后，ArrayList的扩容放在add()方法中。之前放在构造方法中。我用的是1.8版本，所以默认ArrayList arrayList = new ArrayList();后，size应该是0.所以,size+1对扩容来讲很必要.

手写ArrayList，缩减版

/**
 * @program: IdeaJava
 * @Date: 2020/1/7 15:13
 * @Author: lhh
 * @Description:
 */
public class MyArrayList {

    transient Object[] elementData;

    private static final int DEFAULT_CAPACITY = 10;

    private static final Object[] EMPTY_ELEMENTDATA = {};

    private int size;

    public MyArrayList(int initialCapacity)
    {
        if(initialCapacity > 0)
        {
            this.elementData = new Object[initialCapacity];
        }else if (initialCapacity == 0)
        {
            this.elementData = EMPTY_ELEMENTDATA;
        }else
        {
            throw new IllegalArgumentException("Illegal Capacity: "+
                    initialCapacity);
        }
    }

    public MyArrayList()
    {
        this(DEFAULT_CAPACITY);
    }

    private void ensureExplicitCapacity(int minCapacity)
    {
        if(size == elementData.length)
        {
            int oldCapacity = elementData.length;
            int newCapacity = oldCapacity + (oldCapacity >> 1);
            if (newCapacity - minCapacity < 0)
            {
                newCapacity = minCapacity;
            }
            Object[] objects = new Object[newCapacity];
            System.arraycopy(elementData,0,objects,0,elementData.length);
            elementData = objects;
        }
    }

    public void add(Object o)
    {
        ensureExplicitCapacity(size + 1);
        elementData[size++] = o;
    }

    public void add(int index ,Object o)
    {
        rangeCheck(index);
        ensureExplicitCapacity(size + 1);
        System.arraycopy(elementData,index,elementData,index+1,size-index);
        elementData[index] = o;
        size++;
    }

    private void rangeCheck(int index)
    {
        if (index >= size)
            throw new IndexOutOfBoundsException("下标越界");
    }

    public Object get(int index)
    {
        rangeCheck(index);
        return elementData[index];
    }

    public Object remove(int index)
    {
        rangeCheck(index);
        Object oldValue = elementData[index];

        int numMoved = size - index - 1;
        if(numMoved > 0)
            System.arraycopy(elementData,index+1,elementData,index,numMoved);
        elementData[--size] = null;

        return oldValue;
    }

    public boolean remove(Object o)
    {
        for(int index = 0;index < size;index++)
        {
            if(o.equals(elementData[index]))
            {
                remove(index);
                return true;
            }
        }
        return false;
    }
    
    public int getSize()
    {
        return size;
    }
}

查看全文

相关阅读:
【读书笔记】《暗时间》刘未鹏
 HDU4389:X mod f(x)(数位DP)
尴尬的三个星期
 解决一般图匹配的带花树算法
 【Linux常用工具】03. Linux性能测试工具ab
hdu 1176 免费馅饼(nyist 613)
删除系统更新后留下的文件夹
 zoj 1109 : Language of FatMouse
设计模式之Inheritance versus Parameterized Types 继承和参数化类型
 hibernate的查询缓存和二级缓存的配合使用

原文地址：https://www.cnblogs.com/lhh666/p/12157635.html