zoukankan      html  css  js  c++  java
  • LinkedList源码分析(jdk1.8)

    LinkedList概述

    ​ LinkedList 是 Java 集合框架中一个重要的实现,我们先简述一下LinkedList的一些特点:

    • LinkedList 底层采用的双向链表结构;
    • LinkedList 支持空值和重复值(List的特点);
    • LinkedList 实现Deque接口,具有双端队列的特性,也可以作为栈来使用;
    • LinkedList 存储元素过程中,无需像 ArrayList 那样进行扩容,但存储元素的节点需要额外的空间存储前驱和后继的引用;
    • LinkedList 在链表头部和尾部插入效率比较高,但在指定位置进行插入时,需要定位到该位置处的节点,此操作的时间复杂度为O(N)
    • LinkedList 是非线程安全的集合类,并发环境下,多个线程同时操作 LinkedList,会引发不可预知的异常错误。

    LinkedList继承体系

    ​ 直接通过idea查看一下LinkedList的继承体系,体系结构比较复杂,一点点看。

    • 继承自 AbstractSequentialList;
    • 实现了 List 和 Deque 接口;
    • 实现序列化接口;
    • 实现了Cloneable接口

    ​ 这里简单说一下AbstractSequentialList这个类,该类提供一套基本的基于顺序访问的接口,通过继承此类,子类仅需实现部分代码即可拥有完整的一套访问某种序列表(比如链表)的接口。AbstractSequentialList 提供的方法基本上都是通过 ListIterator 实现的,比如下面的get和add方法。但是虽然LinkedList 继承了 AbstractSequentialList,却并没有直接使用父类的方法,而是重新实现了一套的方法,后面我们会讲到这些方法的实现。

    public E get(int index) {
        try {
            return listIterator(index).next();
        } catch (NoSuchElementException exc) {
            throw new IndexOutOfBoundsException("Index: "+index);
        }
    }
    public void add(int index, E element) {
        try {
            listIterator(index).add(element);
        } catch (NoSuchElementException exc) {
            throw new IndexOutOfBoundsException("Index: "+index);
        }
    }
    // 留给子类实现
    public abstract ListIterator<E> listIterator(int index);
    

    ​ 另外的就是文章开头概述的,LinkedList实现了Deque接口,具有双端队列的特点。

    LinkedList的成员属性

    //记录链表中的实际元素个数
    transient int size = 0;
    //维护链表的首结点引用
    transient Node<E> first;
    //维护链表的尾节点引用
    transient Node<E> last;
    

    可以看到first和last都是Node类型的,所以我们简单看一下LinkedList中的这个内部类

    private static class Node<E> {
        E item; //结点中存放的实际元素
        Node<E> next; //维护结点的后继结点
        Node<E> prev; //维护结点的前驱结点
    	//构造方法,创建一个新的结点,参数为:前驱结点,插入元素引用,后继节点
        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }
    

    ​ 可以看到Node这个静态内部类的结构也是比较简单的,每个结点维护的就是自己存储的元素信息+前驱结点引用+后继节点引用。这里就不做过多的阐述,下面简单看看LinkedList的构造方法

    LinkedList的构造方法

    //构造一个空的集合(链表为空)
    public LinkedList() {
    }
    //先调用自己的无参构造方法构造一个空的集合,然后将Collection集合中的所有元素加入该链表中
    //如果传入的Collection为空,会抛出空指针异常
    public LinkedList(Collection<? extends E> c) {
        this();
        addAll(c);
    }
    

    LinkedList的主要方法

    add方法

    LinkedList实现的添加方法主要有下面几种

    • 在链表尾部添加结点(linkLast方法)

    • 在链表首部添加元素(linkFirst方法)

    • 在链表中间添加元素(linkBefore方法)

    下面我们看看这三种方法的实现。

    (1)linkLast方法

    public void addLast(E e) {
        linkLast(e);
    }
    

    ​ 在addLast方法中直接就是调用了linkLast方法实现结点的添加(没有返回值,所以add方法一定是返回true的),所以下面我们看看这个方法:

    void linkLast(E e) {
        //(1)获得当前链表实例的全局后继节点
        final Node<E> l = last;
        //(2)创建一个新的结点,从Node的构造方法我们就能知道
        //这个新的结点中存放的元素item为当前传入的泛型引用,前驱结点为全局后继结点,后继节点为null
        //(即相当于要将这个新节点作为链表的新的后继节点)
        final Node<E> newNode = new Node<>(l, e, null);// Node(Node<E> prev, E element, Node<E> next){}
        //(3)更新全局后继节点的引用
        last = newNode;
        //(4)如果原链表的后继结点为null,那么也需要将全局头节点引用指向这个新的结点
        if (l == null)
            first = newNode;
        //(5)不为null,因为是双向链表,创建新节点的时候只是将newNode的prev设置为原last结点。这里就需要将原last
        //结点的后继结点设置为newNode
        else
            l.next = newNode;
        //(6)更新当前链表中的size个数
        size++;
        //(7)这里是fast-fail机制使用的参数
        modCount++;
    }
    

    ​ 我们通过一个示例图来简单模拟这个过程

    • 当链表初始时为空的时候,我么调用add方法添加一个新的结点

    • 链表不为空,此时调用add方法在链表尾部添加结点的时候

    (2)linkFirst方法

    ​ 该方法是一个private方法,通过addFirst方法调用暴露给使用者。

    public void addFirst(E e) {
        linkFirst(e);
    }
    

    ​ 我们还是主要看看linkFirst方法的实现逻辑

    private void linkFirst(E e) {
        //(1)获取全局头节点
        final Node<E> f = first;
        //(2)创建一个新节点,其前驱结点为null,后继结点为当前的全局首结点
        final Node<E> newNode = new Node<>(null, e, f);
        //(3)更新全局首结点引用
        first = newNode;
        //(4)如果首结点为null,last结点指向新建的结点
        if (f == null)
            last = newNode;
        //(5)不为null,原头节点的前驱结点为newNode
        else
            f.prev = newNode;
        size++;
        modCount++;
    }
    

    ​ 上面的逻辑也比较简单,就是将新添加的结点设置为头节点,然后更新链表中结点之间的指向,我们通过下面这个图简单理解一下(链表初始为null就不做演示了,和上面图示的差不多,这里假设已经存在结点)

    (3)linkBefore方法

    public void add(int index, E element) {
        //检查index的合法性:大于等于0小于等于size,不合法会抛出异常
        checkPositionIndex(index);
        //index等于size,就在尾部插入新节点,linkLast方法上面说到过
        if (index == size)
            linkLast(element);
        //否则就在指定index处插入结点,先找到index处的结点(调用的是node(index方法))
        else
            linkBefore(element, node(index));
    }
    private void checkPositionIndex(int index) {
        if (!isPositionIndex(index))
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }
    private boolean isPositionIndex(int index) {
        return index >= 0 && index <= size;
    }
    

    ​ add(index,element)方法中主要的逻辑还是linkBefore,我们下面看看这个方法,在此之前调用的是node(index)方法,找到index处的结点

    Node<E> node(int index) {
        //index < size/2 (index在链表的前半部分)
        if (index < (size >> 1)) {
            //使用全局头节点去查找(遍历链表)
            Node<E> x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else {
            //index > size / 2 (index在链表的后半部分)
            Node<E> x = last;
            //使用全局尾节点向前查找
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }
    

    ​ node方法实现利用双向链表以及记录了链表总长度的这两个特点,分为前后两部分去遍历查询jindex位置处的结点。查找这个结点后,就会作为参数调用linkBefore方法,如下所示

    void linkBefore(E e, Node<E> succ) {
        //succ != null;succ就是指定位置处的结点
        //传入的结点element=succ
        final Node<E> pred = succ.prev;
        //创建新的结点
        //前驱结点是传入的结点的前驱结点
        //后继结点是传入的结点
        final Node<E> newNode = new Node<>(pred, e, succ);
        //更新index处结点的前驱结点引用
        succ.prev = newNode;
        //index处结点的前驱结点为null,那么就相当于在头部插入结点,并且更新first
        if (pred == null)
            first = newNode;
        //不为null,那么它的后继结点就是新的结点
        else
            pred.next = newNode;
        size++;
        modCount++;
    }
    

    ​ 这个方法的逻辑也比较简单,就是在succ和succ.prev两个结点之间插入一个新的结点,我们通过简单的图示理解这个过程

    删除

    ​ 作为双端队列,删除元素也有两种方式队列首删除元素队列尾删除元素;作为List,又要支持中间删除元素,所以删除元素一个有三个方法。

    (1)unlinkFirst方法

    ​ 下面是调用unlinkFirst方法的两个public方法(Deque接口的方法实现),主要区别就是removeFirst方法执行时候,first为null的时候会抛出异常,而pollFirst返回null。

    // remove的时候如果没有元素抛出异常
    public E removeFirst() {
        final Node<E> f = first;
        if (f == null)
            throw new NoSuchElementException();
        return unlinkFirst(f);
    }
    // poll的时候如果没有元素返回null
    public E pollFirst() {
        final Node<E> f = first;
        return (f == null) ? null : unlinkFirst(f);
    }
    

    ​ 主要还是看unlinkFirst这个方法的实现

    private E unlinkFirst(Node<E> f) {
        // assert f == first && f != null;
        //获取头结点的元素值
        final E element = f.item;
        //获取头结点的后继结点
        final Node<E> next = f.next;
        //删除头节点中存放的元素item和后继结点,GC
        f.item = null;
        f.next = null; // help GC
        //更新头节点引用(原头节点的后继结点)
        first = next;
        //链表中只有一个结点,那么尾节点也是null了
        if (next == null)
            last = null;
        //将新的头节点的前驱结点设置为null
        else
            next.prev = null;
        //更新size和modCount
        size--;
        modCount++;
        //返回原头节点的值
        return element;
    }
    

    (2)unlinkLast方法

    ​ 下面是调用unlinkLast方法的两个public方法(Deque接口的方法实现),主要区别就是removeLast方法执行时候,first为null的时候会抛出异常,而pollLast返回null。

    // remove的时候如果没有元素抛出异常
    public E removeLast() {
        final Node<E> l = last;
        if (l == null)
            throw new NoSuchElementException();
        return unlinkLast(l);
    }
    
    // poll的时候如果没有元素返回null
    public E pollLast() {
        final Node<E> l = last;
        return (l == null) ? null : unlinkLast(l);
    }
    

    ​ 下面是unlinkLast方法的实现

    // 删除尾节点
    private E unlinkLast(Node<E> l) {
        // 尾节点的元素值
        final E element = l.item;
        // 尾节点的前置指针
        final Node<E> prev = l.prev;
        // 清空尾节点的内容,协助GC
        l.item = null;
        l.prev = null; // help GC
        // 让前置节点成为新的尾节点
        last = prev;
        // 如果只有一个元素,删除了把first置为空
        // 否则把前置节点的next置为空
        if (prev == null)
            first = null;
        else
            prev.next = null;
        // 更新size和modCount
        size--;
        modCount++;
        // 返回删除的元素
        return element;
    }
    

    (4)unlink方法

    // 删除中间节点
    public E remove(int index) {
        // 检查是否越界
        checkElementIndex(index);
        // 删除指定index位置的节点
        return unlink(node(index));
    }
    
    // 删除指定节点x
    E unlink(Node<E> x) {
        // x的元素值
        final E element = x.item;
        // x的前置节点
        final Node<E> next = x.next;
        // x的后置节点
        final Node<E> prev = x.prev;
        // 如果前置节点为空
        // 说明是首节点,让first指向x的后置节点
        // 否则修改前置节点的next为x的后置节点
        if (prev == null) {
            first = next;
        } else {
            prev.next = next;
            x.prev = null;
        }
        // 如果后置节点为空
        // 说明是尾节点,让last指向x的前置节点
        // 否则修改后置节点的prev为x的前置节点
        if (next == null) {
            last = prev;
        } else {
            next.prev = prev;
            x.next = null;
        }
        // 清空x的元素值,协助GC
        x.item = null;
        // 元素个数减1
        size--;
        // 修改次数加1
        modCount++;
        // 返回删除的元素
        return element;
    }
    

    查找

    LinkedList 底层基于链表结构,无法向 ArrayList 那样随机访问指定位置的元素。LinkedList 查找过程要稍麻烦一些,需要从链表头结点(或尾节点)向后查找,时间复杂度为 O(N)。相关源码如下:

    public E get(int index) {
        checkElementIndex(index); //还是先检验index的合法性,这里上面已经说过
        //调用node方法遍历查询index处的结点,然后返回结点存放的值item,node方法上面已经说过
        return node(index).item; 
    }
    

    遍历

    ​ 链表的遍历过程也很简单,和上面查找过程类似,我们从头节点往后遍历就行了。但对于 LinkedList 的遍历还是需要注意一些,不然可能会导致代码效率低下。通常情况下,我们会使用 foreach 遍历 LinkedList,而 foreach 最终转换成迭代器形式。所以分析 LinkedList 的遍历的核心就是它的迭代器实现,相关代码如下:

    public ListIterator<E> listIterator(int index) {
        checkPositionIndex(index);
        return new ListItr(index);
    }
    private class ListItr implements ListIterator<E> {
        private Node<E> lastReturned;
        private Node<E> next;
        private int nextIndex;
        private int expectedModCount = modCount;
    	/** 构造方法将 next 引用指向指定位置的节点 */
        ListItr(int index) {
            // assert isPositionIndex(index);
            next = (index == size) ? null : node(index);
            nextIndex = index;
        }
    
        public boolean hasNext() {
            return nextIndex < size;
        }
    
        public E next() {
            checkForComodification();
            if (!hasNext())
                throw new NoSuchElementException();
            lastReturned = next;
            next = next.next;
            nextIndex++;
            return lastReturned.item;
        }
    	//...other method
    }
    

    ​ 这里主要说下遍历 LinkedList 需要注意的一个点。LinkedList 不擅长随机位置访问,如果大家用随机访问的方式遍历 LinkedList,效率会很差。比如下面的代码:

    List<Integet> list = new LinkedList<>();
    list.add(1)
    list.add(2)
    ......
    for (int i = 0; i < list.size(); i++) {
        Integet item = list.get(i);
        // do something
    }
    

    ​ 当链表中存储的元素很多时,上面的遍历方式对于效率肯定是非常低的。原因在于,通过上面的方式每获取一个元素(调用get(i)方法,上面说到了这个方法的实现),LinkedList 都需要从头节点(或尾节点)进行遍历(node()方法的实现),效率低,上面的遍历方式在大数据量情况下,效率很差。在日常使用中应该尽量避免这种用法。

    总结

    最后总结一下面试常问的ArrayListLinkedList的区别,关于ArrayList请参考我上一篇ArrayList源码分析

    • ArrayList是基于动态数组实现的,LinkedList是基于双向链表实现的;

    • 对于随机访问来说,ArrayList(数组下标访问)要优于LinkedList(遍历链表访问);

    • 不考虑直接在尾部添加数据的话,ArrayList按照指定的index添加/删除数据是通过复制数组实现。LinkedList通过寻址改变节点指向实现;所以添加元素的话LinkedList(改变结点的next和prev指向即可)要优于ArrayList(移动数组元素)。

    • LinkedList在数据存储上不存在浪费空间的情况。ArrayList动态扩容会导致有一部分空间是浪费的。

  • 相关阅读:
    【转】有关Managed code和Native code的区别
    【转】wince6.0 vs2005 编译选项详解
    【转】Wince Device Emulator使用介绍Device Emulator 2.0
    Dapper基础增删查改、事务和存储过程
    SharpCompress的压缩文件解压和文件夹压缩
    MVC WebAPI 的基本使用
    prepare for travel 旅行准备
    gossip
    JS笔记(3) 词汇结构(待续。。。)
    Good Points Bad Points
  • 原文地址:https://www.cnblogs.com/fsmly/p/11290140.html
Copyright © 2011-2022 走看看