zoukankan      html  css  js  c++  java
  • Java中常见数据结构List之LinkedList

    二,LinkedList
    1, linkedList底层数据结构
    linkedList底层是一个双向链表

    2,LinkedList和ArrayList的对比
    1、顺序插入速度ArrayList会比较快,因为ArrayList是基于数组实现的,数组是事先new好的,只要往指定位置塞一个数据就好了;LinkedList则不同,每次顺序插入的时候LinkedList将new一个对象出来,如果对象比较大,那么new的时间势必会长一点,再加上一些引用赋值的操作,所以顺序插入LinkedList必然慢于ArrayList
    2、基于上一点,因为LinkedList里面不仅维护了待插入的元素,还维护了Entry的前置Entry和后继Entry,如果一个LinkedList中的Entry非常多,那么LinkedList将比ArrayList更耗费一些内存
    3、数据遍历的速度,看最后一部分,这里就不细讲了,结论是:使用各自遍历效率最高的方式,ArrayList的遍历效率会比LinkedList的遍历效率高一些
    4、有些说法认为LinkedList做插入和删除更快,这种说法其实是不准确的:
    (1)LinkedList做插入、删除的时候,慢在寻址,快在只需要改变前后Entry的引用地址
    (2)ArrayList做插入、删除的时候,慢在数组元素的批量copy,快在寻址
    所以,如果待插入、删除的元素是在数据结构的前半段尤其是非常靠前的位置的时候,LinkedList的效率将大大快过ArrayList,因为ArrayList将批量copy大量的元素;越往后,对于LinkedList来说,因为它是双向链表,所以在第2个元素后面插入一个数据和在倒数第2个元素后面插入一个元素在效率上基本没有差别,但是ArrayList由于要批量copy的元素越来越少,操作速度必然追上乃至超过LinkedList。
    从这个分析看出,如果你十分确定你插入、删除的元素是在前半段,那么就使用LinkedList;如果你十分确定你删除、删除的元素在比较靠后的位置,那么可以考虑使用ArrayList。如果你不能确定你要做的插入、删除是在哪儿呢?那还是建议你使用LinkedList吧,因为一来LinkedList整体插入、删除的执行效率比较稳定,没有ArrayList这种越往后越快的情况;二来插入元素的时候,弄得不好ArrayList就要进行一次扩容,记住,ArrayList底层数组扩容是一个既消耗时间又消耗空间的操作,在我的文章Java代码优化中,第9点有详细的解读。

    3, 对LinkedList以及ArrayList的迭代
    ArrayList使用最普通的for循环遍历,LinkedList使用foreach循环比较快,看一下两个List的定义:

    public class ArrayList<E> extends AbstractList<E>
            implements List<E>, RandomAccess, Cloneable, java.io.Serializable
    public class LinkedList<E>
        extends AbstractSequentialList<E>
        implements List<E>, Deque<E>, Cloneable, java.io.Serializable
    

    注意到ArrayList是实现了RandomAccess接口而LinkedList则没有实现这个接口,关于RandomAccess这个接口的作用,看一下JDK API上的说法:

    为此,我写一段代码证明一下这一点,注意,虽然上面的例子用的Iterator,但是做foreach循环的时候,编译器默认会使用这个集合的Iterator,测试代码如下:

    public class TestMain
    {
        private static int SIZE = 111111;
        
        private static void loopList(List<Integer> list)
        {
            long startTime = System.currentTimeMillis();
            for (int i = 0; i < list.size(); i++)
            {
                list.get(i);
            }
            System.out.println(list.getClass().getSimpleName() + "使用普通for循环遍历时间为" + 
                    (System.currentTimeMillis() - startTime) + "ms");
            
            startTime = System.currentTimeMillis();
            for (Integer i : list)
            {
                
            }
            System.out.println(list.getClass().getSimpleName() + "使用foreach循环遍历时间为" + 
                    (System.currentTimeMillis() - startTime) + "ms");
        }
        
        public static void main(String[] args)
        {
            List<Integer> arrayList = new ArrayList<Integer>(SIZE);
            List<Integer> linkedList = new LinkedList<Integer>();
            
            for (int i = 0; i < SIZE; i++)
            {
                arrayList.add(i);
                linkedList.add(i);
            }
            
            loopList(arrayList);
            loopList(linkedList);
            System.out.println();
        }
    }
    

    我截取三次运行结果:

    ArrayList使用普通for循环遍历时间为6ms
    ArrayList使用foreach循环遍历时间为12ms
    LinkedList使用普通for循环遍历时间为38482ms
    LinkedList使用foreach循环遍历时间为11ms

    ArrayList使用普通for循环遍历时间为5ms
    ArrayList使用foreach循环遍历时间为12ms
    LinkedList使用普通for循环遍历时间为43287ms
    LinkedList使用foreach循环遍历时间为9ms

    ArrayList使用普通for循环遍历时间为4ms
    ArrayList使用foreach循环遍历时间为12ms
    LinkedList使用普通for循环遍历时间为22370ms
    LinkedList使用foreach循环遍历时间为5ms

    有了JDK API的解释,这个结果并不让人感到意外,最最想要提出的一点是:如果使用普通for循环遍历LinkedList,在大数据量的情况下,其遍历速度将慢得令人发指。具体原因如下:

    当使用普通for循环时, 其实使用的是LinkedList中的get的实现:
    由于LinkedList是双向链表,因此第6行的意思是算出i在一半前还是一半后,一半前正序遍历、一半后倒序遍历,这样会快很多,当然,先不管这个,分析一下为什么使用普通for循环遍历LinkedList会这么慢。
    原因就在第7第8行,第10第11行的两个for循里面,以前者为例:

    1、get(0),直接拿到0位的Node0的地址,拿到Node0里面的数据
    2、get(1),直接拿到0位的Node0的地址,从0位的Node0中找到下一个1位的Node1的地址,找到Node1,拿到Node1里面的数据
    3、get(2),直接拿到0位的Node0的地址,从0位的Node0中找到下一个1位的Node1的地址,找到Node1,从1位的Node1中找到下一个2位的Node2的地址,找到Node2,拿到Node2里面的数据。

    后面的以此类推。
    也就是说,LinkedList在get任何一个位置的数据的时候,都会把前面的数据走一遍。假如我有10个数据,那么将要查询1+2+3+4+5+5+4+3+2+1=30次数据,相比ArrayList,却只需要查询10次数据就行了,随着LinkedList的容量越大,差距会越拉越大。其实使用LinkedList到底要查询多少次数据,大家应该已经很明白了,来算一下:按照前一半算应该是(1 + 0.5N) * 0.5N / 2,后一半算上即乘以2,应该是(1 + 0.5N) * 0.5N = 0.25N2 + 0.5N,忽略低阶项和首项系数,得出结论,LinikedList遍历的时间复杂度为O(N2),N为LinkedList的容量。

    参考博文:http://www.cnblogs.com/xrq730/p/5005347.html

  • 相关阅读:
    quagga源码学习--BGP协议的初始化
    Golang pprof heap profile is empty
    python requests 配置超时及重试次数
    SVN: bdb: BDB1538 Program version 5.3 doesn't match environment version 4.7
    OpenSSL Command-Line HOWTO
    树莓派保卫战--防止SSH暴力破解
    Mac OS X Tips
    Git Tips
    SQL分组多列统计(GROUP BY后按条件分列统计)
    Show Linux Package Sort By Size
  • 原文地址:https://www.cnblogs.com/wang-meng/p/7398460.html
Copyright © 2011-2022 走看看