zoukankan      html  css  js  c++  java
  • Dictionary<T1,T2>和List<T>哪个效率更好

    这几天太忙没来的急写Blog,今天有点时间,来写一个关于Dictionary与List的区别

     

    我们要遍历一个集合,是用字典来存储还是用数组链表来存储。

    1. 把基本概念

    List<T>就是一个集合,它可以存储某种类型的列表
    Dictionary<T1,T2>,我们俗称其为字典,他包含一个Key和与之对应的Value,其目的是能够根据Key迅速地找到Value,算法复杂度为O(1)。

    2. Dictionary<T1,T2>Hashtable的异同

    首先很多人都认同一个观点,说Dictionary<T1,T2>是HashTable的泛型版本,这一点在大致上是正确的,可是当我们运行这样一段代码时,便可看出他们的不同:

     1             Dictionary<int, int> dic = new Dictionary<int, int>();
     2             dic.Add(1, 5);
     3             dic.Add(10, 3);
     4             dic.Add(2, 5);
     5             foreach (int key in dic.Keys)
     6             {
     7                 Console.WriteLine(key);
     8             }
     9 
    10             Hashtable hashtable = new Hashtable();
    11             hashtable.Add(1, 5);
    12             hashtable.Add(10, 3);
    13             hashtable.Add(2, 5);
    14             foreach (object key in hashtable.Keys)
    15             {
    16                 Console.WriteLine(key.ToString());
    17             }

    Dictionary<T1,T2>是根据插入的顺序来遍历,但是Hashtable在插入时会打乱其位置。

    并且我们在用Reflector看源码的时候也会发现Hashtable是线程安全的,而Dictionary明显不具备如此特性。

    3. Dictionary<T1,T2>的存储原理

    说到字典,我们就不能不说其存储结构,他会根据Key通过Hash计算来得到其应存放的虚拟内存地址,这也是在哈希表中Key必须唯一的原因,当我们按照Key进行查找时,首先就是根据Key计算出其所存放的虚拟内存地址,去对应的内存地址找数据,得到其Value。

    这一点HashTable与其相同。

    4. 问题提出

    我们为了讨论遍历时Dictionary和List的效率,有个高人写了个代码,这是载图

    很明显,LIST效率要好的多。

    5. 问题剖析

    同样是集合,为什么性能会有这样的差距。我们要从存储结构和操作系统的原理谈起。

    首先我们清楚List<T>是对数组做了一层包装,我们在数据结构上称之为线性表,而线性表的概念是,在内存中的连续区域,除了首节点和尾节点外,每个节点都有着其唯一的前驱结点和后续节点。我们在这里关注的是连续这个概念。

    而HashTable或者Dictionary,他是根据Key而根据Hash算法分析产生的内存地址,因此在宏观上是不连续的,虽然微软对其算法也进行了很大的优化。

    由于这样的不连续,在遍历时,Dictionary必然会产生大量的内存换页操作,而List只需要进行最少的内存换页即可,这就是List和Dictionary在遍历时效率差异的根本原因。

    6. 再谈Dictionary

    也许很多人说,既然Dictionary如此强大,那么我们为什么不用Dictionary来代替一切集合呢?

    在这里我们除了刚才的遍历问题,还要提到Dictionary的存储空间问题,在Dictionary中,除了要存储我们实际需要的Value外,还需要一个辅助变量Key,这就造成了内存空间的双重浪费。

    而且在尾部插入时,List只需要在其原有的地址基础上向后延续存储即可,而Dictionary却需要经过复杂的Hash计算,这也是性能损耗的地方。

  • 相关阅读:
    捕获异常的两种方式Exception
    线程的随机性
    单例模式简单解析--Singleton 单例模式(懒汉方式和饿汉方式)
    LeetCode 116. 填充每个节点的下一个右侧节点指针
    LeetCode 129. 求根到叶子节点数字之和
    LeetCode 124. 二叉树中的最大路径和
    LeetCode 119. 杨辉三角 II
    LeetCode 118. 杨辉三角
    LeetCode 113. 路径总和 II
    LeetCode 114. 二叉树展开为链表
  • 原文地址:https://www.cnblogs.com/lori/p/2132380.html
Copyright © 2011-2022 走看看