zoukankan      html  css  js  c++  java
  • Java集合类List/Set/Map的区别和联系

    一、Array ,Arrays

    Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。

    1、效率高,但容量固定且无法动态改变。
          array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。

    2、Java中有一个Arrays类,专门用来操作array
          arrays中拥有一组static函数,
          equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。
          fill():将值填入array中。
          sort():用来对array进行排序。
          binarySearch():在排好序的array中寻找元素。
          System.arraycopy():array的复制。


    二、Collection ,Map

          若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。

    1、Collection 和 Map 的区别

          容器内每个为之所存储的元素个数不同。
          Collection类型者,每个位置只有一个元素。
          Map类型者,持有 key-value pair,像个小型数据库。

    2、各自旗下的子类关系

    Collection
          --List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
                 --ArrayList / LinkedList / Vector
          --Set : 不能含有重复的元素
                --HashSet / TreeSet
    Map
          --HashMap
          --HashTable
          --TreeMap

    3、其他特征

          List,Set,Map将持有对象一律视为Object型别。
          Collection、List、Set、Map都是接口,不能实例化。
          继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化。
          vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。


    三、Collections

          Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
          相当于对Array进行类似操作的类——Arrays。
          如:Collections.max(Collection coll); 取coll中最大的元素。
                 Collections.sort(List list); 对list中元素排序。

    四、如何选择?

    1、容器类和Array的区别、择取
          容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
          一旦将对象置入容器内,便损失了该对象的型别信息。

    2、
          在各种Lists中,最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList();
           Vector总是比ArrayList慢,所以要尽量避免使用。
          在各种Sets中,HashSet通常优于HashTree(插入、查找)。只有当需要产生一个经过排序的序列,才用TreeSet。
          HashTree存在的唯一理由:能够维护其内元素的排序状态。
          在各种Maps中:HashMap用于快速查找;当元素个数固定,用Array,因为Array效率是最高的。

    结论:最常用的是ArrayList,HashSet,HashMap,Array。


    注意:

    1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
    2、Set和Collection拥有一模一样的接口。
    3、List可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
    4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue

    5、Map用 put(k,v) / get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
          HashMap会利用对象的hashCode来快速找到key。
          hashing:哈希码就是将对象的信息经过一些转变形成一个独一无二的int值,这个值存储在一个array中。
          我们都知道所有存储结构中,array查找速度是最快的。所以,可以加速查找。
          
          发生碰撞时,让array指向多个values。即,数组每个位置上又生成一个梿表。

    6、Map中元素,可以将key序列、value序列单独抽取出来。
          使用keySet()抽取key序列,将map中的所有keys生成一个Set。
          使用values()抽取value序列,将map中的所有values生成一个Collection。

          为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。


    Collection List Set Map 区别

    有序否
    允许元素重复否
    Collection
    List
    Set
    AbstractSet
    HashSet
    TreeSet
    是(用二叉树排序)
    Map
    AbstractMap
    使用key-value来映射和存储数据,Key必须惟一,value可以重复
    HashMap
    TreeMap
    是(用二叉树排序)
    线性表,链表,哈希表是常用的数据结构,在进行Java开发时,JDK已经为我们提供了一系列相应的类来实现基本的数据结构。这些类均在java.util包中。本文试图通过简单的描述,向读者阐述各个类的作用以及如何正确使用这些类。
    Collection
    List
    │├
    LinkedList
    │├
    ArrayList
    │└
    Vector
     
    Stack
    Set
    Map
    Hashtable
    HashMap
    WeakHashMap
    Co
    llection接口

      Collection是最基本的集合接口,一个Collection代表一组Object,即Collection的元素(Elements)。一些Collection允许相同的元素而另一些不行。一些能排序而另一些不行。Java SDK不提供直接继承自Collection的类,Java SDK提供的类都是继承自Collection子接口ListSet

      所有实现Collection接口的类都必须提供两个标准的构造函数:无参数的构造函数用于创建一个空的Collection,有一个Collection参数的构造函数用于创建一个新的Collection,这个新的Collection与传入的Collection有相同的元素。后一个构造函数允许用户复制一个Collection

      如何遍历Collection中的每一个元素?不论Collection的实际类型如何,它都支持一个iterator()的方法,该方法返回一个迭代子,使用该迭代子即可逐一访问Collection中每一个元素。典型的用法如下:

        Iterator it = collection.iterator(); // 获得一个迭代子

        
    while(it.hasNext()) {
          Object obj = it.next(); // 得到下一个元素

        
    }
      由Collection接口派生的两个接口是ListSet

    List
    接口

    List
    是有序的Collection,使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引(元素在List中的位置,类似于数组下标)来访问List中的元素,这类似于Java的数组。

    和下面要提到的Set不同,List允许有相同的元素。

      除了具有Collection接口必备的iterator()方法外,List还提供一个listIterator()方法,返回一个ListIterator接口,和标准的Iterator接口相比,ListIterator多了一些add()之类的方法,允许添加,删除,设定元素,还能向前或向后遍历。

      实现List接口的常用类有LinkedListArrayListVectorStack

    LinkedList

      LinkedList实现了List接口,允许null元素。此外LinkedList提供额外的getremoveinsert方法在LinkedList的首部或尾部。这些操作使LinkedList可被用作堆栈(stack),队列(queue)或双向队列(deque)。

      注意LinkedList没有同步方法。如果多个线程同时访问一个List,则必须自己实现访问同步。一种解决方法是在创建List时构造一个同步的List

        
    List list = Collections.synchronizedList(new LinkedList(...));
    ArrayList

      ArrayList实现了可变大小的数组。它允许所有元素,包括nullArrayList没有同步。sizeisEmptygetset方法运行时间为常数。但是add方法开销为分摊的常数,添加n个元素需要O(n)的时间。其他的方法运行时间为线性。

      每个ArrayList实例都有一个容量(Capacity),即用于存储元素的数组的大小。这个容量可随着不断添加新元素而自动增加,但是增长算法并没有定义。当需要插入大量元素时,在插入前可以调用ensureCapacity方法来增加ArrayList的容量以提高插入效率。

      和LinkedList一样,ArrayList也是非同步的(unsynchronized)。

    Vector

      Vector非常类似ArrayList,但是Vector是同步的。由Vector创建的Iterator,虽然和ArrayList创建的Iterator是同一接口,但是,因为Vector是同步的,当一个Iterator被创建而且正在被使用,另一个线程改变了Vector的状态(例如,添加或删除了一些元素),这时调用Iterator的方法时将抛出ConcurrentModificationException,因此必须捕获该异常。

    Stack

      Stack继承自Vector,实现一个后进先出的堆栈。Stack提供5个额外的方法使得Vector得以被当作堆栈使用。基本的pushpop方法,还有peek方法得到栈顶的元素,empty方法测试堆栈是否为空,search方法检测一个元素在堆栈中的位置。Stack刚创建后是空栈。

    Set
    接口

      Set是一种不包含重复的元素的Collection,即任意的两个元素e1e2都有e1.equals(e2)=falseSet最多有一个null元素。

      很明显,Set的构造函数有一个约束条件,传入的Collection参数不能包含重复的元素。

    请注意:必须小心操作可变对象(Mutable Object)。如果一个Set中的可变元素改变了自身状态导致Object.equals(Object)=true将导致一些问题。
    Map
    接口

      请注意,Map没有继承Collection接口,Map提供keyvalue的映射。一个Map中不能包含相同的key,每个key只能映射一个valueMap接口提供3种集合的视图,Map的内容可以被当作一组key集合,一组value集合,或者一组key-value映射。

    Hashtable

      Hashtable继承Map接口,实现一个key-value映射的哈希表。任何非空(non-null)的对象都可作为key或者value

      添加数据使用put(key, value),取出数据使用get(key),这两个基本操作的时间开销为常数。

      Hashtable通过initial capacityload factor两个参数调整性能。通常缺省的load factor 0.75较好地实现了时间和空间的均衡。增大load factor可以节省空间但相应的查找时间将增大,这会影响像getput这样的操作。

    使用Hashtable的简单示例如下,将123放到Hashtable中,他们的key分别是”one””two””three”

        
    Hashtable numbers = new Hashtable();
        
    numbers.put(“one”, new Integer(1));
        
    numbers.put(“two”, new Integer(2));
        
    numbers.put(“three”, new Integer(3));
      要取出一个数,比如2,用相应的key

        
    Integer n = (Integer)numbers.get(“two”);
        
    System.out.println(“two = ” + n);
      由于作为key的对象将通过计算其散列函数来确定与之对应的value的位置,因此任何作为key的对象都必须实现hashCodeequals方法。hashCodeequals方法继承自根类Object,如果你用自定义的类当作key的话,要相当小心,按照散列函数的定义,如果两个对象相同,即obj1.equals(obj2)=true,则它们的hashCode必须相同,但如果两个对象不同,则它们的hashCode不一定不同,如果两个不同对象的hashCode相同,这种现象称为冲突,冲突会导致操作哈希表的时间开销增大,所以尽量定义好的hashCode()方法,能加快哈希表的操作。

      如果相同的对象有不同的hashCode,对哈希表的操作会出现意想不到的结果(期待的get方法返回null),要避免这种问题,只需要牢记一条:要同时复写equals方法和hashCode方法,而不要只写其中一个。

      Hashtable是同步的。

    HashMap

      HashMapHashtable类似,不同之处在于HashMap是非同步的,并且允许null,即null valuenull key。,但是将HashMap视为Collection时(values()方法可返回Collection),其迭代子操作时间开销和HashMap的容量成比例。因此,如果迭代操作的性能相当重要的话,不要将HashMap的初始化容量设得过高,或者load factor过低。

    WeakHashMap

      WeakHashMap是一种改进的HashMap,它对key实行弱引用,如果一个key不再被外部所引用,那么该key可以被GC回收。
    总结

      如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList

      如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。

      要特别注意对哈希表的操作,作为key的对象要正确复写equalshashCode方法。

      尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。
  • 相关阅读:
    hdoj 2803 The MAX【简单规律题】
    hdoj 2579 Dating with girls(2)【三重数组标记去重】
    hdoj 1495 非常可乐【bfs隐式图】
    poj 1149 PIGS【最大流经典建图】
    poj 3281 Dining【拆点网络流】
    hdoj 3572 Task Schedule【建立超级源点超级汇点】
    hdoj 1532 Drainage Ditches【最大流模板题】
    poj 1459 Power Network【建立超级源点,超级汇点】
    hdoj 3861 The King’s Problem【强连通缩点建图&&最小路径覆盖】
    hdoj 1012 u Calculate e
  • 原文地址:https://www.cnblogs.com/yuanermen/p/1539917.html
Copyright © 2011-2022 走看看