zoukankan      html  css  js  c++  java
  • collection set

    http://blog.csdn.net/humingfiy/article/details/7946408

    Collection:List、Set
    Map:HashMap、HashTable

    如何在它们之间选择


    一、Array ,Arrays

    Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。

    1、
    效率高,但容量固定且无法动态改变。
    array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。

    2、Java中有一个Arrays类,专门用来操作array。
          arrays中拥有一组static函数,
    equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。
    fill():将值填入array中。
    sort():用来对array进行排序。
    binarySearch():在排好序的array中寻找元素。
    System.arraycopy():array的复制。


    二、Collection ,Map

    若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。

    1、Collection 和 Map的区别

    容器内每个为之所存储的元素个数不同。
    Collection类型者,每个位置只有一个元素。
    Map类型者,持有 key-value pair,像个小型数据库。

    2、各自旗下的子类关系

    Collection
         --List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
               --ArrayList / LinkedList / Vector
          --Set : 不能含有重复的元素
               --HashSet / TreeSet
    Map
          --HashMap
          --HashTable
          --TreeMap

    3、其他特征

    *    List,Set,Map将持有对象一律视为Object型别。
    *    Collection、List、Set、Map都是接口,不能实例化。
         继承自它们的 ArrayList, Vector, HashTable,HashMap是具象class,这些才可被实例化。
    *   vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。


    三、Collections

    Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
    相当于对Array进行类似操作的类——Arrays。
    如,Collections.max(Collection coll); 取coll中最大的元素。
          Collections.sort(List list);对list中元素排序

    四、如何选择?

    1、容器类和Array的区别、择取
         *   容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
         *   一旦将对象置入容器内,便损失了该对象的型别信息。

    2、
        *   在各种Lists中,最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList();
          Vector总是比ArrayList慢,所以要尽量避免使用。
        *   在各种Sets中,HashSet通常优于HashTree(插入、查找)。只有当需要产生一个经过排序的序列,才用TreeSet。
          HashTree存在的唯一理由:能够维护其内元素的排序状态。
        *    在各种Maps中
           HashMap用于快速查找。
        *   当元素个数固定,用Array,因为Array效率是最高的。

    结论:最常用的是ArrayList,HashSet,HashMap,Array。


    注意:

    1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
    2、Set和Collection拥有一模一样的接口。
    3、List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
    4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。

    5、Map用 put(k,v) /get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
         HashMap会利用对象的hashCode来快速找到key。
        *   hashing
            哈希码就是将对象的信息经过一些转变形成一个独一无二的int值,这个值存储在一个array中。
            我们都知道所有存储结构中,array查找速度是最快的。所以,可以加速查找。
          
            发生碰撞时,让array指向多个values。即,数组每个位置上又生成一个梿表。

    6、Map中元素,可以将key序列、value序列单独抽取出来。
    使用keySet()抽取key序列,将map中的所有keys生成一个Set。
    使用values()抽取value序列,将map中的所有values生成一个Collection。

    为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。

    ---------------------------------------------------------------------------------------
    特别介绍1:HashTableVS HashMap
     
    HashTable的应用非常广泛,HashMap是新框架中用来代替HashTable的类,也就是说建议使用HashMap,不要使用HashTable。
     
    这里简单分析他们的区别。 
    1.HashTable的方法是同步的,HashMap未经同步,所以在多线程场合要手动同步HashMap这个区别就像Vector和ArrayList一样。(最主要的区别)

    2.HashTable不允许null值(key和value都不可以),HashMap允许null值(key和value都可以,只容许有一个null值的key,可以有多个null值的value)。

    3.HashTable有一个contains(Object value),功能和containsValue(Object value)功能一样。

    4.HashTable使用Enumeration,HashMap使用Iterator。

    以上只是表面的不同,它们的实现也有很大的不同。

    5.HashTable中hash数组默认大小是11,增加的方式是 old*2+1。HashMap中hash数组的默认大小是16,而且一定是2的指数。

    6.哈希值的使用不同,HashTable直接使用对象的hashCode,代码是这样的:
    int hash = key.hashCode();
    int index = (hash & 0x7FFFFFFF) % tab.length;
    而HashMap重新计算hash值,而且用与代替求模:
    int hash = hash(k);
    int i = indexFor(hash, table.length);
    static int hash(Object x) {
       int h = x.hashCode();

      h += ~(h << 9);
      h ^= (h >>> 14);
      h += (h << 4);
      h ^= (h >>> 10);
       return h;
    }
    static int indexFor(int h, int length) {
       return h & (length-1);
    }
    以上只是一些比较突出的区别,当然他们的实现上还是有很多不同的,比如
    HashMap对null的操作。
     
    特别介绍2:ArrayList VS Vector VSLinkList

    VECTOR是每个操作都同步的,如果你觉得集合中的数据安全性要求很高那就用VECTOR

    ARRAYLIST并不是线程安全的,除了这点,跟VECTOR没什么差别,都是通过数组的方式来实现一个集合

    LINKLIST跟ARRAYLIST的区别是,LINKLIST是用链表的方式实现的集合,所以在LIST的增、删、迭代等几个操作上,与ARRAYLIST速度有所差别。如果一个LIST需要频繁做删除操作的话应该选择LINKLIST,

    ArrayList适合随机访问
    LinkedList才是适合顺序访问的链 但是其元素的增减比ArrayList高.

    特别介绍3:HashSet VSTreeSet

    两者区别的形象展示:假设输入值的顺序为:1,4,3,1,用HashSet输出的顺序为:1,4,3(可能);用TreeSet输出的顺序为:1,3,4(如Windows的文件夹,不能重复,且有顺序)。

    HashSet

    此类实现 Set 接口,由哈希表(实际上是一个 HashMap实例)支持。它不保证集合的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用 null 元素。
    此类为基本操作提供了稳定性能,这些基本操作包括 add、remove、contains 和size,假定哈希函数将这些元素正确地分布在桶中。对此集合进行迭代所需的时间与 HashSet 实例的大小(元素的数量)和底层HashMap实例(桶的数量)的“容量”的和成比例。因此,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。
    注意:HashSet要重写hashCode和equals方法。

    我们应该为要存放到散列表的各个对象定义hashCode()和equals();
    import java.util.HashSet;
    import java.util.Iterator;

    public class HashSetTest{
             public static voidmain(String[] args)
            {
                    HashSet hs=new HashSet();
                    
                    hs.add(new Student(1,"zhangsan"));
                    hs.add(new Student(2,"lishi"));
                    hs.add(new Student(3,"wangwu"));
                    hs.add(new Student(1,"zhangsan"));
                    
                    Iterator it=hs.iterator();
                    while(it.hasNext())
                    {
                            System.out.println(it.next());
                    }
            }
    }
    class Student        //HashSet要重写hashCode和equals方法
    {
             int num;
             String name;
             Student(intnum,String name)
            {
                    this.num=num;
                    this.name=name;
            }
             public StringtoString()
            {
                    return "num :"+num+"name:"+name;
            }
             public inthashCode()
            {
                    return num*name.hashCode();
            }
             public booleanequals(Object o)
            {
                    Student s=(Student)o;
                    return num==s.num &&name.equals(s.name);
            }
    }


    TreeSet
    此类实现 Set 接口,该接口由 TreeMap 实例支持。此类保证排序后的 set按照升序排列元素,根据使用的构造方法不同,可能会按照元素的自然顺序 进行排序,或按照在创建 set时所提供的比较器进行排序。
    是一个有序集合,元素中安升序排序,缺省是按照自然顺序进行排序,意味着TreeSet中元素要实现Comparable接口;
    我们可以构造TreeSet对象时,传递实现了Comparator接口的比较器对象.
    import java.util.*;

    public class TreeSetTest{
             public static voidmain(String[] args)
            {
                    //TreeSet ts=new TreeSet();
                    TreeSet ts=new TreeSet(new Students.compareToStudent());
                    ts.add(new Students(2,"zhangshan"));
                    ts.add(new Students(3,"lishi"));
                    ts.add(new Students(1,"wangwu"));
                    ts.add(new Students(4,"maliu"));
                    
                    Iterator it=ts.iterator();
                    while(it.hasNext())
                    {
                            System.out.println(it.next());
                    }                
            }

    }

    class Students implements Comparable
    {
             int num;
             String name;
             Students(intnum,String name)
            {
                    this.num=num;
                    this.name=name;
            }
             static classcompareToStudent implementsComparator        //定义一个内部类来实现比较器
            {
                    public int compare(Object o1, Object o2) {
                            Students s1=(Students)o1;
                            Students s2=(Students)o2;
                            int rulst= s1.num > s2.num ? 1 :(s1.num==s2.num ? 0 :-1);
                            if(rulst==0)
                            {
                                    rulst=s1.name.compareTo(s2.name);
                            }                
                            return rulst;
                    }                
            }
             public intcompareTo(Objecto)                //写具体的比较方法
            {
                    int result;
                    Students s=(Students)o;
                    result=num >s.num ? 1:(num==s.num ?0 : -1);
                    if(result==0)
                    {
                            result=name.compareTo(s.name);
                    }
                    return result;
            }
             public StringtoString()
            {
                    return num+":"+name;
            }
    }

    总结
    HashSet是基于Hash算法实现的,其性能通常优于TreeSet,我们通常都应该使用HashSet,在我们需要排序的功能时,我门才使用TreeSet。

  • 相关阅读:
    指针变量的*p,p以及&p的区别
    C 真正理解二级指针
    二叉树Bynary_Tree(2):二叉树的递归遍历
    二叉树Binary_Tree(1):二叉树及其数组实现
    栈stack(2):栈的链表实现
    栈stack(1):栈的数组实现
    队列queue(2):链表实现队列
    老猿学5G扫盲贴:3GPP规范中与计费相关的主要规范文档列表及下载链接
    老猿学5G扫盲贴:推荐三篇介绍HTTP2协议相关的文章
    老猿学5G扫盲贴:中移动的5G计费架构中Nchf'服务化接口以及CHF中的AGF
  • 原文地址:https://www.cnblogs.com/daishuguang/p/3700385.html
Copyright © 2011-2022 走看看