zoukankan      html  css  js  c++  java
  • Java Collection Framework概述

    文章出自:听云博客

    Collection概述

    Java collection是java提供的工具包,包含了常用的数据结构:集合、链表、队列、栈、数组、映射等。

    Java集合主要可以划分为4个部分:List列表、Set集合、Map映射、工具类(Iterator、Arrays和Collections)。

    Java collection 结构图

    03.jpg 

    通过上图我们可以看出

    • Collection是一个interface 

    Collection有List和Set两大分支。

    List<E>是一个队列,根据下标索引,第一个元素的下标是0,List的实现类有LinkedList, ArrayList, Vector, Stack。List是有序的队列,List中可以有重复的值。

    Set<E>是一个集合,SET中的值是唯一的,我们经常会遇到List去重的问题,把List转为SET就可以快速实现 Set的实现类有HastSet和TreeSet。HashSet。其中TreeSet是有序的。

    • Ma<K,V>是一个interface,即key-value键值对。Map中的每一个元素包含“一个key”和“key对应的value”。 

    AbstractMap是个抽象类,它实现了Map接口中的大部分API。而HashMap,TreeMap,WeakHashMap都是继承于AbstractMap。

    • Iterator。它是遍历集合的工具,我们经常使用Iterator迭代器来遍历集合。Collection的实现类都要实现iterator()函数,返回一个Iterator对象。

    • 抽象类AbstractCollection、AbstractList、AbstractSet、AbstractMap是抽象类,他们都实现了各自的大部分方法,我们直接继承Abstract类就可以省去重复编码相同的方法 。PS当时来面试的时候被问到这个问题竟然一下没想起来。

    List简介

    1、List 是一个接口,它继承于Collection的接口。它代表着有序的队列。

    2、AbstractList 是一个抽象类,它继承于AbstractCollection。AbstractList实现List接口中除size()、get(int location)之外的函数。

    3、AbstractSequentialList 是一个抽象类,它继承于AbstractList。AbstractSequentialList 实现了“链表中,根据index索引值操作链表的全部函数”。 

    4、ArrayList, LinkedList, Vector, Stack是List的4个实现类。

    ArrayList 是一个数组队列。它由数组实现,实现了RandomAccess, Cloneable, java.io.Serializable接口,所以可以随便访问,克隆,序列化,随机访问效率高,随机插入、随机删除效率低。

    LinkedList 是一个双向链表。它也可以被当作堆栈、队列或双端队列进行操作。LinkedList随机访问效率低,但随机插入、随机删除效率低。

    Vector 是矢量队列,和ArrayList一样,它也是一个动态数组,由数组实现。但是ArrayList是非线程安全的,而Vector是线程安全的。

    Stack 是栈,继承于Vector。栈的特点是:先进后出(First In Last Out)。

    List和Vector不同,ArrayList中的操作不是线程安全的!所以,建议在单线程中才使用ArrayList,而在多线程中可以选择Vector或者CopyOnWriteArrayList。

    List的使用

    1、如果涉及到“栈”、“队列”、“链表”等操作,应该考虑用List,具体的选择哪个List,根据下面的标准来取舍。

    2、对于需要快速插入,删除元素,应该使用LinkedList。

    3、对于需要快速随机访问元素,应该使用ArrayList。

    4、对于“单线程环境” 或者 “多线程环境,但List仅仅只会被单个线程操作”,此时应该使用非同步的类(如ArrayList)。

    5、对于“多线程环境,且List可能同时被多个线程操作”,此时,应该使用同步的类(如Vector)。

    Fail-Fast

    fail-fast 机制是java集合(Collection)中的一种错误机制。当一个线程遍历某集合时,这个集合的值被其它线程改变,该线程就会抛出ConcurrentModificationException异常。

    fail-fast示例。

    package Test;
    
    import java.util.ArrayList;
    import java.util.Iterator;
    import java.util.List;
    
    public class FastFailEX {
    
        private static List<Integer> list = new ArrayList<Integer>();
        
        public static void main(String[] args) {
        
            //使用两个线程操作list
            new ThreadA().start();
            new ThreadB().start();
        }
         private static void print() {
            System.out.println("");
            Integer value = null;
            Iterator<Integer> iter = list.iterator();
            while(iter.hasNext()) {
                value = (Integer)iter.next();
                System.out.print(value+", ");
            }
        }
    
        //向list添加元素
        private static class ThreadA extends Thread {
            public void run() {
                for(int i=0;i<10;i++){
                     list.add(i);
                     print();
                }
            }
        }
        //向list添加元素
        private static class ThreadB extends Thread {
            public void run() {
                for(int i=10;i<20;i++){
                    list.add(i);
                   print();
                }
            }
        }
    
    }

    运行结果:

    03.1.png 

    结果说明:

    当某一个线程遍历list的过程中,list的内容被另外一个线程所改变了;就会抛出ConcurrentModificationException异常,产生fail-fast事件。

    ConcurrentModificationException是在操作Iterator时抛出的异常。我们先看看Iterator的源码。在AbstractList.java中

    03.2.png 

    03.3.png

    03.4.png 

    通过以上代码段我们看到两点

    1、执行next()时,要先判断iterator返回的对象中的modCount”和“当前的modCount”是否相等

    2、如果不相等,则抛回异常

    接下来我们要知道在什么情况下 modCount!= expectedModCount

    我们来看ArrayList.java中的代码

    03.5.png 

     03.6.png

    03.7.png

    03.8.png

    03.9.png

    03.10.png

    03.11.png 

    我们现在知道,只要修改集合中的元素个数时,都会改变modCount的值。

    添加时在决定是否扩空list前修改modCount,删除元素时直接修改

    至此,我们就完全了解了fail-fast是如何产生的。

    即,当多个线程对同一个集合进行操作的时候,某线程访问集合的过程中,该集合的内容被其他线程所改变(即其它线程通过add、remove、clear等方法,改变了modCount的值);这时,就会抛出ConcurrentModificationException异常,产生fail-fast事件。

    解决fail-fast

    使用CopyOnWriteArrayList 就不会产生fail-fast

    上源码

    03.12.png

    03.13.png  

    从中,我们可以看出:

    CopyOnWriteArrayList是自己实现了Iterator  为COWIterator。

    ArrayList的Iterator调用next()时,会调用checkForComodification()比较expectedModCount和modCount的大小;CopyOnWriteArrayList的Iterator实现类中,没有checkForComodification(),所以不会抛出ConcurrentModificationException异常。 

    Map简介

    Map是什么:public interface Map<K,V> { }

    Map 是一个键值对(key-value)映射接口。Map映射中不能包含重复的键;每个键最多只能映射到一个值。

    Map 接口提供三种collection 视图,允许以键集、值集或键-值映射关系集的形式查看某个映射的内容。

    Map 映射顺序。有些实现类,可以明确保证其顺序,如 TreeMap;另一些映射实现则不保证顺序,如 HashMap 类。

    Map 的实现类应该提供2个“标准的”构造方法:第一个,void(无参数)构造方法,用于创建空映射;第二个,带有单个 Map 类型参数的构造方法,用于创建一个与其参数具有相同键-值映射关系的新映射。实际上,后一个构造方法允许用户复制任意映射,生成所需类的一个等价映射。尽管无法强制执行此建议(因为接口不能包含构造方法),但是 JDK 中所有通用的映射实现都遵从它。

    Map体系

    1、Map 是映射接口,Map中存储的内容是键值对(key-value)。

    2、AbstractMap 是继承于Map的抽象类,它实现了Map中的大部分API。其它Map的实现类可以通过继承AbstractMap来减少重复编码。

    3、SortedMap 是继承于Map的接口。SortedMap中的内容是排序的键值对,排序的方法是通过比较器(Comparator)。

    4、NavigableMap 是继承于SortedMap的接口。相比于SortedMap,NavigableMap有一系列的导航方法;如"获取大于/等于某对象的键值对"、“获取小于/等于某对象的键值对”等等。 

    5、TreeMap 继承于AbstractMap,且实现了NavigableMap接口;因此,TreeMap中的内容是“有序的键值对”, 它是通过红黑树实现的。它一般用于单线程中存储有序的映射。

    6、HashMap 继承于AbstractMap,没实现SortedMap或NavigableMap接口;因此,HashMap的内容是无序的键值对。

    7、Hashtable继承于Dictionary(Dictionary也是键值对的接口),实现Map接口;因此,Hashtable的内容也是“键值对,是无序的”。 Hashtable是线程安全的。 

    8、WeakHashMap 继承于AbstractMap。它和HashMap的键类型不同,WeakHashMap的键是“弱键”, 当“弱键”被GC回收时,它对应的键值对也会被从WeakHashMap中删除。JVM提供的弱引用

    Set简介

    Set 是继承于Collection的接口。它是一个不允许有重复元素的集AbstractSet 是一个抽象类,它继承于AbstractCollection,AbstractCollection实现了Set中的绝大部分函数,为Set的实现类提供了便利。

    HastSet 和 TreeSet 是Set的两个实现类。

    HashSet中的元素是无序的。

    TreeSet中的元素是有序的,不支持快速随机遍历,只能通过迭代器进行遍历。

    Iterator和Enumeration

    在Java集合中,我们通常都通过 “Iterator(迭代器)” 或 “Enumeration(枚举类)” 去遍历集合

    Enumeration是一个接口,它的源码如下

    03.14.png 

    Iterator也是一个接口,它的源码如下:

    03.15.png 

    1、函数接口不同

    Enumeration只有2个函数接口。通过Enumeration,我们只能读取集合的数据,而不能对数据进行修改。

    Iterator只有3个函数接口。Iterator除了能读取集合的数据之外,也能数据进行删除操作。

    2、Iterator支持fail-fast机制,而Enumeration不支持。

    Iterator和Enumeration性能对比

    package Test;

    import java.util.Enumeration;

    import java.util.Hashtable;

    import java.util.Iterator;

    import java.util.Map.Entry;

    import java.util.Random;

    public class IteratorEnumerationEX {
    
        public static void main(String[] args) {
            int val;
            Random r = new Random();
            Hashtable<Integer, Integer> table = new Hashtable<Integer, Integer>();
            for (int i=0; i<100000; i++) {
                val = r.nextInt(100);
                table.put(i, val);
            }
            iterateHashtable(table) ;
            enumHashtable(table);
        }
        
        private static void iterateHashtable(Hashtable<Integer, Integer> table) {
            long startTime = System.currentTimeMillis();
            Iterator<Entry<Integer, Integer>> iter = table.entrySet().iterator();
            while(iter.hasNext()) {
                iter.next();
            }
            long endTime = System.currentTimeMillis();
            countTime("iterate",startTime, endTime);
        } 
        
        private static void enumHashtable(Hashtable<Integer, Integer> table) {
            long startTime = System.currentTimeMillis();
            Enumeration<Integer> enu = table.elements();
            while(enu.hasMoreElements()) {
                enu.nextElement();
            }
    
            long endTime = System.currentTimeMillis();
            countTime("enum",startTime, endTime);
        }
    
        private static void countTime(String type,long start, long end) {
            System.out.println(type+":"+(end-start)+"ms");
        }
    }

    输出结果

    03.16.png 

    因为Iterator支持fail-fast所以做操作多一些性能也相对慢一些

    原文链接:http://blog.tingyun.com/web/article/detail/268

  • 相关阅读:
    HappyLeetcode45:Divide Two Integers
    HappyLeetcode44:Plus One
    HappyLeetcode43:Symmetric Tree
    HappyLeetcode42:Intersection of Two Linked Lists
    特征向量中心性(从文献中摘抄)
    二叉树(普通无规律)
    链式队列
    链式栈
    链表
    指针
  • 原文地址:https://www.cnblogs.com/TingyunAPM/p/5328518.html
Copyright © 2011-2022 走看看