zoukankan      html  css  js  c++  java
  • HashTable介绍

    Hashtable声明

    public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, Cloneable, java.io.Serializable


        Hashtable继承于Dictionary类(Dictionary类声明了操作键值对的接口方法),实现Map接口(定义键值对接口);

        Hashtable大部分方法都加了synchronized关键字,所以虽然是线程安全的,但在多线程并发环境下的效率较低。                     

    1、Hashtable的几个重要变量

    private transient Entry<?,?>[] table:键值对/Entry数组,每个Entry本质上是一个单向链表的表头
    
    private int threshold:rehash阈值,当超过该阈值会rehash(重排序)
    
    private float loadFactor:装填因子
    
    private transient int modCount = 0: Hashtable结构化修改次数,用来实现fail-fast机制;
    
    private transient volatile Set<Map.Entry<K,V>> entrySet:键值对集合,不可重复;
    
    private transient volatile Set<K> keySet:key的集合,不可重复;
    
    private transient volatile Collection<V> values:value集合,可重复;
    
    private static final int Max_ARRAY_SIZE = Integer.MAX_VALUE-8;:散列表容量经过n次扩容之后,设置上限的阈值

    2、Hashtable的几个内部类

    键值对—Entry

    private static class Entry<K,V> implements Map.Entry<K,V> {
    final int hash; //哈希值
    final K key; //key
    V value; //value
    Entry<K, V> next; //下一个entry结点
    ...
    // 计算键值对的hashCode
    public int hashCode() {
    // "^" 按位异或, hash在调用构造器时传入
    return hash ^ Objects.hashCode(value);
    }
    }

    Value集合——ValueCollection

    private class ValueCollection extends AbstractCollection<V> {
    
            public Iterator<V> iterator() {
    
                return getIterator(VALUES);
    
            }
    
            public int size() {
    
                returncount;
    
            }
    
            public boolean contains(Object o) {
    
                return containsValue(o);
    
            }
    
            public void clear() {
    
                Hashtable.this.clear();
    
            }
    
        }

    EntrySet集合

    private class EntrySet extendsAbstractSet<Map.Entry<K,V>> {
    
            public Iterator<Map.Entry<K,V>>iterator() {
    
                return getIterator(ENTRIES);
    
            }
    
            publicboolean add(Map.Entry<K,V> o) {
    
                returnsuper.add(o);
    
            }
    
            ......
    
    }     

    Keys集合

    private class KeySet extendsAbstractSet<K> {
    
            public Iterator<K> iterator() {
    
                return getIterator(KEYS);
    
            }
    
            publicint size() {
    
                returncount;
    
            }
    
            public boolean contains(Object o) {
    
                return containsKey(o);
    
            }
    
            public boolean remove(Object o) {
    
                return Hashtable.this.remove(o) != null;
    
            }
    
            publicvoid clear() {
    
                Hashtable.this.clear();
    
            }
    
        }

    3、Hashtable几个重要的方法分析

      主要方法:Hashtable()、contains()、get()、rehash()、addEntry()、put(K,V)、remove(Object),像size()、keys()、values()、isEmpty()、elements()

      比较简单的就不介绍了。

    (1) Hashtable

    public Hashtable(int initialCapacity, float loadFactor) {
    
            if (initialCapacity < 0)
    
                throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
    
            if (loadFactor <= 0 || Float.isNaN(loadFactor))
    
                throw new IllegalArgumentException("Illegal Load: "+loadFactor);
    
            if (initialCapacity==0)
    
                initialCapacity = 1;
    
            this.loadFactor = loadFactor;
    
            table = new Entry<?,?>[initialCapacity];
    
            threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    
    //threshold的计算方式,MAX_ARRAY_SIZE防止经过n次扩容后,数组大小超出整数的最大值,所以这里设定一个上限的阈值
    }
    
       public Hashtable() { 
    
             this(11, 0.75f); //默认的table容量为11,装载因子为0.75
    
     }

    (2) contains

    public synchronized boolean contains(Object value) {
    
          if (value == null) {    //Hashtable的value不允许为空,不然会报空指针
    
                    thrownew NullPointerException();
    
          }  
    
                Entry<?,?> tab[] = table;
    
                //从数组的最后往前遍历
    
                for (int i = tab.length ; i-- > 0 ;) {
    
                //再对每个entry链表进行遍历
    
                    for (Entry<?,?> e = tab[i] ; e != null ; e = e.next) {
    
                //如果找到对应的value,返回true
    
                       if (e.value.equals(value)) {        
    
                           return true;
    
                       }
    
                    }
    
                }
    
                //没找到返回false
    
                return false;
    
    }

    (3) containsKey

    public synchronized boolean containsKey(Object key) {
    
                Entry<?,?> tab[] = table;
    
                int hash = key.hashCode();
    
                //计算数组的索引,Hashtable本质上采用除数取余法进行散列分布
    
                int index = (hash & 0x7FFFFFFF) %tab.length;
    
                for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
    
                    if ((e.hash == hash) && e.key.equals(key)){
    
                       return true;
    
                    }
    
                }
    
                return false;
    
    }

    (4) get

    public synchronized V get(Object key) {
    
                Entry<?,?> tab[] = table;
    
                int hash = key.hashCode();
    
                //通过key的hash值和table的length,经过运算得到散列表中的索引
    
                int index = (hash & 0x7FFFFFFF) %tab.length;
    
                //遍历tab[index]对应的链表
    
                for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
    
                //如果entry的key和hash值与期望值一致,则返回
    
                    if ((e.hash == hash) && e.key.equals(key)){
    
                       return (V)e.value;
    
                    }
    
                }
    
                //否则返回空值
    
                return null;
    
     }

    (5) rehash

    @SuppressWarnings("unchecked")
    
            protectedvoid rehash() {
    
                //保存旧的容量和Entry数组
    
                int oldCapacity = table.length;
    
                Entry<?,?>[] oldMap = table;
    
                //定义新值,新的容量为旧值的2倍加1
    
                int newCapacity = (oldCapacity << 1) + 1;
    
                //判断新的容量是否超过了上限
    
                if (newCapacity - MAX_ARRAY_SIZE > 0) {
    
                    if (oldCapacity == MAX_ARRAY_SIZE)            
    
                       return;
    
                    newCapacity = MAX_ARRAY_SIZE;
    
                }
    
                //定义新的数组
    
                Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];
    
                //此时,散列表内的元素发生变化,modCount指针加1
    
                modCount++;
    
                //重新计算新的threshold
    
                threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE+ 1);
    
                table = newMap;
    
               
    
                //对散列表内的所有元素进行“重排列”,顺序从后往前
    
                for (int i = oldCapacity ; i-- > 0 ;) {
    
                    //遍历oldMap[i]对应的entry链表
    
                    for (Entry<K,V> old = (Entry<K,V>)oldMap[i]; old != null ; ) {
    
                       Entry<K,V> e = old;
    
                       old = old.next;
    
                    //计算新数组的索引值
    
                       int index = (e.hash & 0x7FFFFFFF) %newCapacity;
    
                   //先插入起始值     
    
                       e.next = (Entry<K,V>)newMap[index];
    
                    //对应的向右侧移动
    
                       newMap[index] = e;
    
                    /**
    
                     * 可能e.next = (Entry<K,V>)newMap[index];和newMap[index] = e;比较生硬,我们举例说明
    
                     * 第一次遍历时,newMap[index]为null,所以 e.next=null
    
                     * 第二次遍历时,假定e1=e.next, 然后 e1.next = e, newMap[index] = e1(起始点为e1)
    
                     * ...
    
                     * 依次进行,会发现链表中插入元素的顺序是“从左往右”
    
                     */
    
                    }
    
                }
    
      }

    (6) addEntry

    private void addEntry(int hash, K key, V value, int index) {
    
                 //modCount指针,对于修改操作不会自增,而对于内部元素数量的变化会自增
    
                   modCount++;
    
                   Entry<?,?> tab[] = table;
    
                   //如果count大于阈值
    
                   if (count >= threshold) {
    
                       //进行重排列操作
    
                        rehash();
    
                        tab = table;
    
                        hash = key.hashCode();
    
                        index = (hash & 0x7FFFFFFF) %tab.length;
    
                   }
    
                   //如果不大于阈值,则直接插入
    
                   @SuppressWarnings("unchecked")
    
                   Entry<K,V> e = (Entry<K,V>) tab[index];
    
                   //如果e为空,将插入到起始位置,如果e不为空,则从左向右插入
    
                    tab[index] = new Entry<>(hash, key, value, e);
    
                    count++;
    
          }

    (7) put

    下图为jdk1.8的hashMap的put方法的过程,Hashtable和其类似,基本上“计算索引,逻辑判断”这个部分是一致的,差别在于Hashtable中没有用到红黑树

    public synchronized V put(K key, V value) {
    
                // 首先value不能为空
    
                if (value == null) {
    
                    throw new NullPointerException();
    
                }                   
    
                Entry<?,?> tab[] = table;
    
                int hash = key.hashCode();
    
                int index = (hash & 0x7FFFFFFF) %tab.length;
    
                @SuppressWarnings("unchecked")
    
                //判断tab[index]是否已经有值
    
                Entry<K,V> entry = (Entry<K,V>)tab[index];
    
                //如果有值,则遍历
    
                for(; entry != null ; entry = entry.next) {
    
                    //如果key重复,那么新的value覆盖旧值
    
                    if ((entry.hash == hash) &&entry.key.equals(key)) {
    
                       V old = entry.value;
    
                       entry.value = value;
    
                       return old;
    
                    }
    
                }
    
                //经过遍历,发现key并没有重复,进行插入操作
    
                addEntry(hash, key, value, index);
    
                return null;
    
       }

    (8) remove

    public synchronized V remove(Object key) {
    
                Entry<?,?> tab[] = table;
    
                int hash = key.hashCode();
    
                //计算索引
    
                int index = (hash & 0x7FFFFFFF) %tab.length;
    
                @SuppressWarnings("unchecked")
    
                //获得索引位置对应的Entry链表
    
                Entry<K,V> e = (Entry<K,V>)tab[index];
    
                //遍历链表中的entry元素
    
                for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) {
    
                    //如果找到需要的entry,进行删除
    
                    if ((e.hash == hash) &&e.key.equals(key)) {
    
                       //修改指针加1
    
                       modCount++;
    
                       //如果prev结点非空
    
                       if (prev != null) {
    
                           //那么pre结点的next指针指向e的next,等价于e被删除
    
                           prev.next = e.next;
    
                       } else {
    
                           //否则,说明需要删除的为起始结点
    
                           tab[index] = e.next;
    
                       }
    
                       count--;
    
                       V oldValue = e.value;
    
                       e.value = null;
    
                       return oldValue;
                    }
                }
                return null;
    }

    遍历HashTable相关介绍

    1、遍历Hashtable的键值对(获取键值集)
    第一步:根据entrySet()获取Hashtable的“键值对”的Set集合。
    第二步:通过Iterator迭代器遍历“第一步”得到的集合。

    // 假设table是Hashtable对象
    // table中的key是String类型,value是Integer类型
    Integer integ = null;
    Iterator iter = table.entrySet().iterator();
    while(iter.hasNext()) {
    Map.Entry entry = (Map.Entry)iter.next();
    // 获取key
    key = (String)entry.getKey();
    // 获取value
    integ = (Integer)entry.getValue();
    }

    2、通过Iterator遍历Hashtable的键(获取键集)
    第一步:根据keySet()获取Hashtable的“键”的Set集合。
    第二步:通过Iterator迭代器遍历“第一步”得到的集合。

    // 假设table是Hashtable对象
    // table中的key是String类型,value是Integer类型
    String key = null;
    Integer integ = null;
    Iterator iter = table.keySet().iterator();
    while (iter.hasNext()) {
    // 获取key
    key = (String)iter.next();
    // 根据key,获取value
    integ = (Integer)table.get(key);
    }

    3、通过Iterator遍历Hashtable的值(获取值集)
    第一步:根据value()获取Hashtable的“值”的集合。
    第二步:通过Iterator迭代器遍历“第一步”得到的集合。

    // 假设table是Hashtable对象
    // table中的key是String类型,value是Integer类型
    Integer value = null;
    Collection c = table.values();
    Iterator iter= c.iterator();
    while (iter.hasNext()) {
    value = (Integer)iter.next();
    }

    4、通过Enumeration遍历Hashtable的键(获取键集)
    第一步:根据keys()获取Hashtable的集合。
    第二步:通过Enumeration遍历“第一步”得到的集合。

    Enumeration enu = table.keys();
    while(enu.hasMoreElements()) {
    System.out.println(enu.nextElement());
    }   

    5、通过Enumeration遍历Hashtable的值(获取值集)
    第一步:根据elements()获取Hashtable的集合。
    第二步:通过Enumeration遍历“第一步”得到的集合。

    Enumeration enu = table.elements();
    while(enu.hasMoreElements()) {
    System.out.println(enu.nextElement());
    }

    HashMap和Hashtable的区别

    • HashMap是非线程安全的,Hashtable是线程安全的,所以Hashtable重量级一些,因为使用了synchronized关键字来保证线程安全。
    • HashMap允许key和value都为null,而Hashtable都不能为null。
    • Hashtable继承自 JDK 1.0 的 Dictionary 虚拟类,而HashMap是 JDK 1.2 引进的 Map 接口的一个实现。
    • Hashtable和HashMap扩容的方法不一样,Hashtable中数组默认大小11,扩容方式是 old*2+1。HashMap中数组的默认大小是16,而且一定是2的指数,增加为原来的2倍。
    • 两者通过hash值散列到hash表的算法不一样,Hashtable是古老的除留余数法,直接使用Object的hashcode,而后者是强制容量为2的幂,重新根据hashcode计算hash值,在使用hash和(hash表长度 – 1)进行与运算,也等价取膜,但更加高效,取得的位置更加分散,偶数,奇数保证了都会分散到。前者就不能保证。
    • HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构(增加或者移除元素),将会抛出ConcurrentModificationException,但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。
  • 相关阅读:
    spring(2)
    Android之滑动按钮实现Demo
    spring(1)
    spring(4)
    Android之ImageSwitch控件
    使用非阻塞ServerSocketChannel、SocketChannel代替ServerSocket和Socket
    Android之界面刷新(invalidate和postInvalidate使用)
    Android之改变控件的背景及形态
    Android之获得内存剩余大小与总大小
    OpenCV中矩阵的归一化
  • 原文地址:https://www.cnblogs.com/FondWang/p/12532376.html
Copyright © 2011-2022 走看看