zoukankan      html  css  js  c++  java
  • Java中哈希表(Hashtable)是如何实现的

    Java中哈希表(Hashtable)是如何实现的

    Hashtable中有一个内部类Entry,用来保存单元数据,我们用来构建哈希表的每一个数据是Entry的一个实例。假设我们保存下面一组数据,第一列作为key, 第二列作为value。

    {“one", 1}
    {"two", 2}
    {"three", 3}
    {"four", 4}
    

    写一个演示程序:

    import java.util.Hashtable;
    
    public class Main {
    
        public static void main(String[] args) {
            Hashtable<String, Integer> numbers = new Hashtable<String, Integer>();
            numbers.put("one", 1);
            numbers.put("two", 2);
            numbers.put("three", 3);
            numbers.put("four", 4);
            numbers.put("five", 5);
    
            Integer n = numbers.get("two");
            Integer nn = numbers.get("six");
            
            if(n != null)
                System.out.println(n);
                System.out.println(nn);
        }
    }
    

    Hashtable内部用一个Entry数组table,来保存所有的数据。

    当我们插入一个新的Entry对象时,即用Hashtable的put(key, value)方法。
    在put方法里:
    计算key的hash值
    计算index值,作为数组table的下标,即table[index]
    哈希表中根据key的索引值index,创建了多个bucket,所有index值一样的Entry对象,构造成一个链接表存放在同一个bucket里。既然是一个链接表,根据数据结构知识,自然我们的Entry对象需要有一个指向下一个对象的指针,即Entry对象需要有这些属性:key,value,next。

    如何构造hash函数?

    hash值,如何生成?对于每个对象的hash值,要保证每一个hash值都不一样。
    在Java SDK中, String的hashCode方法如下:

    //hash的初始值为0
    public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;
    
            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }
    

    index值,如何生成?这里要求保存的数据是均匀的分配在每一个bucket中,Hashtable源码中采用%操作(mod)使数据分布在编号为0~10的bucket中。
    Hashtable中put方法的源码如下:

    private int hash(Object k) {
        // hashSeed will be zero if alternative hashing is disabled.
        return hashSeed ^ k.hashCode();
    }
    
    public synchronized V put(K key, V value) {
        ... ...
        int hash = hash(key);
        int index = (hash & 0x7FFFFFFF) % tab.length;
        ... ...
    }
    

    这样数据存储到哈希表之后,当我们要查找或者说获取一个对象时候,采用同样的方式可以快速的找到我们需要的对象。

    哈希表可以快速的找到一个元素。在有大量的数据的时候,比普通的顺序查找要快的多。
    假设有10000条数据,如果采用顺序查找,最坏的情况下需要对比10000次能找到,最好的情况是1次。平均查找次数位(10000+1)/2,大约为5000次。
    换一种方式,如果把10000条数据通过hash值索引分成10组,每一组有1000条数据,这样每一次只需要先确定是哪一组,然后在1000条数据里查找,这样最坏的情况是1000次, 最好的情况是1次。平均查找次数为(1000+1)/2 ,大约为500次。比上面的方法快了5倍。

    我们常用的5种算法有顺序查找,二分法查找,二叉排序树查找,哈希表法查找,分块查找。Java的Hashtable即是用了哈希表法查找。

  • 相关阅读:
    UVA 1001 Say Cheese
    UVa 821 Page Hopping
    UVA 1569 Multiple
    UVA 1395 Slim Span
    UVA 12219 Common Subexpression Elimination
    UVA 246 10-20-30
    Mysql基本操作
    浅析关键字static
    面试回答技巧
    五个程序员好习惯
  • 原文地址:https://www.cnblogs.com/goodwin/p/4102702.html
Copyright © 2011-2022 走看看