Java中哈希表(Hashtable)是如何实现的

zoukankan html css js c++ java

Java中哈希表(Hashtable)是如何实现的
Java中哈希表(Hashtable)是如何实现的

Hashtable中有一个内部类Entry，用来保存单元数据，我们用来构建哈希表的每一个数据是Entry的一个实例。假设我们保存下面一组数据，第一列作为key, 第二列作为value。
```
{“one", 1}
{"two", 2}
{"three", 3}
{"four", 4}
```
写一个演示程序：
```
import java.util.Hashtable;

public class Main {

    public static void main(String[] args) {
        Hashtable<String, Integer> numbers = new Hashtable<String, Integer>();
        numbers.put("one", 1);
        numbers.put("two", 2);
        numbers.put("three", 3);
        numbers.put("four", 4);
        numbers.put("five", 5);

        Integer n = numbers.get("two");
        Integer nn = numbers.get("six");
        
        if(n != null)
            System.out.println(n);
            System.out.println(nn);
    }
}
```
Hashtable内部用一个Entry数组table，来保存所有的数据。

当我们插入一个新的Entry对象时，即用Hashtable的put(key, value)方法。
在put方法里：
计算key的hash值
计算index值，作为数组table的下标，即table[index]
哈希表中根据key的索引值index，创建了多个bucket，所有index值一样的Entry对象，构造成一个链接表存放在同一个bucket里。既然是一个链接表，根据数据结构知识，自然我们的Entry对象需要有一个指向下一个对象的指针，即Entry对象需要有这些属性：key，value，next。

如何构造hash函数？

hash值，如何生成？对于每个对象的hash值，要保证每一个hash值都不一样。
在Java SDK中， String的hashCode方法如下：
```
//hash的初始值为0
public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;

        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}
```
index值，如何生成？这里要求保存的数据是均匀的分配在每一个bucket中，Hashtable源码中采用%操作(mod)使数据分布在编号为0~10的bucket中。
Hashtable中put方法的源码如下：
```
private int hash(Object k) {
    // hashSeed will be zero if alternative hashing is disabled.
    return hashSeed ^ k.hashCode();
}

public synchronized V put(K key, V value) {
    ... ...
    int hash = hash(key);
    int index = (hash & 0x7FFFFFFF) % tab.length;
    ... ...
}
```
这样数据存储到哈希表之后，当我们要查找或者说获取一个对象时候，采用同样的方式可以快速的找到我们需要的对象。

哈希表可以快速的找到一个元素。在有大量的数据的时候，比普通的顺序查找要快的多。
假设有10000条数据，如果采用顺序查找，最坏的情况下需要对比10000次能找到，最好的情况是1次。平均查找次数位(10000+1)/2，大约为5000次。
换一种方式，如果把10000条数据通过hash值索引分成10组，每一组有1000条数据，这样每一次只需要先确定是哪一组，然后在1000条数据里查找，这样最坏的情况是1000次，最好的情况是1次。平均查找次数为(1000+1)/2 ，大约为500次。比上面的方法快了5倍。

我们常用的5种算法有顺序查找，二分法查找，二叉排序树查找，哈希表法查找，分块查找。Java的Hashtable即是用了哈希表法查找。
查看全文

相关阅读:
mac OSX 上 brew install hive
mac osx 系统 brew install hadoop 安装指南
 python在windows平台的pip安装package时的编译问题
 安装scapy遇到的问题
 node中使用domain处理异步异常问题
 web开发中的 emmet 效率提升工具
 未来10年房地产存量与人口需求量分析
 Apple individual program 加入之后的玩法官方资源
 nginx 反向代理与 Apache backend的配置联合配置
 ubuntu 休眠之后网络间接失败 can not connect to network after suspend (wake up)

原文地址：https://www.cnblogs.com/goodwin/p/4102702.html