zoukankan      html  css  js  c++  java
  • 从JDK源码学习HashSet和HashTable

    HashSet

    Java中的集合(Collection)有三类,一类是List,一类是Queue,再有一类就是Set。 前两个集合内的元素是有序的,元素可以重复;最后一个集合内的元素无序,但元素不可重复。

    Set:

    1.用于存储无序(存入和取出的顺序不一定相同)元素,值不能重复

    2.对象的相等性本质是对象hashCode值(java是依据对象的内存地址计算出的此序号,不同对象的hashcode不一定不一样)判断的,如果想要让两个不同的对象视为相等的,就必须覆盖Object的hashCode方法和equals方法,比如string类就重写了hashcode方法,算出的hashcode值并不是对象的实际内存地址,equals也被重写了

    String.hashcode()

     String.equals

    1.先验证是否是否是同一个对象

    2.再验证是否是同一类型(String),然后验证值是否相等

    Hashset也是支持序列化、浅拷贝的

    Hashset内部还是Hashset,只不过调用它的add直接放入的不再是键值对

    看下其add方法:

    直接调用map.put放入e所代表的的键以及present成员变量

    而这里的map就是hashset内部存储值的结构,可以看到其键是放入的,键所对应的值是object的实例

     

    既然其用的hashmap,那么其构造方法实际上就是定义hashmap,所以就是hashmap的那四种构造方法

    那么取值的时候不像hashmap那么方便可以直接取某个键对应的值,取hashset中的值是获得一个迭代器,取得内部hashmap所有的键然后遍历再进行操作

     所以其内部存储时结构也和hashmap结构一样了,同时hashset也是非线程安全的

    ArrayList和HashSet的区别

    1.前者有序,可存放重复值,后者无序,不可存放重复值,因为hashmap键不能重复

    2.Arraylist被填满扩充1.5倍,Hashset扩充机制和hashmap相同

    HashTable

    HashTable实现的map接口,支持序列化和浅拷贝

    hashtable也是"拉链法"实现的hash表(只是数组加单链表),其内部存储结构为entry数组,和hashmap类似,其也有负载因子和初始容量

    其构造方法也有4种

    第一种如下支持初始指定容量和负载因子,此时将给entry分配内存空间,并且初始化阈值为初始容量和(2的31次-1)-8(最大值字节数)+1的较小值

    第二种只指定初始化大小

     

    第三种使用默认初始容量和负载因子,初始容量为11

     

    第四种则是直接放入一个map进来初始化构造一个hashtable,此时的hashtable容量将变为放入的map的键值对的个数的2倍和默认容量的较大值,然后再将map放入

     

    而hashmap这里是和hashtable不一样的,初始化时将用放入的map的键值数量/负载因子+0.75,算出的值再和2的30次方做比较,取两者较小值和阈值进行比较,并赋值阈值为大于算出值最接近的2的次方值,便于后面resize扩容,然后后面再通过循坏将map中的值依次放入

     

    HashTable和HashMap的比较

    1.HashTable 基于 Dictionary 类,而 HashMap 是基于 AbstractMap。Dictionary 是任何可将键映射到相应值的类的抽象父类, AbstractMap 是基于 Map 接口的实现,但hashtable和hashmap二者都实现了Map接口

    2.hashmap可以放键和值均为null的值,但是这样的值你也只能放一个进去,所以hashmap中判断是否存在某个键要用containskey(键必定是唯一的),而不能用get,因此能有多个键对应的value都是null,而hashtable的键和值不可以为null,否则将会报空指针错误

    hashmap的处理:

    所以hashmap考虑到了这种key为null的情况,让其hash算出来为0,不为null的key再调用object的hashcode方法算hash

    hashmap的get方法如下图,不存在也有可能返回null或者键的值为null,无法判断

    hashtable的处理:

    hashtable的设计并没有考虑这么多,而是直接调用其key的hashcode,那么null.hashcode,必将报错

     

    hashtable将检测放入的键对应的值是否为null

     

    3.hashmap在默认情况下是非线程安全的,而hashtable以为基本public方法都是用synchronized修饰的,因此其为同步的

    4.两者的扩容方式不一样,hashmap扩容是resize方法,容量变为old*2,而hashtable是rehash方法,容量变为old*2+1,

    5.两者内部遍历实现不一样:

    hashmap的键值遍历为iterator

    hashtable的键值遍历为Enumerator

     6.获取键所在的位置时的方法不同:

    hashmap中首先用与逻辑代替了模运算加快了速度,2的n次方-1位全1二进制位再与key的hash与算出键值对的位置,并且其hash值并不是单纯的hashcode,而是用到了key的hashcode的高16位来做异或运算

     

     hashtable中是根据key直接算一个hashcode(可能为负值),然后再和2的31次方-1做与算出来的正值再模当前hash表的长度,然后确定键值对的位置,那么取模的效率肯定没有与逻辑的运行效率更高

    参考

    https://blog.csdn.net/fujiakai/article/details/51585767 hashmap和hashtable区别

    https://wiki.jikexueyuan.com/project/java-collection/hashtable.html hashmap实现原理

  • 相关阅读:
    hadoop2 作业执行过程之reduce过程
    hadoop2 作业执行过程之map过程
    hadoop2 作业执行过程之yarn调度执行
    scala的下划线
    tomcat 配置系列1
    Windows Server 2008 __ Windows Server 2008R2
    dell技术中心
    戴尔服务器启动和raid设置(以dell r420为例)
    WinPE安装windows(dell r420)
    Red Hat enterprise linux 5.4 x64 + DELL R420 安装网卡驱动 (broadcom 5270)
  • 原文地址:https://www.cnblogs.com/tr1ple/p/12701149.html
Copyright © 2011-2022 走看看