zoukankan      html  css  js  c++  java
  • HashSet和CopyOnWriteArraySet(转载)

    前言

    这篇文章的目的如下:

    • HashSet是如何保证元素的不重复和无序
    • HashSet的增删(改查?)原理
    • CopyOnWriteArraySet支持并发的原理
    • CopyOnWriteArraySet的增删(改查?)原理

    如果不想看分析过程,可直接拉到文章末尾看结论

    先来看看 Set接口

    public interface Set<E> extends Collection<E> {
     
        int size();
        boolean isEmpty();
        boolean contains(Object o);
        Object[] toArray();
        <T> T[] toArray(T[] a);
        boolean add(E e);
        boolean remove(Object o);
        boolean containsAll(Collection<?> c);
        boolean addAll(Collection<? extends E> c);
        boolean retainAll(Collection<?> c);
        boolean removeAll(Collection<?> c);
        boolean equals(Object o);
        int hashCode();
    }

    我们从以上接口发现Set并没有get和set方法,也就是没有查和改,为什么呢?原因如下:

    • 因为Set是无序的,没有通过index来进行查询
    • 同样是因为Set是无序的,也就是没有办法通过Index来进行修改

    1 HashSet如何保证元素不重复?

    要弄清楚HashSet如何保证里面的元素不重复,得从以下两个方面入手:

    • 它底层的存储结构是什么?
    • 插入时是如何判断元素是否存在?

    当我们弄清楚上面两个问题之后我们也可以明白HashSet为什么是无序的了。

    1)HashSet的底层存储逻辑

    且看源码:

    public class HashSet<E>
        extends AbstractSet<E>
        implements Set<E>, Cloneable, java.io.Serializable{
        static final long serialVersionUID = -5024744406713321676L;
    
        private transient HashMap<E,Object> map;
    
        // Dummy value to associate with an Object in the backing Map
        private static final Object PRESENT = new Object();
    
        /**
         * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
         * default initial capacity (16) and load factor (0.75).
         */
        public HashSet() {
            map = new HashMap<>();
        }
        ...
    }

    我们可以看出来HashSet的底层存储结构是一个HashMap,并且HashSet的元素作为该Map的Key进行存储,HashMap的Key的存储是无序并且不可重复,这就解释了HashSet中如何保证元素不重复

    2)插入逻辑

    public boolean add(E e) {return map.put(e, PRESENT)==null;}

    直接put到map当中

    3)总结

    由以上内容我们可以知道HashSet的底层存储结构是HashMap,并且插入到HashSet中元素作为map的key进行存储,这就保证HashSet的一下特点:

    • HashSet中的元素不重复的
    • HashSet中的元素是无序的

    2 HashSet增删(改查?)原理

    我们从上一小节了解到HashSet的底层存储结构是HashMap,那么它的增删也就是map的put和remove

    1)增

    public boolean add(E e) {return map.put(e, PRESENT)==null;}

    直接put到map当中

    2)删

    public boolean remove(Object o) {return map.remove(o)==PRESENT;}

    直接在map中移除即可,非常简单

    3 CopyOnWriteArraySet为什么能支持并发?

    在搞清楚CopyOnWriteArraySet为什么能支持并发 这个问题之前,我们先来想想以下几个问题:

    • HashSet对应的并发类为什么叫CopyOnWriteArraySet,而不是叫CopyOnWriteHashSet呢?
    • CopyOnWriteArraySet和CopyOnWriteArrayList有没有关系?

    我想一旦我们弄清楚上面两个问题我们就是知道 CopyOnWriteArraySet为什么能支持并发?

    先来看看CopyOnWriteArraySet的部分源码:

    public class CopyOnWriteArraySet<E> extends AbstractSet<E>
            implements java.io.Serializable {
        private static final long serialVersionUID = 5457747651344034263L;
    
        private final CopyOnWriteArrayList<E> al;
    
        /**
         * Creates an empty set.
         */
        public CopyOnWriteArraySet() {
            al = new CopyOnWriteArrayList<E>();
        }
        ...
    }

    从源码中神奇地发现CopyOnWriteArraySet的底层存储结构竟然是CopyOnWriteArrayList,那么我们就可以知道它的名字的由来了,并且知道它支持并发的原理跟CopyOnWriteArrayList是一样的。

    附:CopyOnWriteArrayList原理解析

    4 CopyOnWriteArraySet的增删(改查?)原理

    1)增

    public boolean add(E e) {
        return al.addIfAbsent(e);
    }

    看方法名我们就是如果CopyOnWriteArrayList中不存在某元素才会添加成功

    2)删

    public boolean remove(Object o) {
        return al.remove(o);
    }

    直接从CopyOnWriteArrayList中移除

    5 总结

    • HashSet是如何保证元素的不重复和无序

      答:因为HashSet的底层存储结构是HashMap,并且HashSet中的元素是作为Map的Key存储到Map中,所以HashMap中Key是不重复且无序,所以HashSet中的元素也就是不重复和无序的

    • HashSet的增删(改查?)原理

      HashSet的增删原理很简单,就是map的put和remove,为什么没有改查呢?那是因为HashSet中的元素是无序的,没办法根据索引进行查询和修改

    • CopyOnWriteArraySet支持并发的原理

      CopyOnWriteArraySet之所以叫CopyOnWriteArraySet,是因为它的底层存储结构是CopyOnWriteArrayList,同时也就是保证了它的并发安全性

    • CopyOnWriteArraySet的增删(改查?)原理

      CopyOnWriteArraySet继承了AbstractSet,跟HashSet一样只有增删,没有改查,增删原理也就是调用CopyOnWriteArrayList的增删方法,只不过增的时候需要判断一下List中是否存储该元素

  • 相关阅读:
    git把dev部分提交过的内容合并到master
    shell命令修改文件内容
    js时间格式化
    js判断对象是否为空
    JS数组遍历方法
    批量修改文件后缀
    curl实现put请求
    lumen伪静态路由设置示例
    nginx client_body_buffer_size
    nginx模块开发
  • 原文地址:https://www.cnblogs.com/lyrb/p/11881604.html
Copyright © 2011-2022 走看看