ConcurrentHashMap的JDK1.8实现

zoukankan html css js c++ java

ConcurrentHashMap的JDK1.8实现
今天我们介绍一下ConcurrentHashMap在JDK1.8中的实现。
基本结构

ConcurrentHashMap在1.8中的实现，相比于1.7的版本基本上全部都变掉了。首先，取消了Segment分段锁的数据结构，取而代之的是数组+链表（红黑树）的结构。而对于锁的粒度，调整为对每个数组元素加锁（Node）。然后是定位节点的hash算法被简化了，这样带来的弊端是Hash冲突会加剧。因此在链表节点数量大于8时，会将链表转化为红黑树进行存储。这样一来，查询的时间复杂度就会由原先的O(n)变为O(logN)。下面是其基本结构：

相关属性
[java] view plain copy

private transient volatile int sizeCtl;
sizeCtl用于table[]的初始化和扩容操作，不同值的代表状态如下：
- -1：table[]正在初始化。
- -N：表示有N-1个线程正在进行扩容操作。
非负情况：
1. 如果table[]未初始化，则表示table需要初始化的大小。
2. 如果初始化完成，则表示table[]扩容的阀值，默认是table[]容量的0.75 倍。
[java] view plain copy

private static finalint DEFAULT_CONCURRENCY_LEVEL = 16;
- DEFAULT_CONCURRENCY_LEVEL：表示默认的并发级别，也就是table[]的默认大小。
[java] view plain copy

private static final float LOAD_FACTOR = 0.75f;
- LOAD_FACTOR：默认的负载因子。
[java] view plain copy

static final int TREEIFY_THRESHOLD = 8;
- TREEIFY_THRESHOLD：链表转红黑树的阀值，当table[i]下面的链表长度大于8时就转化为红黑树结构。
[java] view plain copy

static final int UNTREEIFY_THRESHOLD = 6;
- UNTREEIFY_THRESHOLD：红黑树转链表的阀值，当链表长度<=6时转为链表（扩容时）。
构造函数
[java] view plain copy

public ConcurrentHashMap(int initialCapacity,

                         float loadFactor, int concurrencyLevel) {

    if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)

        throw new IllegalArgumentException();

    if (initialCapacity < concurrencyLevel)   // 初始化容量至少要为concurrencyLevel

        initialCapacity = concurrencyLevel;

    long size = (long)(1.0 + (long)initialCapacity / loadFactor);

    int cap = (size >= (long)MAXIMUM_CAPACITY) ?

        MAXIMUM_CAPACITY : tableSizeFor((int)size);

    this.sizeCtl = cap;

}
从上面代码可以看出，在创建ConcurrentHashMap时，并没有初始化table[]数组，只对Map容量，并发级别等做了赋值操作。
相关节点
1. Node：该类用于构造table[]，只读节点（不提供修改方法）。
2. TreeBin：红黑树结构。
3. TreeNode：红黑树节点。
4. ForwardingNode：临时节点（扩容时使用）。
put()操作
[java] view plain copy

public V put(K key, V value) {

    return putVal(key, value, false);

}



final V putVal(K key, V value, boolean onlyIfAbsent) {

    if (key == null || value == null) throw new NullPointerException();

    int hash = spread(key.hashCode());

    int binCount = 0;

    for (Node<K,V>[] tab = table;;) {

        Node<K,V> f; int n, i, fh;

        if (tab == null || (n = tab.length) == 0)// 若table[]未创建，则初始化

            tab = initTable();

        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {// table[i]后面无节点时，直接创建Node（无锁操作）

            if (casTabAt(tab, i, null,

                         new Node<K,V>(hash, key, value, null)))

                break;                   // no lock when adding to empty bin

        }

        else if ((fh = f.hash) == MOVED)// 如果当前正在扩容，则帮助扩容并返回最新table[]

            tab = helpTransfer(tab, f);

        else {// 在链表或者红黑树中追加节点

            V oldVal = null;

            synchronized (f) {// 这里并没有使用ReentrantLock，说明synchronized已经足够优化了

                if (tabAt(tab, i) == f) {

                    if (fh >= 0) {// 如果为链表结构

                        binCount = 1;

                        for (Node<K,V> e = f;; ++binCount) {

                            K ek;

                            if (e.hash == hash &&

                                ((ek = e.key) == key ||

                                 (ek != null && key.equals(ek)))) {// 找到key，替换value

                                oldVal = e.val;

                                if (!onlyIfAbsent)

                                    e.val = value;

                                break;

                            }

                            Node<K,V> pred = e;

                            if ((e = e.next) == null) {// 在尾部插入Node

                                pred.next = new Node<K,V>(hash, key,

                                                          value, null);

                                break;

                            }

                        }

                    }

                    else if (f instanceof TreeBin) {// 如果为红黑树

                        Node<K,V> p;

                        binCount = 2;

                        if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,

                                                       value)) != null) {

                            oldVal = p.val;

                            if (!onlyIfAbsent)

                                p.val = value;

                        }

                    }

                }

            }

            if (binCount != 0) {

                if (binCount >= TREEIFY_THRESHOLD)// 到达阀值，变为红黑树结构

                    treeifyBin(tab, i);

                if (oldVal != null)

                    return oldVal;

                break;

            }

        }

    }

    addCount(1L, binCount);

    return null;

}
从上面代码可以看出，put的步骤大致如下：
1. 参数校验。
2. 若table[]未创建，则初始化。
3. 当table[i]后面无节点时，直接创建Node（无锁操作）。
4. 如果当前正在扩容，则帮助扩容并返回最新table[]。
5. 然后在链表或者红黑树中追加节点。
6. 最后还回去判断是否到达阀值，如到达变为红黑树结构。
除了上述步骤以外，还有一点我们留意到的是，代码中加锁片段用的是synchronized关键字，而不是像1.7中的ReentrantLock。这一点也说明了，synchronized在新版本的JDK中优化的程度和ReentrantLock差不多了。
get()操作
[java] view plain copy

public V get(Object key) {

    Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;

    int h = spread(key.hashCode());// 定位到table[]中的i

    if ((tab = table) != null && (n = tab.length) > 0 &&

        (e = tabAt(tab, (n - 1) & h)) != null) {// 若table[i]存在

        if ((eh = e.hash) == h) {// 比较链表头部

            if ((ek = e.key) == key || (ek != null && key.equals(ek)))

                return e.val;

        }

        else if (eh < 0)// 若为红黑树，查找树

            return (p = e.find(h, key)) != null ? p.val : null;

        while ((e = e.next) != null) {// 循环链表查找

            if (e.hash == h &&

                ((ek = e.key) == key || (ek != null && key.equals(ek))))

                return e.val;

        }

    }

    return null;// 未找到

}
get()方法的流程相对简单一点，从上面代码可以看出以下步骤：
1. 首先定位到table[]中的i。
2. 若table[i]存在，则继续查找。
3. 首先比较链表头部，如果是则返回。
4. 然后如果为红黑树，查找树。
5. 最后再循环链表查找。
从上面步骤可以看出，ConcurrentHashMap的get操作上面并没有加锁。所以在多线程操作的过程中，并不能完全的保证一致性。这里和1.7当中类似，是弱一致性的体现。
size()操作
[java] view plain copy

// 1.2时加入

public int size() {

    long n = sumCount();

    return ((n < 0L) ? 0 :

            (n > (long)Integer.MAX_VALUE) ? Integer.MAX_VALUE :

            (int)n);

}

// 1.8加入的API

public long mappingCount() {

    long n = sumCount();

    return (n < 0L) ? 0L : n; // ignore transient negative values

}



final long sumCount() {

    CounterCell[] as = counterCells; CounterCell a;

    long sum = baseCount;

    if (as != null) {

        for (int i = 0; i < as.length; ++i) {

            if ((a = as[i]) != null)

                sum += a.value;

        }

    }

    return sum;

}
从上面代码可以看出来，JDK1.8中新增了一个mappingCount()的API。这个API与size()不同的就是返回值是Long类型，这样就不受Integer.MAX_VALUE的大小限制了。
两个方法都同时调用了，sumCount()方法。对于每个table[i]都有一个CounterCell与之对应，上面方法做了求和之后就返回了。从而可以看出，size()和mappingCount()返回的都是一个估计值。（这一点与JDK1.7里面的实现不同，1.7里面使用了加锁的方式实现。这里面也可以看出JDK1.8牺牲了精度，来换取更高的效率。）
查看全文

相关阅读:
找水王
 统计txt文档中的单词个数
 返回一个数组中最大子数组的和
 寻找最长字符串
 第二阶段冲刺第九天
 第二阶段冲刺第八天
 第二阶段冲刺第七天
 第二阶段冲刺第六天
 构建之法阅读笔记06
小目标

原文地址：https://www.cnblogs.com/tiancai/p/9071512.html