随机数据结构：跳表（SkipList）

zoukankan html css js c++ java

随机数据结构：跳表（SkipList）
在JDK的并发包中，除了常用的哈希表外，还有一种有趣的数据结构—跳表。跳表是一种可以用来快速查找的数据结构，有点类似于平衡树。它们的相同点都是可以对元素进行快速的查找。但有一个很重要的差别：对平衡树的插入和删除往往很可能导致平衡树进行一次全局的调整。而对跳表的插入和删除只需要对整个数据结构的局部进行操作即可。这样导致的结果就是，在高并发的情况下，你会需要一个全局锁来保证整个平衡树的线程安全，对于跳表，你只需要局部加锁即可。这样，就导致了跳表在高并发的情况下拥有更好的性能。

　　跳表的本质是同时维护了多个链表，并且链表是分层的，如下图所示：

如上图所示，最低层的链表维护了跳表内所有的元素，每上面一层链表都是下面一层的子集，一个元素插入哪些层是完全随机的。因此，跳表还是有可能会有很糟糕的结构出现的概率的。但是在实际中，跳表的表现是非常好的。

还可以看出跳表内的所有链表的元素都是排序的，可以得出，跳表是一种空间换时间的算法。

跳表的查找方式：

　　跳表查找时，可以从顶级链表开始找，一旦发现被查找的元素大于当前链表中的取值，就会转入下一层开始查找。也就是说，在查找中，搜索是跳跃式的。

　　举例说明：从上述跳表结构中查找元素7，查找从顶层的头部索引节点开始。由于顶层的元素少，可以快速的跳跃那些小于7的元素。很快，查找过程就能到元素6，这时转入第二层，由于元素8大于7，故无法在第二层找到元素7，所以转入最低层开始查找，并且很快就能根据元素6找到元素7，这个查找元素的过程要比从元素1开始查找逐个搜索快很多，整个过程如下图红线所示：

在JDK中采用跳表结构的并发容器有：ConcurrentSkipListMap和ConcurrentSkipListSet；

ConcurrentSkipListMap：

ConcurrentSkipListMap和ConcurrentHashMap的不同之处不仅仅在于底层结构一个是跳表结构，一个是哈希算法结构；还有一个不同之处在于，哈希不会保存元素的顺序，而跳表内所有的元素都是有序的。因此，遍历跳表时，会得到一个有序的结果。所以，当你的应用需要有序性时，跳表就是你的不二选择。

先举例看看跳表Map（ConcurrentSkipListMap）的简单使用：
1 public static void main(String[] args){ 2 Map<Integer,Integer> map = new ConcurrentSkipListMap<Integer, Integer>(); 3 for (int i = 0;i < 10;i++){ 4 map.put(i,i); 5 } 6 for (Map.Entry<Integer,Integer> entry : map.entrySet()){ 7 System.out.println(entry.getKey()); 8 } 9 }
输出结果：
0 1 2 3 4 5 6 7 8 9
可以从输出结果看出，ConcurrentSkipListMap遍历输出是有序的。，并且使用的方式跟哈希Map的用法一致。

接下来通过源码来探究ConcurrentSkipListMap的底层实现：

首先是Node：
1 static final class Node<K,V> { 2 final K key; 3 volatile Object value; 4 volatile Node<K,V> next; 5 6 Node(K key, Object value, Node<K,V> next) { 7 this.key = key; 8 this.value = value; 9 this.next = next; 10 }
可以看出Node是由静态内部类实现的，一个Node就是一个节点，里面含有三个元素，key和value（就是Map的key和value），每个Node会指向下一个Node，next就是干这事的。value和next是关键字volatile修饰的，这保证了在并发环境下，线程对于value和next的可见性。对Node的操作，都是使用的CAS方法：
1 　　boolean casValue(Object cmp, Object val) { 2 return UNSAFE.compareAndSwapObject(this, valueOffset, cmp, val); 3 } 4 5 boolean casNext(Node<K,V> cmp, Node<K,V> val) { 6 return UNSAFE.compareAndSwapObject(this, nextOffset, cmp, val); 7 }
casValue()是用来设置value的值的方法，casNext()则是用来设置next的字段。

数据结构Index：

　　index表示索引，看它的内部实现：
final Node<K,V> node; final Index<K,V> down; volatile Index<K,V> right;
上述时Index的类的变量定义，Index是一个ConcurrentSkipListMap的静态内部类，它包含了Node，还有向下和向右的引用。整个跳表就是根据Index进行全网的组织的。

此外，对于每一层的表头，还需要记录当前处于哪一层。所以，还有一个数据结构HeadIndex，表示链表头部的第一个Index，它继承于Index：
1 static final class HeadIndex<K,V> extends Index<K,V> { 2 final int level; 3 HeadIndex(Node<K,V> node, Index<K,V> down, Index<K,V> right, int level) { 4 super(node, down, right); 5 this.level = level; 6 } 7 }
level表示第几层，这样一个index包含有Node，向下的引用，向右的引用，第几层，通过这些条件就能准确的定位元素的位置了。对于跳表的所有操作，就是组织好这些Index之间的连接关系。

跳表的特点：

　　❤ 跳表的查询时间复杂度是O（log n）；

　　❤ 随机算法；

　　❤ 跳表内所有链表的元素都是排序的；

　　❤ 采用CAS算法，保证线程安全。

参考：《Java高并发程序设计》葛一鸣郭超编著：
作者：Joe

出处：https://www.cnblogs.com/Joe-Go/

努力了的才叫梦想，不努力的就是空想，努力并且坚持下去，毕竟这是我相信的力量
查看全文

相关阅读:
【BZOJ4892】【TJOI2017】—DNA（后缀数组+ST表）
【BZOJ1563】【NOI2009】—诗人小G（决策二分栈优化dp）
【洛谷P5249】【LnOI2019】—加特林轮盘赌（概率dp）
【Ural1519】— Formula1（轮廓线dp）
【BZOJ3728】【PA2014】—Final Zarowki（思维题）
【BZOJ3730】—震波（动态点分治）
【Hackerrank (70)】—Range Modular Query（莫队+暴力）
【省选模拟】—Cactus（圆方树+dfs序）
【BZOJ2125】—最短路（圆方树+树链剖分）
python 基础列表

原文地址：https://www.cnblogs.com/Joe-Go/p/9789842.html

随机数据结构：跳表（SkipList）

跳表的查找方式：

ConcurrentSkipListMap：

数据结构Index：

跳表的特点：