Skip List（跳跃表）原理详解与实现

zoukankan html css js c++ java

Skip List（跳跃表）原理详解与实现
ref : https://dsqiu.iteye.com/blog/1705530

本文内容框架：

§1 Skip List 介绍

§2 Skip List 定义以及构造步骤

§3 Skip List 完整实现

§4 Skip List 概率分析

§5 小结

§1 Skip List 介绍

Skip List是一种随机化的数据结构，基于并联的链表，其效率可比拟于二叉查找树（对于大多数操作需要O(log n)平均时间）。基本上，跳跃列表是对有序的链表增加上附加的前进链接，增加是以随机化的方式进行的，所以在列表中的查找可以快速的跳过部分列表(因此得名)。所有操作都以对数随机化的时间进行。Skip List可以很好解决有序链表查找特定值的困难。

§2 Skip List 定义以及构造步骤

Skip List定义

像下面这样（初中物理经常这样用，这里我也盗用下）：

一个跳表，应该具有以下特征：
1. 一个跳表应该有几个层（level）组成；
2. 跳表的第一层包含所有的元素；
3. 每一层都是一个有序的链表；
4. 如果元素x出现在第i层，则所有比i小的层都包含x；
5. 第i层的元素通过一个down指针指向下一层拥有相同值的元素；
6. 在每一层中，-1和1两个元素都出现(分别表示INT_MIN和INT_MAX)；
7. Top指针指向最高层的第一个元素。
构建有序链表

的一个跳跃表如下：

Skip List构造步骤：

1、给定一个有序的链表。

2、选择连表中最大和最小的元素，然后从其他元素中按照一定算法（随机）随即选出一些元素，将这些元素组成有序链表。这个新的链表称为一层，原链表称为其下一层。
3、为刚选出的每个元素添加一个指针域，这个指针指向下一层中值同自己相等的元素。Top指针指向该层首元素
4、重复2、3步，直到不再能选择出除最大最小元素以外的元素。

§3 Skip List 完整实现

下面来定义跳表的数据结构（基于C）

首先是每个节点的数据结构
C代码

typedef  struct nodeStructure

{



    int key;



    int value;



    struct nodeStructure *forward[1];

}nodeStructure;
跳表的结构如下
C代码

typedef  struct skiplist

{



    int level;



    nodeStructure *header;

}skiplist;
下面是跳表的基本操作

首先是节点的创建
C代码

nodeStructure* createNode(int level,int key,int value)

{



    nodeStructure *ns=(nodeStructure *)malloc(sizeof(nodeStructure)+level*sizeof(nodeStructure*));



    ns->key=key;



    ns->value=value;



    return ns;

}
列表的初始化

列表的初始化需要初始化头部，并使头部每层（根据事先定义的MAX_LEVEL）指向末尾（NULL）。
C代码

skiplist* createSkiplist()

{



    skiplist *sl=(skiplist *)malloc(sizeof(skiplist));



    sl->level=0;



    sl->header=createNode(MAX_LEVEL-1,0,0);



    for(int i=0;i<MAX_LEVEL;i++)



    {



        sl->header->forward[i]=NULL;



    }



    return sl;

}
插入元素

插入元素的时候元素所占有的层数完全是随机的，通过随机算法产生
C代码

int randomLevel()

{



    int k=1;



    while (rand()%2)



        k++;



    k=(k<MAX_LEVEL)?k:MAX_LEVEL;



    return k;

}
跳表的插入需要三个步骤，第一步需要查找到在每层待插入位置，然后需要随机产生一个层数，最后就是从高层至下插入，插入时算法和普通链表的插入完全相同。
C代码

bool insert(skiplist *sl,int key,int value)

{



    nodeStructure *update[MAX_LEVEL];



    nodeStructure *p, *q = NULL;



    p=sl->header;



    int k=sl->level;



    //从最高层往下查找需要插入的位置



    //填充update



    for(int i=k-1; i >= 0; i--){



        while((q=p->forward[i])&&(q->key<key))



        {



            p=q;



        }



        update[i]=p;



    }



    //不能插入相同的key



    if(q&&q->key==key)



    {



        return false;



    }







    //产生一个随机层数K



    //新建一个待插入节点q



    //一层一层插入



    k=randomLevel();



    //更新跳表的level



    if(k>(sl->level))



    {



        for(int i=sl->level; i < k; i++){



            update[i] = sl->header;



        }



        sl->level=k;



    }







    q=createNode(k,key,value);



    //逐层更新节点的指针，和普通列表插入一样



    for(int i=0;i<k;i++)



    {



        q->forward[i]=update[i]->forward[i];



        update[i]->forward[i]=q;



    }



    return true;

}
红色区域为辅助数组update的内容

删除节点

删除节点操作和插入差不多，找到每层需要删除的位置，删除时和操作普通链表完全一样。不过需要注意的是，如果该节点的level是最大的，则需要更新跳表的level。
C代码

bool deleteSL(skiplist *sl,int key)

{



    nodeStructure *update[MAX_LEVEL];



    nodeStructure *p,*q=NULL;



    p=sl->header;



    //从最高层开始搜



    int k=sl->level;



    for(int i=k-1; i >= 0; i--){



        while((q=p->forward[i])&&(q->key<key))



        {



            p=q;



        }



        update[i]=p;



    }



    if(q&&q->key==key)



    {



        //逐层删除，和普通列表删除一样



        for(int i=0; i<sl->level; i++){



            if(update[i]->forward[i]==q){



                update[i]->forward[i]=q->forward[i];



            }



        }



        free(q);



        //如果删除的是最大层的节点，那么需要重新维护跳表的



        for(int i=sl->level-1; i >= 0; i--){



            if(sl->header->forward[i]==NULL){



                sl->level--;



            }



        }



        return true;



    }



    else



        return false;

}
查找

跳表的优点就是查找比普通链表快，当然查找操作已经包含在在插入和删除过程，实现起来比较简单。

搜索key=14的示意图
C代码

int search(skiplist *sl,int key)

{



    nodeStructure *p,*q=NULL;



    p=sl->header;



    //从最高层开始搜



    int k=sl->level;



    for(int i=k-1; i >= 0; i--){



        while((q=p->forward[i])&&(q->key<=key))



        {



            if(q->key==key)



            {



                return q->value;



            }



            p=q;



        }



    }



    return NULL;

}
完整代码如下：
C代码

#include<stdio.h>

#include<stdlib.h>



#define MAX_LEVEL 10 //最大层数



//节点

typedef  struct nodeStructure

{

    int key;

    int value;

    struct nodeStructure *forward[1];

}nodeStructure;



//跳表

typedef  struct skiplist

{

    int level;

    nodeStructure *header;

}skiplist;



//创建节点

nodeStructure* createNode(int level,int key,int value)

{

    nodeStructure *ns=(nodeStructure *)malloc(sizeof(nodeStructure)+level*sizeof(nodeStructure*));

    ns->key=key;

    ns->value=value;

    return ns;

}



//初始化跳表

skiplist* createSkiplist()

{

    skiplist *sl=(skiplist *)malloc(sizeof(skiplist));

    sl->level=0;

    sl->header=createNode(MAX_LEVEL-1,0,0);

    for(int i=0;i<MAX_LEVEL;i++)

    {

        sl->header->forward[i]=NULL;

    }

    return sl;

}



//随机产生层数

int randomLevel()

{

    int k=1;

    while (rand()%2)

        k++;

    k=(k<MAX_LEVEL)?k:MAX_LEVEL;

    return k;

}



//插入节点

bool insert(skiplist *sl,int key,int value)

{

    nodeStructure *update[MAX_LEVEL];

    nodeStructure *p, *q = NULL;

    p=sl->header;

    int k=sl->level;

    //从最高层往下查找需要插入的位置

    //填充update

    for(int i=k-1; i >= 0; i--){

        while((q=p->forward[i])&&(q->key<key))

        {

            p=q;

        }

        update[i]=p;

    }

    //不能插入相同的key

    if(q&&q->key==key)

    {

        return false;

    }



    //产生一个随机层数K

    //新建一个待插入节点q

    //一层一层插入

    k=randomLevel();

    //更新跳表的level

    if(k>(sl->level))

    {

        for(int i=sl->level; i < k; i++){

            update[i] = sl->header;

        }

        sl->level=k;

    }



    q=createNode(k,key,value);

    //逐层更新节点的指针，和普通列表插入一样

    for(int i=0;i<k;i++)

    {

        q->forward[i]=update[i]->forward[i];

        update[i]->forward[i]=q;

    }

    return true;

}



//搜索指定key的value

int search(skiplist *sl,int key)

{

    nodeStructure *p,*q=NULL;

    p=sl->header;

    //从最高层开始搜

    int k=sl->level;

    for(int i=k-1; i >= 0; i--){

        while((q=p->forward[i])&&(q->key<=key))

        {

            if(q->key == key)

            {

                return q->value;

            }

            p=q;

        }

    }

    return NULL;

}



//删除指定的key

bool deleteSL(skiplist *sl,int key)

{

    nodeStructure *update[MAX_LEVEL];

    nodeStructure *p,*q=NULL;

    p=sl->header;

    //从最高层开始搜

    int k=sl->level;

    for(int i=k-1; i >= 0; i--){

        while((q=p->forward[i])&&(q->key<key))

        {

            p=q;

        }

        update[i]=p;

    }

    if(q&&q->key==key)

    {

        //逐层删除，和普通列表删除一样

        for(int i=0; i<sl->level; i++){

            if(update[i]->forward[i]==q){

                update[i]->forward[i]=q->forward[i];

            }

        }

        free(q);

        //如果删除的是最大层的节点，那么需要重新维护跳表的

        for(int i=sl->level - 1; i >= 0; i--){

            if(sl->header->forward[i]==NULL){

                sl->level--;

            }

        }

        return true;

    }

    else

        return false;

}



void printSL(skiplist *sl)

{

    //从最高层开始打印

    nodeStructure *p,*q=NULL;



    //从最高层开始搜

    int k=sl->level;

    for(int i=k-1; i >= 0; i--)

    {

        p=sl->header;

        while(q=p->forward[i])

        {

            printf("%d -> ",p->value);

            p=q;

        }

        printf(" ");

    }

    printf(" ");

}

int main()

{

    skiplist *sl=createSkiplist();

    for(int i=1;i<=19;i++)

    {

        insert(sl,i,i*2);

    }

    printSL(sl);

    //搜索

    int i=search(sl,4);

    printf("i=%d ",i);

    //删除

    bool b=deleteSL(sl,4);

    if(b)

        printf("删除成功 ");

    printSL(sl);

    system("pause");

    return 0;

}
§4 Skip List 概率分析

§5 小结

本篇博文已经详细讲解了Skip List数据结构的所有内容，应该可以有一个深入的了解。如果你有任何建议或者批评和补充，请留言指出，不胜感激，更多参考请移步互联网。

参考：

①Skip List: http://www.cs.auckland.ac.nz/software/AlgAnim/niemann/s_skl.htm

②Songeliu: http://www.spongeliu.com/63.html

③Shi Kai Lun ： http://yilee.info/skip-list.html

④Michael T. Goodrich Roberto Tamassia Algorithm Design Foundations, Analysis, and Internet Examples

⑤http://epaperpress.com/sortsearch/skl.html
查看全文

相关阅读:
Delegate、Predicate、Action和Func
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!
xgqfrms™, xgqfrms® : xgqfrms's offical website of GitHub!

原文地址：https://www.cnblogs.com/schips/p/11098198.html

Skip List（跳跃表）原理详解与实现

首先是每个节点的数据结构

跳表的结构如下

下面是跳表的基本操作

首先是节点的创建

列表的初始化

插入元素

删除节点

查找