zoukankan      html  css  js  c++  java
  • 可旋转Treap(树堆)总结

    树堆,在数据结构中也称Treap,是指有一个随机附加域满足堆的性质的二叉搜索树,其结构相当于以随机数据插入的二叉搜索树。其基本操作的期望时间复杂度为O(logn)。相对于其他的平衡二叉搜索树,Treap的特点是实现简单,且能基本实现随机平衡的结构。

    在深入了解Treap之前,我们先来了解一下BST。


    BST(Binary-search tree),即二分搜索树,是一棵二叉树,且满足性质:若每个节点都有一个key值,则对于每个根节点,均满足key[leftson]<key[root]<key[rightson]。换句话说,即满足树的先序遍历等于树的中序遍历。如下图即为一颗BST:

    其特点可以帮助我们快速查找树中的某些元素。举个例子,如果我们要查找2元素,那么先与6比较,比6小,那么进入6的左子树,再与5进行比较,比5小,进入5的左子树,我们就成功地找到了2。这比我们暴力查找要快得多。但是缺点也很显著。比如说,如果输入数据满足单调递增性质,那么我们在建树时便会将其建成一条链,从而导致其算法的复杂度退化。当然,特定情况下,我们可以借助random—shuffle函数将数据打乱,但是一般情况下,BST便有着很大的局限性。因此我们需要一种更高级的数据结构来克服这种局限性,便是我们的Treap。

    Treap=Tree+heap,顾名思义,Treap便是一种树与堆的结合体。总的来说,就是在维护BST性质的同时,给与每个节点一个随机的random值,同时保证random值满足小根堆的性质。这样,便可以轻而易举的防止复杂度的退化。

    在了解了Treap的原理之后,我们便可以尝试用代码来实现其功能。下面以洛谷-P3369普通平衡树为例,一道典型并且操作齐全的模版题,其主要要求我们完成6个操作:

    1. 插入x数

    2. 删除x数(若有多个相同的数,因只删除一个)

    3. 查询x数的排名(排名定义为比当前数小的数的个数+1。若有多个相同的数,因输出最小的排名)

    4. 查询排名为x的数

    5. 求x的前驱(前驱定义为小于x,且最大的数)

    6. 求x的后继(后继定义为大于x,且最小的数)

    首先便是随机值的实现。由于<stdlib>中的rand()函数速度较慢且局限性较大,在数据结构中不太适用,所以在这里建议rand函数的功能用手写来实现。

    随机函数:

    int rand()  
    {
    int seed=12345; return seed=(int)seed*482711LL%2147483647; }

    稍微优化后可以变为这样(虽然没什么用):

    inline int rand()
    {
    static int seed=12345; return seed=(int)seed*482711LL%2147483647; }

    然后还需要一个函数来更新每个节点的信息,也是十分的浅显易懂:

    void update(int p)
    {
        size[p]=size[l[p]]+size[r[p]]+ct[p];
    }

    在我们维护Treap的过程中,子树大小的维护也时时刻刻都是有必要的,在每个函数中都应该有体现,具体维护方式如下:

    对于旋转,我们要在旋转后对子节点和根节点分别重新计算其子树的大小。 

    对于插入,在寻找插入的位置时,每经过一个节点,都要先使以它为根的子树的大小增加 1,再递归进入子树查找。 

    对于删除,在寻找待删除节点,递归返回时要把所有的经过的节点的子树的大小减少 1。要注意的是,删除之前一定要保证待删除节点存在于 Treap 中。

    维护子树的大小也是Treap的一个关键部分。

    那么现在便来到了最关键也是Treap中最核心的一步:如何维护堆的性质,即如何在Treap中插入元素(ins)。

    对于Treap中的每个元素,为保证我们堆的性质,插入操作便分为了两种操作:左旋(lturn),右旋(rturn)。下面重点讲解这两种操作。

     下面画了一个图以便理解:

    以上图为例,我们可以看到,从左到右便是右旋的过程,使得根节点由u变为了x。由于a仍比x小,所以x的左子树仍为a,u比x大,所以为x的右子树,但对于b,大于x小于u,所以应在x的右子树,u的左子树,同理,c应在u的右子树,旋转完毕。这便是右旋的过程。

    理解了右旋的过程之后,我们也可以较为轻松的写出右旋的代码,为了方便,加了个小小的传引用:

    void rturn(int &k)
    {
        int t=l[k];//记录左儿子
        l[k]=r[t];
        r[t]=k;//旋转的过程
        size[t]=size[k];//size的转换
        update(k);//更新k
        k=t;
    }

    左旋转的过程就是上图从右到作的过程,代码实现也同理:

    void lturn(int &k)
    {
        int t=r[k];//记录右儿子
        r[k]=l[t];
        l[t]=k;//旋转
        size[t]=size[k];///size转换
        update(k);//更新k
        k=t;
    }

    了解这两种操作后,插入元素就变得得心应手了,先把要插入的点插入到一个叶子上,然后跟维护堆一样,如果当前节点的优先级比根大就旋转,如果当前节点是根的左儿子就右旋,如果当前节点是根的右儿子就左旋。

    依然举两个例子来帮助理解:

    如图所示,我们需要把D和F元素插入到Treap中,对于D,先将其放在一个叶子节点,然后与其父亲相比较发现比父亲小却在父亲的右子树上,所以我们需要对D进行右旋操作,同理,F元素经过一次次的比较,一次次的旋转,最终也可以到达如图所示的位置。

    至此,我们已经基本解决了对于Treap的插入操作。

    代码如下:

    void ins(int &p,int x)
    {
        if (p==0)
        {
            p=++sz;
            size[p]=ct[p]=1,v[p]=x,rnd[p]=rand();
            return;
        }
        size[p]++;
        if (v[p]==x) ct[p]++;
        else if (x>v[p])
        {
            ins(r[p],x);
            if (rnd[r[p]]<rnd[p]) lturn(p);
        }
        else
        {
            ins(l[p],x);
            if (rnd[l[p]]<rnd[p]) rturn(p);
        }
    }

    接下来是删除操作(del),删除操作算是Treap中最难理解的操作了吧(主要因为代码长╮(╯▽╰)╭)。本可以通过两种方式来达成删除操作,但对于初学者来讲,这里推荐并主要讲解其中一种方式。

    注意到Treap的性质,即必须满足堆的性质,所以对于Treap,我们也可以用删除堆的方式,借助旋转操作,加以解决。

    如果该节点的左子节点的key小于右子节点的key,右旋该节点,使该节点降为右子树的根节点,然后访问右子树的根节点,递归地操作下去;反之同理。实质上即为让key小的节点有限旋到上面,保证堆的性质,进而进行删除操作。

    删除操作比较难以理解,希望通过代码可以加深对其的认识。

    代码实现:

    void del(int &p,int x)
    {
        if (p==0) return;
        if (v[p]==x)
        {
            if (ct[p]>1) ct[p]--,size[p]--;
            else
            {
                if (l[p]==0||r[p]==0) p=l[p]+r[p];
                else if (rnd[l[p]]<rnd[r[p]]) rturn(p),del(p,x);
                else lturn(p),del(p,x); 
            }
        }
        else if (x>v[p]) size[p]--,del(r[p],x);
        else size[p]--,del(l[p],x);
    }

    解决完删除操作后,查找(query)操作便显得较为简单,按照一般树上问题解决方式统计即可,这里不多赘述,其中query1代表查询x数的排名,query2代表查询排名为x的数。

    代码实现:

    int query1(int p,int x)
    {
        if (p==0) return 0;
        if (v[p]==x) return size[l[p]]+1;
        if (x>v[p]) return size[l[p]]+ct[p]+query1(r[p],x);
        else return query1(l[p],x);
    }
    int query2(int p,int x)
     {
        if (p==0) return 0;
         if (x<=size[l[p]]) return query2(l[p],x);
         x-=size[l[p]];
         if (x<=ct[p]) return v[p];
         x-=ct[p];
          return query2(r[p],x);
     }

    最后,我们来处理一下前驱与后继的问题。前驱定义为小于x,且最大的数,后继定义为大于x,且最小的数,也较为简单,过程中维护一下max和min即可轻易地解决。

    该部分代码:

    int findfront(int p,int x)
    {
        if (p==0) return -inf;
        if (v[p]<x) return max(v[p],findfront(r[p],x));
        else if (v[p]>=x) return findfront(l[p],x);
    }
    int findback(int p,int x)
    {
        if (p==0) return inf;
        if (v[p]<=x) return findback(r[p],x);
        else return min(v[p],findback(l[p],x));
    }

    至此,Treap中的所有操作都已经解决。将这些操作拼接串联起来,便构成了Treap的基本框架,完整模版如下(以普通平衡树为例):

    #include <stdio.h>
    #include <algorithm>
    #include <stdlib.h>
    using namespace std;
    #define inf 300000030
    int l[100100],r[100100],v[100100],size[100100],rnd[100100],ct[100100];
    int sz;
    void update(int p)
    {
        size[p]=size[l[p]]+size[r[p]]+ct[p];
    }
    void lturn(int &k)
    {
        int t=r[k];
        r[k]=l[t];
        l[t]=k;
        size[t]=size[k];
        update(k);
        k=t;
    }
    void rturn(int &k)
    {
        int t=l[k];
        l[k]=r[t];
        r[t]=k;
        size[t]=size[k];
        update(k);
        k=t;
    }
    void ins(int &p,int x)
    {
        if (p==0)
        {
            p=++sz;
            size[p]=ct[p]=1,v[p]=x,rnd[p]=rand();
            return;
        }
        size[p]++;
        if (v[p]==x) ct[p]++;
        else if (x>v[p])
        {
            ins(r[p],x);
            if (rnd[r[p]]<rnd[p]) lturn(p);
        }
        else
        {
            ins(l[p],x);
            if (rnd[l[p]]<rnd[p]) rturn(p);
        }
    }
    void del(int &p,int x)
    {
        if (p==0) return;
        if (v[p]==x)
        {
            if (ct[p]>1) ct[p]--,size[p]--;
            else
            {
                if (l[p]==0||r[p]==0) p=l[p]+r[p];
                else if (rnd[l[p]]<rnd[r[p]]) rturn(p),del(p,x);
                else lturn(p),del(p,x); 
            }
        }
        else if (x>v[p]) size[p]--,del(r[p],x);
        else size[p]--,del(l[p],x);
    }
    int query1(int p,int x)
    {
        if (p==0) return 0;
        if (v[p]==x) return size[l[p]]+1;
        if (x>v[p]) return size[l[p]]+ct[p]+query1(r[p],x);
        else return query1(l[p],x);
    }
    int query2(int p,int x)
     {
        if (p==0) return 0;
         if (x<=size[l[p]]) return query2(l[p],x);
         x-=size[l[p]];
         if (x<=ct[p]) return v[p];
         x-=ct[p];
          return query2(r[p],x);
     }
     int findfront(int p,int x)
    {
        if (p==0) return -inf;
        if (v[p]<x) return max(v[p],findfront(r[p],x));
        else if (v[p]>=x) return findfront(l[p],x);
    }
    int findback(int p,int x)
    {
        if (p==0) return inf;
        if (v[p]<=x) return findback(r[p],x);
        else return min(v[p],findback(l[p],x));
    }
    int ss;
    int main()
    {
        int n;
        scanf("%d",&n);
        for(int i=1;i<=n;i++)
        {
            int flag,x;
            scanf("%d%d",&flag,&x);
            if (flag==1) ins(ss,x);
            if (flag==2) del(ss,x);
            if (flag==3) printf("%d\n",query1(ss,x));
            if (flag==4) printf("%d\n",query2(ss,x)); 
            if (flag==5) printf("%d\n",findfront(ss,x));
            if (flag==6) printf("%d\n",findback(ss,x));
        }
    }
     
  • 相关阅读:
    Redis学习
    MySQL索引
    细数 Java 线程池的原理
    红黑树学习
    HashMap学习
    Java集合框架
    Java性能优化的45个细节
    MyBatis理解
    jenkins+git+maven+tomcat+jdk本地部署windows版
    windows版docker安装nginx,并设置目录挂载
  • 原文地址:https://www.cnblogs.com/kanbokedeshiwoerzi/p/8798219.html
Copyright © 2011-2022 走看看