zoukankan      html  css  js  c++  java
  • 详解主席树(可持久化线段树) Seaway

    详解主席树(可持久化线段树)

    本篇随笔详细解读一下算法竞赛中的一种数据结构:主席树。(可持久化线段树)

    前置知识当然是线段树,也应该有动态开点。

    如果没有掌握请移步:

    简单线段树详解

    权值线段树详解

    动态开点详解


    一、关于可持久化

    可持久化数据结构是一个家族,可持久化线段树只是其中的一部分。

    关于可持久化数据结构,它的作用是解决“历史版本”的问题。比如,现在的线段树已经经过了\(N\)次修改,但我就是想知道在\(M\)次修改之前的某一个数据是多少。

    这就需要可持久化数据结构。可持久化大家族有好多成员,比如可持久化并查集,可持久化树状数组等等...


    二、可持久化线段树

    那么我们回到刚刚的问题,求一个修改过很多次的线段树的历史版本。

    那么,暴力的想法是,每次修改之前,先新开一个线段树,把上个版本的数据复制过去,然后在新树上进行修改,那么,就保留了完整的很多个版本。

    你觉得可能么?

    我们来打个比方,现在,你抄写了一篇课文。但是里面有些许错字。你当然要去修改这些错字。但是你应该不会选择把整篇文章重抄一遍,因为并不是所有的字都是错的。所以聪明的你选择用涂改带等工具只修改了错字,而保留了大多数正确的字,所以你既节省了效率,又没有因写错字而挨骂。

    类比推理可得。

    现在,你有一棵线段树,你改了里面的一些东西。但是你应该不会选择把整个树重建一遍,因为有好多节点没有动,你选择把动过的节点新建一遍,其他的节点保留,也达到了建一棵新树的效果。

    懂了没有?没懂就看图。

    (图片摘自洛谷博客@hyfhaha)

    我们发现,所谓可持久化线段树,主席树,就是很多棵非常亲密的线段树(因为有共用节点)。对于一个修改,我们把这个修改影响到的所有节点都新建出来,从叶子节点一直到根。也就是我们只需要新建\(\log N\)个节点,比重构树效率高多了。

    经过观察研究,我们很容易发现,

    三、可持久化线段树的代码实现

    蒟蒻认为这是整个主席树的重点部分。原理很好理解,但是代码实现起来却并不是那么容易,至少细节很多。

    我们细细回顾一下主席树的整个过程,我们能够发现,主席树既然是亲密线段树,那么它的节点编号肯定不是普通线段树的那个样子。并且,节点编号我们是无法确定的,因为我们既不知道有多少个版本,也不知道每个版本需要新建多少个节点。所以的话,建树和每次的可持久化修改都需要动态开点,也就是每个节点需要用结构体维护。

    1、建树

    Code:

    struct persistent_segment_tree
    {
        int val,lson,rson;
    }tree[maxn<<2];
    //maxn应该是4N+M*log N
    int tot;
    void build(int &pos,int l,int r)
    {
        int mid=(l+r)>>1;
        if(!pos)
            pos=++tot;
        if(l==r)
        {
            tree[pos].val=a[l];
            return;
        }
        build(tree[pos].lson,l,mid);
        build(tree[pos].rson,mid+1,r);
        tree[pos].val=tree[tree[pos].lson].val+tree[tree[pos].rson].val;
    }
    

    因为每次修改只新建了从叶子到根节点的一条路径上的节点,所以每次修改所用的节点个数应该是\(\log N\)级别的,所以最大空间(最多节点数)就应该是\(4N+M\log N\)

    其中,val代表权值,lson/rson代表左右儿子。

    然后build函数应该很好理解。

    2、可持久化修改

    原理见上。现在我们需要选择两个策略:第一种是从下往上修改+新建节点,也就是先找到目标节点,然后向上一层层建新节点;第二种是从上往下修改+新建节点,也就是先建个根出来,然后一层层向下边找边建。

    比较容易可得,第一种方式是不行的,因为我们只存了一个节点的左右儿子信息而没有存父亲信息,所以从下往上新建就会”拔剑四顾心茫然“,啥也找不到。

    所以我们选择第二种方式,从根节点开始新建,并且开一个root数组来保存版本数,第i个版本的根节点就是root[i],这样的话就能很方便的去查找所有的版本。

    Code:

    int newnode(int pos)//这里和update函数的返回值都是当前节点在新版本中的新编号是多少
    {                                     
        tree[++tot]=tree[pos];
        return tot;
    }
    int update(int pos,int l,int r,int x,int k)//将第x个数+k
    {
        int mid=(l+r)>>1;
        pos=newnode(pos);//相当于复制节点,此时节点编号已经变成新节点了,但是维护的信息还没有变,需要后续修改
        if(l==r)
        {
            tree[pos].val+=k;
            return pos;
        }
        if(x<=mid)
            tree[pos].lson=update(tree[pos].lson,l,mid,x,k);
        else
            tree[pos].rson=update(tree[pos].rson,mid+1,r,x,k);
        return pos;
    }
    

    具体见注释。

    3、查询

    Code:

    int query(int pos,int l,int r,int x)//询问某版本的第x个数,其中初始调用参数为root[i](即表示第i版本)
    {
        int mid=(l+r)>>1;
        if(l==r)
            return tree[pos].val;
        if(x<=mid)
            return query(tree[pos].lson,l,mid,x);
        else
            return query(tree[pos].rson,mid+1,r,x); 
    }
    

    那么这道例题洛谷传送门的完整代码就是:

    #include<cstdio>
    using namespace std;
    const int maxn=1e6+10;
    int n,m;
    int a[maxn],root[maxn];
    struct persistent_segment_tree
    {
        int lson,rson,val;
    }tree[maxn*24];
    int tot,ver;
    void build(int &pos,int l,int r)
    {
        int mid=(l+r)>>1;
        if(!pos)
            pos=++tot;
        if(l==r)
        {
            tree[pos].val=a[l];
            return;
        }
        build(tree[pos].lson,l,mid);
        build(tree[pos].rson,mid+1,r);
        tree[pos].val=tree[tree[pos].lson].val+tree[tree[pos].rson].val;
    }
    int newnode(int pos)
    {
        tree[++tot]=tree[pos];
        return tot;
    }
    int update(int pos,int l,int r,int x,int k)
    {
        int mid=(l+r)>>1;
        pos=newnode(pos);
        if(l==r)
        {
            tree[pos].val=k;
            return pos;
        }
        if(x<=mid)
            tree[pos].lson=update(tree[pos].lson,l,mid,x,k);
        else
            tree[pos].rson=update(tree[pos].rson,mid+1,r,x,k);
        return pos;
    }
    int query(int pos,int l,int r,int x)
    {
        int mid=(l+r)>>1;
        if(l==r)
            return tree[pos].val;
        if(x<=mid)
            return query(tree[pos].lson,l,mid,x);
        else
            return query(tree[pos].rson,mid+1,r,x);
    }
    int main()
    {
        scanf("%d%d",&n,&m);
        for(int i=1;i<=n;i++)
            scanf("%d",&a[i]);
        build(root[0],1,n);
        while(m--)
        {
            int v,opt;
            int x,k;
            scanf("%d%d",&v,&opt);
            if(opt==1)
            {
                scanf("%d%d",&x,&k);
                root[++ver]=update(root[v],1,n,x,k);
            }
            else
            {
                scanf("%d",&x);
                root[++ver]=root[v];
                printf("%d\n",query(root[v],1,n,x));
            }
        }
        return 0;
    }
    
  • 相关阅读:
    farpoint [转]
    用于主题检测的临时日志(07ebc2e2418343fea17b52c9318e7705 3bfe001a32de4114a6b44005b770f6d7)
    将ColumnFooter显示出来,并对相关属性做适当设置。 SetAggregationType接口可以帮助你方便的完成求和需求。
    单元测试
    c#扩展方法
    String.Format格式说明
    vs 2005断点调试[转]
    EventLog 类【转】
    From Single PDF template Make a series PDF
    PDF template and print
  • 原文地址:https://www.cnblogs.com/fusiwei/p/13677956.html
Copyright © 2011-2022 走看看