zoukankan      html  css  js  c++  java
  • [数据结构]权值线段树与可持久化线段树(主席树)

    参考1

    3.8____可持续化线段树(主席树)

    3.8.1____权值线段树

    权值线段树之所以带上"权值"二字,是因为它是记录权值的线段树。所以在某些题中,需要离散化处理输出数据。记录权值指的是,每个点上存的是区间内的数字出现的总次数。比如一个长度为10的数组[1,1,2,3,3,4,4,4,4,5]。
    image1

    ​ 1出现了两次所以节点[1,1]的权值为2

    ​ 2出现了一次所以节点[2,2]的取值为1

    ​ 因为1,2共出现三次所以节点[1,2]的权值为3

    ​ 因为这个测试数据比较少,没有对数据进行离散化,所有会有权值为0的节点出现

    应用求第K大(或小)数

    ​ 我们向树中插入4个数 $ [1,2,5,7]$ ,得到的权值线段树如下
    image2

    ​ 现在我们从根节点开始,向下去找第3(K)小的数(rt为当前节点的数组编号)

    我们的判断准则为: 我们求的是区间 [1,7]的第3小数,首先我们要去看这个节点的左子树的取值为多少,如果K <= t[rt<<1].权值,那么我们的问题就缩小为了,找左儿子所在的区间内的第K小数;反之如果 K > t[rt<<1].权值,那么说明[1,7]的第K小数在他的右子树上,那么问题就变为了,找右儿子所在区间内的第K-t[rt<<1].权值小的数。

    ​ 运用这个原理,第一层我们就把问题缩小为,求[5,7]区间第1小数,然后进第二层问题缩小为求[5,6]区间的第1小数,进入第三层我们就能找到我们的答案了,为5,这就是权值线段树求第K小(大)数的原理。

    ​ 下面我们来看一道板子题

    B-简易版第k大_2019长沙学院暑假集训队第二次校赛

    #include <bits/stdc++.h>
    using namespace std;
    
    const int N = 1e6 + 10;
    
    struct node
    {
        int l,r;
        int cnt;
    }t[N<<2];
    
    int a[N];
    
    void build(int rt,int l ,int r)
    {
        t[rt].l = l,t[rt].r = r;
        if(l == r){
            t[rt].cnt = 0;
            return ;
        }
        int mid = l + r >>1;
        build(rt <<1,l,mid),build(rt<<1|1,mid+1,r);
    }
    
    void update(int rt,int loc,int val)
    {
    
        if( t[rt].l == t[rt].r ){
            t[rt].cnt += val;
            return ;
        }
        int mid = t[rt].l + t[rt].r >> 1;
        if( loc <= mid ) update(rt<<1,loc,val);
        else update(rt<<1|1,loc,val);
        t[rt].cnt = t[rt<<1].cnt + t[rt<<1|1].cnt;
    }
    
    int query(int rt,int k)	///query里的逻辑是关键点
    {
        if(t[rt].l == t[rt].r){
            return t[rt].l;
        }
        int mid = t[rt].l + t[rt].r >> 1;
        if( k <= t[rt<<1].cnt ) return query(rt<<1,k);
        else return query(rt<<1|1,k - t[rt<<1].cnt);
    }
    
    int main()
    {
        ios::sync_with_stdio(false);
        cin.tie(0);
        cout.tie(0);
    
        int n,m;
        cin >>n >> m;
        build(1,1,1000002);
    
        for(int i = 1; i <= n ; i++){
            cin >> a[i];
            update(1,a[i],1);
        }
    
        for(int i = 0; i < m ; i++){
            int op,x,y;
            cin >> op;
            if(op == 1){
                cin >>x;
                cout << query(1,x) <<endl;
            }
            else{
                cin >>x>> y;
                if( a[x] == y ) continue;
                update(1,a[x],-1);
                update(1,y,1);
                a[x] = y;
            }
        }
    
        return 0;
    }
    

    3.8.2____主席树(可持续化线段树)

    ​ 在知道了权值线段树是什么,那么我们就可以开始认识什么是主席树了。主席树是一棵可持久化线段树,可持久化指的是它保存了这棵树的所有历史版本

    ​ 最简单的办法是:如果你输入了n个数,那么每输入一个数字a[i],就构造一棵保存了从a[1]到a[i]的权值线段树。之所以这么做,是因为我们可以把第j棵树和第(i-1)棵树上的每个点的权值相减,来得到一颗新的权值线段树,而这个新的树相当于是除去a[i]之前的数,将第一个输入的数变为a[i+1],最后一个输入的数为a[i]的权值线段树了,那么求区间K小值,就变成上面权值线段树的内容了。

    ​ 如果这么说不太好理解的话,我们可以思考另外一个模型:求数组a[1]到a[n]的和。如果只是求[1,n]这一段的和,那么我们直接全部加起来就可以了,或者求一个前缀和sum[n]即可。那么如果我给定了l和r,想要知道[l,r]这段区间上的和呢?是不是利用前缀和sum[r]-sum[l-1]就可以轻松得到?那么主席树的思想也是如此,将tree[r]-tree[l-1]得到的一棵权值线段树即为属于[l,r]的一棵权值线段树,那么在这么一棵权值线段树上求第k大不是就转变为之前的问题了么。

    Hoppz%E7%AE%97%E6%B3%95%E7%AC%94%E8%AE%B0%2011e225234f9f4382825a35d69f9cb19f/20190511130727560.png

    ​ 还有一个问题需要解决,那就是空间问题


    ​ 显而易见的是,如果每输入一个数就重新构造一棵权值线段树,必然会导致空间不够用:一棵线段树的空间就是n * 4,那么一共的空间开销就是n * n * 4,显然是会MLE的。那么这个问题怎么解决呢?

    ​ 可以发现每更新一个点,就会从它开始把它的所有祖先都更新一次,而其他的点都没有被改变,即:每次改变的结点只有(log_n)。这样,我们每次输入一个数,只需要多开logn个空间,那么实际的空间开销只有(n*(4+log_n)),满足了空间要求。

    板子题255. 第K小数 - AcWing题库

    #include <bits/stdc++.h>
    using namespace std;
    
    const int N  =100005;
    /// len为离散化之后数组的长度,a为原始数组,d为离散化之后的数组
    int n,m,len,a[N],d[N];
    /// T为[1,i]区间的权值线段树的根节点下标,idx为当前存到那个下标了
    int T[N],idx;
    
    struct node
    {
        int l,r,val;
        /// 主席树的l,r与线段树不同,l存的是左儿子的节点下标,r存的是...
    }t[4*N + N*17];
    
    int build(int l,int r)
    {
        int p = ++idx , mid = l + r >> 1;
        if(l < r){
            t[p].l = build(l,mid);
            t[p].r = build(mid+1,r);
        }
        t[p].val = 0;
        return p;
    }
    /// 添加一个数,pre为上颗树的根节点,T[0]为build的空树,T[1]为加入一个节点时的树
    /// 每次都只添加一条路径(其余的连上上一颗树的节点),因为一次只增加一个点
    int update(int pre,int l ,int r,int val)
    {
        int p = ++idx,mid = l + r >>1;
        /// 链接上颗树
        t[p].l = t[pre].l , t[p].r = t[pre].r , t[p].val = t[pre].val + 1;
        if(l < r){  /// 只更新修改的那条路径,并新建点
            if( val <= mid ) t[p].l = update(t[pre].l , l ,mid ,val);
            else t[p].r = update(t[pre].r,mid+1,r,val);
        }
        return p;
    }
    
    int query(int x,int y,int l,int r,int k)
    {
        if(l == r)  return l;   ///权值线段树的特点
        /// 对位相减,得到[l,r]区间的权值线段树的对应节点值
        int sum = t[ t[y].l ].val - t[ t[x].l ].val, mid = l + r >> 1;
        /// 下面的和权值线段树相同
        if( k <= sum )  return query( t[x].l,t[y].l,l,mid,k );
        else return query( t[x].r,t[y].r,mid + 1,r ,k - sum );
    }
    
    
    int main()
    {
        ios::sync_with_stdio(false);
        cin.tie(0);
        cout.tie(0);
        cin >> n >> m;
        for(int i = 1; i <= n ; i++){
            cin >> a[i];
            d[i] = a[i];
        }
        sort(d+1,d+n+1);
        len = unique(d+1,d+1+n) - (d+1);    ///地址相减
        for(int i = 1; i <= n ; i++){
            a[i] = lower_bound(d+1,d+1+len,a[i]) - d;   ///离散化映射
        }
    
        ///建树
        T[0] = build(1,len);
        for(int i = 1; i <= n ; i++)    T[i] = update(T[i-1],1,len,a[i]);
    
        while(m--){
            int l,r,k;
            cin >> l >> r >>k;
            int ans = query(T[l-1],T[r],1,len,k);
            cout << d[ans] <<endl;
        }
    
        return 0;
    }
    
  • 相关阅读:
    Antd表格跨行
    Echarts使用记录
    PAT甲级刷题实录——1010
    PAT甲级刷题实录——1009(写文章时又想到了改进方法)
    PAT甲级刷题实录——1008
    PAT甲级刷题实录——1007
    PAT甲级刷题实录——1006
    PAT甲级刷题实录——1005
    PAT甲级刷题实录——1004
    PAT甲级刷题实录——1003
  • 原文地址:https://www.cnblogs.com/hoppz/p/14860416.html
Copyright © 2011-2022 走看看