zoukankan      html  css  js  c++  java
  • 斜率优化(转载)

    BZOJ 1010 玩具装箱Toy

    题目描述 Description
    P教授要去看奥运,但是他舍不下他的玩具,于是他决定把所有的玩具运到北京。他使用自己的压缩器进行压缩,其可以将任意物品变成一堆,再放到一种特殊的一维容器中。P教授有编号为1…N的N件玩具,第i件玩具经过压缩后变成一维长度为Ci.为了方便整理,P教授要求在一个一维容器中的玩具编号是连续的。同时如果一个一维容器中有多个玩具,那么两件玩具之间要加入一个单位长度的填充物,形式地说如果将第i件玩具到第j个玩具放到一个容器中,那么容器的长度将为 x=j-i+Sigma(Ck) i<=K<=j 制作容器的费用与容器的长度有关,根据教授研究,如果容器长度为x,其制作费用为(X-L)^2.其中L是一个常量。P教授不关心容器的数目,他可以制作出任意长度的容器,甚至超过L。但他希望费用最小.

    输入描述 Input Description
    第一行输入两个整数N,L.接下来N行输入Ci

    输出描述 Output Description
    输出最小费用

    样例输入 Sample Input
    5 4
    3
    2
    1
    4

    样例输出 Sample Output
    1

    数据范围及提示 Data Size & Hint
    1<=N<=50000,1<=L,Ci<=10^7

    分析:

    状态转移方程:(显然)

     
    dp[i]=min(dp[j]+(sum[i]sum[j]+ij1L)2)dp[i]=min(dp[j]+(sum[i]−sum[j]+i−j−1−L)2)


    sumsum为前缀和
    然后我们令f[i]=sum[i]+i,c=1+Lf[i]=sum[i]+i,c=1+L
    原式可以化简为:

     
    dp[i]=min(dp[j]+(f[i]f[j]c)2)dp[i]=min(dp[j]+(f[i]−f[j]−c)2)


    注意,这里的f,cf,c都是可以预处理出来的

    1.证明决策单调性

    假设在当前由jj状态转移优于kk状态(显然kk是之前枚举的决策),即:

     
    dp[j]+(f[i]f[j]c)2dp[k]+(f[i]f[j]c)2dp[j]+(f[i]−f[j]−c)2≤dp[k]+(f[i]−f[j]−c)2


    那么对于ii后面的一个状态tt,要保证kk对其无贡献(已经被jj覆盖)
    则需要证明:

     
    dp[j]+(f[t]f[j]c)2dp[k]+(f[t]f[k]c)2dp[j]+(f[t]−f[j]−c)2≤dp[k]+(f[t]−f[k]−c)2


    由于f[i]=sum[i]+if[i]=sum[i]+i,所以一定为单调递增的(sumsum和ii均为单调递增)
    所以令v=f[t]f[i]v=f[t]−f[i]
    原式可化为:

     
    dp[j]+(f[i]+vf[j]c)2dp[k]+(f[i]+vf[k]c)2dp[j]+(f[i]+v−f[j]−c)2≤dp[k]+(f[i]+v−f[k]−c)2


    变形↓尽量拆出已有的式子

     
    dp[j]+(f[i]f[j]c)2+2v(f[i]f[j]c)+4v2dp[k]+(f[i]f[k]c)2+2v(f[i]f[k]c)+4v2dp[j]+(f[i]−f[j]−c)2+2v∗(f[i]−f[j]−c)+4v2≤dp[k]+(f[i]−f[k]−c)2+2v∗(f[i]−f[k]−c)+4v2


    移项,消除相同项

     
    f[i]f[j]cf[i]f[k]cf[i]−f[j]−c≤f[i]−f[k]−c


     
    f[j]f[k]f[j]≥f[k]


    由单调递增性,只需要枚举状态时以11~i1i−1的顺序即可保证f[j]f[k]f[j]≥f[k],得证

    2.求斜率方程

    当前决策ii,若由jj状态转移优于kk状态,则有:

     
    dp[j]+(f[i]f[j]c)2dp[k]+(f[i]f[j]c)2dp[j]+(f[i]−f[j]−c)2≤dp[k]+(f[i]−f[j]−c)2


    展开,变形,得:

     
    dp[j]+f[i]22f[i](f[j]+c)+(f[j]+c)2dp[k]+f[i]22f[i](f[k]+c)+(f[k]+c)2dp[j]+f[i]2−2f[i]∗(f[j]+c)+(f[j]+c)2≤dp[k]+f[i]2−2f[i]∗(f[k]+c)+(f[k]+c)2


    移项,消除相同项,尽量将变量按j,kj,k凑在一起,得:

     
    (dp[j]+(f[j]+c)2)(dp[k]+(f[k]+c)2)2(f[j]f[k])f[i](dp[j]+(f[j]+c)2)−(dp[k]+(f[k]+c)2)2∗(f[j]−f[k])≤f[i]


    左边部分就像斜率一样,可以看做:

     
    YjYkXjXkYj−YkXj−Xk


    我们以Slope(x,y)Slope(x,y)来表示上面那个类似于斜率的东西(其实就是斜率好么)
    若满足这个Slope(k,j)f[i]Slope(k,j)≤f[i],则说明jj比kk优

    3.组织算法

    那么对于当前较优的状态我们建立一个队列qq
    维护这个队列我们有以下操作:

    1. Slope(q[l],q[l+1])f[i]Slope(q[l],q[l+1])≤f[i],则q[l]q[l]没有q[l+1]q[l+1]优,则删除q[l]q[l]
    2. Slope(q[r1],q[r])Slope(q[r],i)Slope(q[r−1],q[r])≥Slope(q[r],i),则删除q[r]q[r]

    分析:

    方程成立时是jj比kk优的充分必要条件,那么假设我们现在有一个序列,那么队头就是当前最优的,若到了某个ii值使得对于队首p[l]p[l]和队次首p[l+1]p[l+1]来说Slope(q[l],q[l+1])f[i]Slope(q[l],q[l+1])≤f[i]成立,则q[l+1]q[l+1]比q[l]q[l]优,所以弹出队首,直到不成立为止

    第一条操作是显然的,那么第二条呢?
    一个状态要不要放在序列里,是由它能不能做出贡献决定的,也就是说,它能不能成为队首决定的
    假设我们现在有Slope(q[a],q[a+1])Slope(q[a+1],q[a+2])Slope(q[a],q[a+1])≥Slope(q[a+1],q[a+2]),那么,q[a+1]q[a+1]点想要成为队首就只能当前面的点都弹出了,并且Slope(q[a],q[a+1])f[i]Slope(q[a],q[a+1])≤f[i],q[a+1]q[a+1]比q[a]q[a]优所以也将q[a]q[a]弹出时,才能成为队首。但是在这时,由于f[i]Slope(q[a],q[a+1])Slope(q[a+1],q[a+2])f[i]≥Slope(q[a],q[a+1])≥Slope(q[a+1],q[a+2]),那么q[a+2]q[a+2]也应该比q[a+1]q[a+1]优,所以将q[a+1]q[a+1]弹出,意思就是,无论怎样,q[a+1]q[a+1]都不可能做出贡献
    类比一下,我们只操作队尾时,若其斜率Slope(q[r1],q[r])Slope(q[r],i)Slope(q[r−1],q[r])≥Slope(q[r],i),直接弹出q[r]q[r]即可
    那么,在我们的这个操作以后,能够保证斜率单调递增,也就是维护一个上凸包,这就是斜率优化啦!

    自认为非常的详细啦,有问题可以在下面留言喽!

    Code:

     1 #include <bits/stdc++.h>
     2 using namespace std;
     3 #define ll long long
     4 ll n,L;
     5 ll f[50005];
     6 ll dp[50005];
     7 ll q[50005];
     8 ll head,tail; 
     9 ll read() {
    10     ll ans=0,flag=1;
    11     char ch=getchar();
    12     while((ch<'0'||ch>'9') && ch!='-') ch=getchar();
    13     if(ch=='-') flag=-1,ch=getchar();
    14     while(ch>='0' && ch<='9') ans=ans*10+ch-'0',ch=getchar();
    15     return ans*flag;
    16 }
    17 double slope(ll k,ll j) {return (double) (dp[j]-dp[k]+(f[j]+L)*(f[j]+L)-(f[k]+L)*(f[k]+L))/(2.0*(f[j]-f[k]));}
    18 int main() {
    19     n=read(),L=read();
    20     L++;
    21     for(int i=1;i<=n;i++) {
    22         ll a=read();
    23         f[i]=f[i-1]+a+1;
    24     }
    25     for(int i=1;i<=n;i++) {
    26         while(head<tail && slope(q[head],q[head+1])<=f[i]) head++;
    27         int t=q[head];
    28         dp[i]=dp[t]+(f[i]-f[t]-L)*(f[i]-f[t]-L);
    29         while(head<tail && slope(q[tail],i)<slope(q[tail-1],q[tail])) tail--;
    30         q[++tail]=i;
    31     } 
    32     printf("%lld",dp[n]);
    33 }

    --------------------- 本文来自 Chlience 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/force_chl/article/details/79096609?utm_source=copy 

    总结:

    斜率优化步骤:

    先打表(推导)得出决策单调性的性质,然后列出当前j比k优的式子:dp[j]+(f[i]f[j]c)2dp[k]+(f[i]f[j]c)2

    然后移项变换尽量得到左边为j,k表示的斜率,右边为1定值:(dp[j]+(f[j]+c)2)(dp[k]+(f[k]+c)2)2(f[j]f[k])f[i]

    若满足这个Slope(k,j)f[i]Slope(k,j)≤f[i],则说明jj比kk优

    最后单调队列:

    • Slope(q[l],q[l+1])f[i]Slope(q[l],q[l+1])≤f[i],则q[l]q[l]没有q[l+1]q[l+1]优,则删除q[l]q[l]
    • Slope(q[r1],q[r])Slope(q[r],i)Slope(q[r−1],q[r])≥Slope(q[r],i),则删除q[r]

    10.9更新:

    这里有一篇更好的斜率优化....

     https://blog.csdn.net/Clove_unique/article/details/55684519(良心博客)
    其实考场上自己模拟推一遍比较合适,这里给出单增的通式:
    斜率越大的编号是靠后的,单增性,所以k1<k3,变个号就行了
  • 相关阅读:
    uva 11078
    hdu1520(树状dp)
    从Markov Process到Markov Decision Process
    剑指Offer系列编程题详解全集
    L1正则和L2正则的区别详解
    协方差详解
    牛顿法和梯度下降法的比较
    C++ const各种用法总结
    Exploration and Exploitation
    RL Algorithm Components
  • 原文地址:https://www.cnblogs.com/degage/p/9753535.html
Copyright © 2011-2022 走看看