【学习笔记】动态规划—斜率优化DP（超详细）

zoukankan html css js c++ java

【学习笔记】动态规划—斜率优化DP（超详细）
【学习笔记】动态规划—斜率优化DP（超详细）

(update 2020.6.19:) 临近退役，终于来修锅啦QAQ（更正基础概念上的错误；( ext{Latex}) 规范化；重新排版；增加标题号；添加【关于单调性的研究】；添加 ( ext{CDQ}) 维护斜率优化的例子）

【学习笔记】动态规划—各种 ( ext{DP}) 优化

【前言】

第一次写这么长的文章。

写完后对斜优的理解又加深了不少（(update 2020.6.19:) 回过头来看这句话满是讽刺啊，明明这时候连基本的概念都没有理清....）。

本文讲解较详，只要耐心读下去，相信大部分 ( ext{OIer}) 都能看懂。

斜率优化 ( ext{dp})，顾名思义就是利用斜率相关性质对 ( ext{dp}) 进行优化。

斜率优化通常可以由两种方式来理解，需要灵活地运用数学上的数形结合,线性规划思想。

对于这样形式的 ( ext{dp}) 方程：(dp[i]=Min/Max(a[i]∗b[j]+c[j]+d[i]))，其中 (b) 严格单调递增。

该方程的关键点在于 (a[i]*b[j]) 这一项，它既有 (i) 又有 (j)，于是单调队列优化不再适用，可以尝试使用斜率优化。

一.【理解方式】

以 【模板】 玩具装箱 ( ext{toy [P3195]}) 为例，两种斜优的理解方式。

设 (S[n]=sum_{i=1}^n(C[i]+1))，用 (dp[i]) 表示装好前 (i) 个的最小花费，则转移方程为：(dp[i]=min(dp[j]+(S[i]−S[j]-1-L)^2))。

为方便描述，将 ( ext{L}) 提前加 (1)，再把 (min) 去掉，得到状态转移方程：(dp[i]=dp[j]+(S[i]−S[j]-L)^2)。

化简得：(dp[i]=S[i]^2-2S[i]L+dp[j]+(S[j]+L)^2-2S[i]S[j])

1.【代数法（数形结合）】

只含 ( ext{L}) 的项对于每一个 (i) 的择优筛选过程都是完全一样的值，只含 (Function(i)) 的项在一次 (i) 的择优筛选过程中不变，含 (Function(j)) 的项可能会不断变化（在本题中表现为为严格单增）。
我们以此为划分依据，把同类型的项用括号括起来，即：(dp[i]=(-2S[i]S[j])+(dp[j]+(S[j]+L)^2)+(S[i]^2-2S[i]L))

(1).【维护一个凸包】

设 (j_1,j_2) ((0 leqslant j_1<j_2<i)) 为 (i) 的两个决策点，且满足决策点 (j_2) 优于 (j_1)，
有：((-2S[i]S[j_2])+(dp[j_2]+(S[j_2]+L)^2)+(S[i]^2-2S[i]L) leqslant (-2S[i]S[j_1])+(dp[j_1]+(S[j_1]+L)^2)+(S[i]^2-2S[i]L))

即：((-2S[i]S[j_2])+(dp[j_2]+(S[j_2]+L)^2) leqslant (-2S[i]S[j_1])+(dp[j_1]+(S[j_1]+L)^2))

划重点：此处移项需要遵循的原则是：参变分离。将 (Function(i)) 视作未知量，用 (Function(j)) 来表示出 (Function(i)) 。

移项得：(-2S[i](S[j_2]-S[j_1]) leqslant (dp[j_1]+(S[j_1]+L)^2)-(dp[j_2]+(S[j_2]+L)^2))
(ecause C[j] geqslant 1)
( herefore S[j+1] > S[j])
(又 ecause j_2 > j_1)
( herefore S[j_2]-S[j_1]>0)
( herefore 2S[i] geqslant frac {(dp[j_2]+(S[j_2]+L)^2)-(dp[j_1]+(S[j_1]+L)^2)} {S[j_2]-S[j_1]})
设 (Y(j)=dp[j]+(S[j]+L)^2,X(j)=S[j])，
即 (2S[i] geqslant frac {Y(j_2)-Y(j_1)} {X(j_2)-X(j_1)})

显然等式右边是一个关于点 (P(j_2)) 和 (P(j_1)) 的斜率式，其中 (P(j)=(X(j),Y(j))=(S[j],dp[j]+(S[j]+L)^2))。

也就是说，如果存在两个决策点 (j_1,j_2) 满足 ((0 leqslant j_1<j_2<i))，使得不等式 (frac {Y(j_2)-Y(j_1)} {X(j_2)-X(j_1)} leqslant 2S[i]) 成立，或者说使得 (P(j_2),P(j_1)) 两点所形成直线的斜率小于等于 (2S[i])，那么决策点 (j_2) 优于 (j_1)。

划重点：斜优灵活多变，细节麻烦也多，所以尽量将问题模式化。
比如这里的最终公式，尽量化为 (frac {(j)-(j')} {(j)-(j')}) 的形式，而不是 (frac {(j)-(j')} {(j')-(j)}) ，虽然直接做一般也不会出什么问题，但这样子可以方便理解，方便判断凸包方向等等。

假设有酱紫的三个点 (P(j_1),P(j_2),P(j_3))，(k_1,k_2) 为斜率，如下图所示情况（三点分别为 (A,B,C)）：

显然有 (k_2 < k_1)。设 (k_0=2S[i])，由上述结论可知：

((a).) 若 (k_1 leqslant k_0)，则 (j_2) 优于 (j_1) 。反之，若 (k_1 > k_0)，则 (j_1) 优于 (j_2) 。
((b).) 若 (k_2 leqslant k_0)，则 (j_3) 优于 (j_2) 。反之，若 (k_2 > k_0)，则 (j_2) 优于 (j_3) 。

于是这里可以分三种情况来讨论：

((1).) (k_0 < k_2 < k_1)。由 ((a),(b)) 可知：(j_1) 优于 (j_2) 优于 (j_3) 。
((2).) (k_2 leqslant k_0 < k_1)。由 ((a),(b)) 可知：(j_1) 和 (j_3) 均优于 (j_2)。
((3).) (k_2 < k_1 leqslant k_0)。由 ((a),(b)) 可知：(j_3) 优于 (j_2) 优于 (j_1) 。

可以发现，对于这三种情况，(j_2) 始终不是最优解，于是我们可以将 (j_2) 从候选决策点中踢出去（删除），只留下 (j_1) 和 (j_3)，删后的情况如下图所示：

我们要对某一个问题的解决方案进行优化改进，无非就是关注两个要点：正确性和高效性（很多时候高效性都体现为单调性）。

酱紫做的正确性是毋庸置疑的，因为在 (j_1) 和 (j_3) 其中必定有一个比 (j_2) 更优，所以删除 (j_2) 对答案没有任何影响。

那么高效性呢？自己在脑子里面 (yy) 一下，在一个坐标系的第一象限中（本题中 (X(j)) 和 (Y(j))均大于等于 (0)，至于为什么这里要说等于，下面会提到），有若干个离散的点，任取三点，如果左边斜率大于右边斜率，则形成了上述情况，必定会删点，因而消除这种情况。所以将最后留下来的点首位相连，其形成的各个线段斜率从左到右必定是单调递增的（有可能非严格递增，这个问题之后再讨论）。

如果学习过计算几何相关知识，会意识到这个过程其实与求凸包算法是类似的。（顺手丢一个广告：【学习笔记】计算几何全家桶）

实际上在图中选取最靠左下面、下面、右下面的点首位相连，就是最后留下来的点了，它们形成了一个下凸包，即凸包（又名凸壳）的下半部分（不严谨的讲，给定二维平面上的点集，凸包就是将最外层的点连接起来构成的凸多边形，它能包含点集中所有的点——摘自百度百科）。

维护出的图形如下图所示：

可以尝试在凸包围起来的区域内任意取一点，其必定能在包围圈上找到两个点使得该点可被删除。如上 ( ext{L}) 点，它与 (D,E) 两点形成了一个可删点图形。

注意：图中 (C,D,E) 故意画成了三点一线，而实际上点 (D) 是可以删去的，且严格凸包不允许存在这种情况。关于去重的细节问题后面会提到。

同理，如果把不等式 (frac {Y(j_2)-Y(j_1)} {X(j_2)-X(j_1)} leqslant k_0[i]) 改为 (frac {Y(j_2)-Y(j_1)} {X(j_2)-X(j_1)} geqslant k_0[i])，那么维护出来的就是一个上凸包。

(2).【寻找最优决策点】

在一次决策点的寻找中，易知下凸包点集里总会存在一点，使得它与左邻点形成的斜率小于等于 (k_0) ，与右邻点形成的斜率大于 (k_0) 。

例如上图中的 (E) 点，设 (k_4 leqslant k_0 < k_5) 由于凸包上面的斜率呈单增态，那么有：(k_1 < k_2 < k_3 < k_4 leqslant k_0 < k_5 < k_6 < k_7)，所以决策点 (E) 优于其他所有点，即 (E) 就是 (dp[i]) 的最优决策点。

如果暴力查找的话，就是从第一个点开始向后扫描，找到第一个斜率大于 (k_0) 的线段，其左端点即为最优决策点。由于凸包上的斜率依次递增，可以二分快速得到这个点。

2.【线性规划】

先回顾一下模板题的 ( ext{dp}) 方程：(dp[i]=S[i]^2-2S[i]L+dp[j]+(S[j]+L)^2-2S[i]S[j])。

对其进行移项变化，变成形如 (y=kx+b) 的点斜式。
划重点：移项要遵循的原则是：把含有 (function(i)*function(j)) 的表达式看作斜率 (k_0) 乘以未知数 (x)，含有 (dp[i]) 的项必须要在 (b) 的表达式中，含有 (function(j)) 的项必须在 (y) 的表达式中。如果未知数 (x) 的表达式单调递减，最好让等式两边同乘个 (-1)，使其变为单增。

至于为什么说要让 (x) 的表达式单增，emm...其实是为了让一些较简单的问题模式化，不易出错，如果你非要单减，可以尝试倒序枚举，至于是否正确，具体实现需要注意的玄学问题等等，因为觉得太麻烦没有细想，我也不清楚会遇到什么问题。

例如此题，原 ( ext{dp}) 方程可化为：
((2S[i])S[j]+(dp[i]-S[i]^2+2S[i]L)=(dp[j]+(S[j]+L)^2))

其中 (k_i=2S[i],) (x_i=S[j],) (b_i=dp[i]-S[i]^2+2S[i]L,) (y_i=dp[j]+(S[j]+L)^2)。

其实也可以化为：
((2S[i])(S[j]+L)+(dp[i]-S[i]^2)=(dp[j]+(S[j]+L)^2))
其中 (k_i=2S[i],) (x_i=S[j]+L,) (b_i=dp[i]-S[i]^2,) (y_i=dp[j]+(S[j]+L)^2)。

还可以化为 (...)

(...)

只要满足上述移项原则，对答案是没有任何影响的。

这里以第一种形式为例，先画出草图：

(1).【高中数学知识】

我们的目的是求出一个最优决策点 (j) 使得 (dp[i]) 最小，又因为 (b[i]=dp[i]-S[i]^2) ，所以就是要找到某个点使这条直线经过它时算出来的 (b) 最小，即是高中数学课本上的线性规划问题。

(2).【寻找最优决策点】

如图所示，点 (E) 即为最优决策点。显然，这个使得 (b) 最小的最优决策点位于下凸包点集中，且与上述代数法求得的点一致。

3.【两种思考方式的结合】

强烈推荐用线性规划思想主导思考过程，因为图形的变幻较直观，更重要的是：在某某变量不满足单调性时，通过图形可以迅速做出判断并改变策略（在后面【关于单调性的研究】中会详细解释）。

而代数法通常在不便于识别方程特征时起一个转换思维方向的作用，因为有些题可能会直接出现 (frac{Y(j)-Y(j')}{X(j)-X(j')}) 的形式，需要通过一系列代数推导后再绘草图模拟决策。

二.【维护凸包】

实际上只要让维护的凸包方向相同，两种思考方式的代码是一模一样的。

用单调队列维护凸包点集，操作分三步走：
((1).) 进行择优筛选时，在凸包上找到最优决策点 (j) 。
((2).) 用最优决策点 (j) 更新 (dp[i]) 。
((3).) 将 (i) 作为一个决策点加入图形并更新凸包（如果点 (i) 也是 (dp[i]) 的决策点之一，则需要将 ((3)) 换到最前面）。

在本题中步骤 ((3)) 的具体操作为：判断当队尾的点与点 (i) 形成可删点图形时，出队直至无法再删点，然后将 (i) 加入队列。

在判断可删图形时有两种方法（以下凸包为例），一种是 slope(Q[t-1],Q[t])<=slope(Q[t],i)，另一种是 slope(Q[t-1],Q[t])<=slope(Q[t-1],i)，都表示出现了可以删去点 (Q[t]) 的情况（只要对边界、去重的处理足够严谨，两种写法是没有区别的）。其中 (Q) 是维护凸包点集的队列。

该做法时间复杂度为 (O(nlog n))，瓶颈在于二分寻找最优决策点。

三.【再优化】

运用决策单调性进行优化。决策单调性相关基础知识见 【学习笔记】动态规划—各种 ( ext{DP}) 优化，这里只放一下定义：
设 (j_0[i]) 表示 (dp[i]) 转移的最优决策点，那么决策单调性可描述为 (forall ileqslant i',j_0[i]leqslant j_0[i'])。也就是说随着 (i) 的增大，所找到的最优决策点是递增态（非严格递增）。

(1).【决策单调性证明】

还是以玩具装箱为例，来简单证一波决策单调性，方法采用四边形不等式。

显然，本题的转移方程呈现出了 (dp[i]=min(dp[j]+w(i,j))) 的形式，即 (1D/1D) 动态规划方程，其中 (w(i,j)=(S[i]−S[j]-1-L)^2)。

(证明：设) (Q=S[i]−S[j]-1-L)

( herefore w(i,j)=(S[i]−S[j]-1-L)^2=Q^2)

(egin{aligned} herefore w(i+1,j+1)=&(S[i+1]−S[j+1]-1-L)^2\ =&((S[i]+C[i+1]+1)−(S[j]+C[j+1]+1)-1-L)^2\ =&(Q+C[i+1]-C[j+1])^2 end{aligned})

(egin{aligned} w(i,j+1)=&(S[i]−S[j+1]-1-L)^2\ =&(S[i]−(S[j]+C[j+1]+1)-1-L)^2\ =&(Q-C[j+1]-1)^2 end{aligned})

(egin{aligned} w(i+1,j)=&(S[i+1]−S[j]-1-L)^2\ =&((S[i]+C[i+1]+1)−S[j]-1-L)^2\ =&(Q+C[i+1]+1)^2 end{aligned})

( herefore w(i,j)+w(i+1,j+1)=2Q^2+2C[i+1]Q-2C[j+1]Q+C[i+1]^2-2C[i+1]C[j+1]+C[j+1]^2)

( herefore w(i+1,j)+w(i,j+1)=2Q^2+2C[i+1]Q-2C[j+1]Q+C[i+1]^2+2C[i+1]+2C[j+1]+C[j+1]^2+2)

( herefore w(i,j)+w(i+1,j+1)-w(i+1,j)+w(i,j+1)=-2(C[i+1]+1)(C[j+1]+1))

(又 ecause C[i],C[j] geqslant 1)

( herefore -2(C[i+1]+1)(C[j+1]+1) leqslant -8)

( herefore w(i,j)+w(i+1,j+1) leqslant w(i+1,j)+w(i,j+1))

四边形不等式成立，所以此方程具有决策单调性。
证毕。

(2).【单调队列】

由于最优决策点递增，可以用单调队列对其进行维护。操作 ((2),(3)) 不需要改动，操作 ((1)) 改为：判断当队首的第一根线段斜率小于等于 (k_0[i]) 时就出队，直至斜率大于 (k_0[i])，此时的队首即为最优决策点。

正确性显然。因为随着 (i) 的变大，最优决策点 (j_0[i]) 也会跟着变大，如果已知某个点在当前情况下不够侑秀，那么在这之后也一定不会作为最优决策点，所以可以直接出队。

时间复杂度为 (O(n)) 。

(3).【再证决策单调性】

一样的，两种思路。

先观察 (k_0[i]) 的表达式：(k_0[i]=2S[i]) ，明显在本题中 (k_0) 呈单增态。

【代数法】

(k_0[i]) 递增就说明我们找到的第一个斜率大于 (k_0[i]) 的线段在不断地向后移，也就是说，如果我们找到了某一个最优决策点 (j)，那么在下一次决策中，最优决策点 (j') 必定在 (j) 的后面。

决策单调性得证。

【线性规划】

画出草图：

直线 (Line_i) 的斜率 (k_0[i]) 递增，

由图可知最优决策点在递增。

决策单调性得证。

【其他】

从这个角度来看的话，貌似决策单调性和 (X(j),k_0[i]) 的单调性是相通的？

于是一个结论就出现了：如果 (X(j),k_0[i]) 均单调不减，则该方程必定有决策单调性（自己瞎 (yy) 的，不敢肯定一定正确）。

四.【Code】

【模板】 玩具装箱 (toy) ([P3195])

这道题 (...) 数据太水了 (...) 我一开始 ( ext{L}) 忘了加 (1) 居然还过了 (...)
```
#include<cstring>
#include<cstdio>
#define LL long long
#define Re register LL
const int N=5e4+5;
LL i,j,n,L,h=1,t=0,Q[N],S[N],dp[N];
//S[n]=∑C[i]+1, dp[i]=min(dp[j]+(S[i]-(S[j]+L+1))^2)，++L 
//dp[i]=S[i]^2-2*S[i]*L+dp[j]+(S[j]+L)^2-2S[i]*S[j]
//(2*S[i]) * S[j] + (dp[i]-S[i]^2+2S[i]L)=(dp[j]+(S[j]+L)^2)
//   k     *  x   +           b          =        y
inline LL min(Re a,Re b){return a<b?a:b;}
inline LL X(Re j){return S[j];}
inline LL Y(Re j){return dp[j]+(S[j]+L)*(S[j]+L);}
inline long double slope(Re i,Re j){return (long double)(Y(j)-Y(i))/(X(j)-X(i));}//记得开long double 
int main(){
    scanf("%lld%lld",&n,&L);++L; 
    for(i=1;i<=n;S[i]+=S[i-1]+1,++i)scanf("%lld",&S[i]);
    Q[++t]=0;//重中之重 
    for(i=1;i<=n;++i){
        while(h<t&&slope(Q[h],Q[h+1])<=2*S[i])++h;//至少要有两个元素 h<t。出队判断时尽量加上等号 
        dp[i]=dp[j=Q[h]]+(S[i]-S[j]-L)*(S[i]-S[j]-L);
        while(h<t&&slope(Q[t-1],Q[t])>=slope(Q[t-1],i))--t;//至少要有两个元素 h<t。入队判断时尽量加上等号 
        Q[++t]=i;
    }
    printf("%lld",dp[n]);
}
```
五.【各种玄学问题】

(ノ°ο°)ノ前方高能预警 (＊°ω°＊)ノ"非战斗人员请撤离!! ＊・_・)ノ

((1).) 写出 ( ext{dp}) 方程后，要先判断能不能使用斜优，即是否存在 (function(i)*function(j)) 的项或者 (frac{Y(j)-Y(j')}{X(j)-X(j')}) 的形式。

((2).) 通过大小于符号或者 (b) 中 (dp[i]) 的符号结合题目要求 ((min/max)) 判断是上凸包还是下凸包，不要见一个方程就直接盲猜一个下凸。

((3).) 当 (X(j)) 非严格递增时，在求斜率时可能会出现 (X(j_1)=X(j_2)) 的情况，此时最好是写成这样的形式：return Y(j)>=Y(i)?inf:-inf，而不要直接返回 (inf) 或者 (-inf)，在某些题中情况较复杂，如果不小心画错了图，返回了一个错误的极值就完了，而且这种错误只用简单数据还很难查出来。

((4).) 注意比较 (k_0[i]) 和 (slope(j_1,j_2)) 要写规范，要用右边的点减去左边的点进行计算（结合 ((3)) 来看，可防止返回错误的极值），如果用的代数法理解，写出了 (X(j2)-X(j1))*k0<=Y(j2)-Y(j1) 或 (X(j2)-X(j1))*k0<=Y(j2)-Y(j1)，而恰巧 (j_1,j_2) 又写反了，便会出现等式两边同除了负数却没变号的情况。当然用 (k_0) 和 (frac {Y(j_2)-Y(j_1)}{X(j_2)-X(j_1)}) 进行比较是没有这种问题的。

((5).) 队列初始化大多都要塞入一个点 (P(0))，比如玩具装箱 ( ext{toy})，需要塞入 (P(S[0],dp[0]+(S[0]+L)^2)) 即 (P(0,0))，其代表的决策点为 (j=0)。

((6).) 手写队列的初始化是 h=1,t=0，由于塞了初始点导致 (t) 加 (1)，所以在一些题解中可以看到 h=t=1 甚至是 h=t=0，h=t=2 之类的写法，其实是因为省去了塞初始点的代码。它们都是等价的。

((7).) 手写队列判断不为空的条件是 h<=t，而出入队判断都需要有至少 (2) 两个元素才能进行操作。所以应是 h<t 。

((8).) 计算斜率可能会因为向下取整而出现误差，所以 (slope) 函数最好设为 (long) (double) 类型。

((9).) 有可能会有一部分的 ( ext{dp}) 初始值无法转移过来，需要手动提前弄一下，例如摆渡车 ( ext{[P5017]})。

((10).) 在比较两个斜率时，尽量写上等于，即 <= 和 >= 而不是 < 和 >。这样写对于去重有奇效（有重点时会导致斜率分母出锅），但不要以为这样就可以完全去重，因为要考虑的情况可能会非常复杂，所以还是推荐加上 ((3)) 中提到的特判，确保万无一失。

六.【关于单调性的研究】

划重点：注意是否具有单调性，不要盲目地使用单调队列进行维护。

(1).【X(j) 单增与单减】

将方程变为 (frac {Y(j_2)-Y(j_1)} {X(j_2)-X(j_1)} leqslant k_0[i]) 或者 (frac {Y(j_2)-Y(j_1)} {X(j_2)-X(j_1)} geqslant k_0[i]) 或者 (kx+b=y) 的形式，变化要遵循之前提到的原则，尤其是 (X(j)) 的单调性，结合图形会更好理解（目的是将单减的形式变为单增，方便维护）。

(2).【决策点横坐标 X(j) 不单调】

注意：(X(j)) 的单调性会影响凸包维护方式的选择。

如果决策点横坐标 (X(j)) 不存在单调性该怎么办（既不单增也不单减）？
（假设此时 (k_0[i]) 仍然单调）

此时维护凸包就不能用单调队列了，因为插入点时可能会插到凸包点集中间的某个位置，而队列是不支持这种操作的，需要用到平衡树维护或者用 ( ext{CDQ}) 分治提供单调性（后面会讲到）。
这里有计算几何基础的话会更易理解，因为上面维护图形时的删点操作与水平序 ( ext{Graham}) 扫描法求凸包是类似的，而扫描法的前提为：点集呈水平序，即点从左至右依次排列（体现为 (X(j)) 单调不减）。

(3).【待决策点斜率 K0[i] 不单调】

注意：(k_0[i]) 的单调性会影响寻找最优决策点方式的选择。

如果斜率 (k_0[i]) 不存在单调性该怎么办？
（假设此时 (X(j)) 仍然单调）

我们仍可以用队列维护凸包点集，但不知道每一次会在什么地方取得最优决策点，所以必须要保留整个凸包以确保决策有完整的选择空间，也就是说不能弹走队首，同时查找答案也不能直接取队首，只能使用二分。
- 【模板】 任务安排 (3)（可以证明该题不具有决策单调性）
(4).【X(j) 与 K0[i] 均不单调】

现在来看 (k_0[i]) 与 (X(j)) 均不单调的情况：

此时无法再用队列维护凸包了，但平衡树本就支持查询前驱、后继，直接把 (k_0[i]) 丢进去询问即可。

而 ( ext{CDQ}) 就更有意思了：在 ((2)) 中做法的基础上恰好还能再加一维偏序！
我们直接人为地排出单调性，像普通单调队列那样维护就可以了（代码放后面）。
- 【模板】 ( ext{Building Bridges})
七.【例题】

1.【预处理DP 初始值】
- 摆渡车 ( ext{[P5017]})
去年 (noip) 普及组的题（雾）。

【Code】
```
#include<cstdio>
#define Re register int
const int N=4e6+105;
int i,j,n,m,h=1,t=0,T,ti,ans=2e9,G[N],S[N],Q[N],dp[N];
inline int min(Re a,Re b){return a<b?a:b;}
//                 i
//dp[i]=min(dp[j]+ ∑(i-T[k]))
//                 k=j+1
//dp[i]=dp[j]+(G[i]-G[j])*i-(S[i]-S[j])
//(i) * G[j] + (dp[i]+S[j]-i*G[i]) = (dp[j]+S[j])
// k  *  x   +          b          =      y
inline int X(Re j){return G[j];}
inline int Y(Re j){return dp[j]+S[j];}
inline long double slope(Re i,Re j){return X(i)==X(j)?(Y(j)>Y(i)?2e9:-2e9):(long double)(Y(j)-Y(i))/(long double)(X(j)-X(i));}
int main(){
    scanf("%d%d",&n,&m);
    for(i=1;i<=n;T=-min(-T,-ti),++G[ti],S[ti]+=ti,++i)scanf("%d",&ti);
    for(i=1;i<T+m;++i)G[i]+=G[i-1],S[i]+=S[i-1];
    for(i=0;i<m;++i)dp[i]=G[i]*i-S[i];//提前处理dp初始值 
    Q[++t]=0;
    for(i=m;i<T+m;++i){
        while(h<t&&slope(Q[h],Q[h+1])<=i)++h;
        dp[i]=dp[j=Q[h]]+(G[i]-G[j])*i-S[i]+S[j];
           while(h<t&&slope(Q[t-1],Q[t])>=slope(Q[t-1],i-m+1))--t;
        Q[++t]=i-m+1;//(j+1)+m<=i
    }
    for(i=T;i<T+m;++i)ans=min(ans,dp[i]);
    printf("%d",ans);
}
```
2.【单调队列+二分】
【题目描述】

有 (N) 个任务等待完成（顺序不得改变），这 (N) 个任务被分成若干批，每批包含相邻的若干任务。从时刻 (0) 开始，这些任务被分批加工，第 (i) 个任务单独完成所需的时间是 (T_i) 。只有一台机器，在每批任务开始前，机器需要启动时间 (S)，完成这批任务所需的时间是各个任务需要时间的总和（同一批任务将在同一时刻完成）。每个任务的费用是它的完成时刻乘以它的费用系数 (F_i)。请确定一个分组方案，使得总费用最小。

【数据范围】

(T1:) (1 leqslant N leqslant 5000, 0 leqslant S leqslant 50,1 leqslant T_i, F_i leqslant 100)

(T2:) (1 leqslant N leqslant 10000, 0 leqslant S leqslant 50,1 leqslant T_i, F_i leqslant 100)

(T3:) (1 leqslant N leqslant 300000, 1 leqslant Sleqslant 512,0 leqslant F_i leqslant 512,|T_i| leqslant 512)

(1).【T1】

设 (ST[i]=sum_{j=1}^i T[j],SF[i]=sum_{j=1}^i F[j])

( ext{dp}) 方程很简单：(dp[p][i]=min(dp[p-1][j]+(ST[i]+p imes S)(SF[i]-SF[j])))，但是 (O(n^3)) 的时间复杂度连 (T1) 都过不了。

由于不知道每一次分段之前已经分了多少，所以需要用一维空间和一层循环来表示这个信息，从而知道 (S) 需要乘以多少。

那么可以反过来，用一种名为费用提前计算的经典思想来进行优化（据说这个叫未来 ( ext{dp})），每分出一批任务，那么对于这之后的每一个任务都需要多出一个 (S) 的时间，所以可以直接计算 (S) 对后面的影响。
即：(dp[i]=min(dp[j]+ST[i](SF[i]-SF[j])+S(SF[n]-SF[j])))
压成了 (O(n^2)) 后，(T1) 就可以 ( ext{AC}) 了，但它还能继续优化。

(2).【T2】

先转化为斜率式看看？
((S+ST[i]) * SF[j] + (dp[i]-ST[i]*SF[i]-S imes SF[i]) = (dp[j]))
其中 (k=S+ST[i],) (x=SF[j],) (b=dp[i]-ST[i] imes SF[i]-S imes SF[i],) (y=dp[j]) 。

决策点要使得 (dp[i]) 尽量小，且 (S+ST[i]) 和 (SF[j]) 都严格单增，所以直接用单调队列维护一个下凸包即可。

时间复杂度为 (O(n)) 。

【Code】
```
#include<cstring>
#include<cstdio>
#define LL long long
#define Re register LL
const int N=1e4+5;
LL i,j,n,h=1,t=0,S,Q[N],ST[N],SF[N],dp[N];
//dp[p][i]=min(dp[p-1][j]+(ST[i]+S*p)*(SF[i]-SF[j]));
//dp[i]=dp[j]+ST[i]*(SF[i]-SF[j])+S*(SF[n]-SF[j]);
//(S+ST[i]) * SF[j] + (dp[i]-ST[i]*SF[i]-S*SF[i]) = (dp[j])
//    k     *   x   +              b              = y
inline LL min(Re a,Re b){return a<b?a:b;}
inline LL X(Re j){return SF[j];}
inline LL Y(Re j){return dp[j];}
inline long double slope(Re i,Re j){return (long double)(Y(j)-Y(i))/(X(j)-X(i));}
int main(){
    scanf("%lld%lld",&n,&S);
    for(i=1;i<=n;ST[i]+=ST[i-1],SF[i]+=SF[i-1],++i)scanf("%lld%lld",&ST[i],&SF[i]);
    Q[++t]=0;
    for(i=1;i<=n;++i){
        while(h<t&&slope(Q[h],Q[h+1])<(S+ST[i]))++h;
        dp[i]=dp[j=Q[h]]+ST[i]*(SF[i]-SF[j])+S*(SF[n]-SF[j]);
        while(h<t&&slope(Q[t-1],Q[t])>slope(Q[t-1],i))--t;
        Q[++t]=i;
    }
    printf("%lld",dp[n]);
}
```
(3).【T3】

因 (F_i) 可等于 (0)，(X(j)) (() 即 (SF[i])) 非严格递增，所以需要特判 (X(j_1)=X(j_2)) 的情况（但仍具有单调性，可以使用队列维护凸包）。

因 (T_i) 可小于 (0)，(k_0[i]() 即 (S+ST[i])) 无单调性，所以不具有决策单调性，可以用四边形不等式进行证明：

该 ( ext{dp}) 方程显然为 (dp[i]=dp[j]+w(i,j)) 的形式，其中 (w(i,j)=ST[i](SF[i]-SF[j])+S(SF[n]-SF[j])) 。

( ext{证明：}) ( ext{设}) (Q=S(SF[n]-SF[j]))

( herefore w(i,j)=ST[i](SF[i]-SF[j])+Q)

(egin{aligned} herefore w(i+1,j+1)=&ST[i+1]SF[i+1]-ST[i+1]SF[j+1]+S(SF[n]-SF[j+1])\ =&ST[i+1]SF[i+1]-SF[j+1]*(ST[i]+T[i+1])+Q-S imes F[j+1]\ end{aligned})

(egin{aligned} w(i,j+1)=&ST[i](SF[i]-SF[j+1])+Q-S imes F[j+1]\ =&ST[i]SF[i]-ST[i]SF[j+1]+Q-S imes F[j+1]\ end{aligned})

(egin{aligned} w(i+1,j)=&ST[i+1](SF[i+1]-SF[j])+Q\ =&ST[i+1]SF[i+1]-ST[i+1]SF[j]+Q\ =&ST[i+1]SF[i+1]-ST[i]SF[j]-T[i+1]SF[j]+Q end{aligned})

( herefore w(i,j)+w(i+1,j+1)=ST[i](SF[i]-SF[j])+ST[i+1]SF[i+1]-SF[j+1](ST[i]+T[i+1])+2Q-S imes F[j+1])

( herefore w(i+1,j)+w(i,j+1)=ST[i]SF[i]-ST[i]SF[j+1]+ST[i+1]SF[i+1]-ST[i]SF[j]-T[i+1]SF[j]+2Q-S imes F[j+1])

( herefore w(i,j)+w(i+1,j+1)-w(i+1,j)+w(i,j+1)=-F[j+1]*T[i+1])
( ext{又} ecause 0 leqslant F_i leqslant 512,-512 leqslant T_i leqslant 512)

( herefore ext{当} T_i leqslant 0 时,w(i,j)+w(i+1,j+1) geqslant w(i+1,j)+w(i,j+1))

( ext{当} T_i geqslant 0 ext{时},w(i,j)+w(i+1,j+1) leqslant w(i+1,j)+w(i,j+1))

四边形不等式不一定成立，所以此题不具有决策单调性。
证毕。

此时需要在队列中二分查找最优决策点。

时间复杂度为 (O(nlog n)) 。

【Code】
```
#include<cstring>
#include<cstdio>
#define LL long long
#define Re register LL
const int N=3e5+5;
LL i,j,n,h=1,t=0,S,Q[N],ST[N],SF[N],dp[N];
//dp[p][i]=min(dp[p-1][j]+(ST[i]+S*p)*(SF[i]-SF[j]));
//dp[i]=dp[j]+ST[i]*(SF[i]-SF[j])+S*(SF[n]-SF[j]);
//(S+ST[i]) * SF[j] + (dp[i]-ST[i]*SF[i]-S*SF[i]) = (dp[j])
//    k     *   x   +              b              = y
//ti可小于0，所以ST[i]非递增，只可二分
//fi可等于0，所以SF[i](X)非严格递增，因此需要特判X(i)==X(j)的情况
inline LL min(Re a,Re b){return a<b?a:b;}
inline LL X(Re j){return SF[j];}
inline LL Y(Re j){return dp[j];}
inline long double slope(Re i,Re j){return X(j)==X(i)?(Y(j)>=Y(i)?1e18:-1e18):(long double)(Y(j)-Y(i))/(X(j)-X(i));
}//由于需要二分查找，多了一些限制：队列里不能有在同一位置的点,返回inf还是-inf都影响着是否删除重点，平时不可不管，二分必须注意返回值
inline LL sakura(Re k){
    if(h==t)return Q[h];
    Re l=h,r=t;
    while(l<r){
        Re mid=l+r>>1,i=Q[mid],j=Q[mid+1];
        if(slope(i,j)<k)l=mid+1;
//      if( (Y(j) - Y(i)) < k * (X(j) - X(i)) )l=mid+1;//注意是(j)-(i)因为Q[mid+1]>Q[mid]s即j>i即SF[j]>SF[i]即X(j)>X(i)，如果是(i)-(j)的话乘过去要变号
        else r=mid;
    }
    return Q[l];
}
int main(){
    scanf("%lld%lld",&n,&S);
    for(i=1;i<=n;ST[i]+=ST[i-1],SF[i]+=SF[i-1],++i)scanf("%lld%lld",&ST[i],&SF[i]);
    Q[++t]=0;
    for(i=1;i<=n;++i){
        j=sakura(S+ST[i]);
        dp[i]=dp[j]+ST[i]*(SF[i]-SF[j])+S*(SF[n]-SF[j]);
        while(h<t&&slope(Q[t-1],Q[t])>=slope(Q[t-1],i))--t;//此处取等号作用出现，如果不取等，会WA第12个点
        Q[++t]=i;
    }
    printf("%lld",dp[n]);
}
```
3.【CDQ/平衡树】

因为暂时没找到 (X(j)) 不单调、(k_0[i]) 单调的例题，这里直接讲两者均不单调的情况。
- ( ext{Building Bridges [CEOI2017] [P4655]})
如果学习了动态凸包算法，会发现这其实就是套了个板子上去（平衡树代码较毒瘤就不放了）。

( ext{CDQ}) 做法也比较显然，但因为递归过程不好描述，直接看代码注释吧。

时间复杂度为 (O(nlog n))。

【Code】
```
#include<algorithm>
#include<cstring>
#include<cstdio>
#define LD long double
#define LL long long
#define Re register int
#define S2(a) (1ll*(a)*(a))
using namespace std;
const LL N=1e5+3,inf=1e18;
int n,H[N],W[N],Q[N];LL S[N],dp[N];
inline void in(Re &x){
    int f=0;x=0;char c=getchar();
    while(c<'0'||c>'9')f|=c=='-',c=getchar();
    while(c>='0'&&c<='9')x=(x<<1)+(x<<3)+(c^48),c=getchar();
    x=f?-x:x;
}
//dp[i]=min(dp[i],dp[j]+(H[i]-H[j])*(H[i]-H[j])+S[i-1]-S[j]);
//dp[i]=dp[j]-2*H[i]*H[j]+H[j]*H[j]+H[i]*H[i]+S[i-1]-S[j]
//(2*H[i]) * H[j] + (dp[i]-S[i-1]-H[i]*H[i]) = (dp[j]+H[j]*H[j]-S[j])
//   k     *  x   +            b             =          y
#define X(j) (a[j].x)
#define Y(j) (a[j].y)
struct QAQ{
    int k,x,id;LL y;
    inline bool operator<(const QAQ &O)const{return x!=O.x?x<O.x:y<O.y;}
}a[N],b[N];
inline bool cmp(QAQ A,QAQ B){return A.k<B.k;}
inline LD slope(Re i,Re j){return X(i)==X(j)?(Y(j)>Y(i)?inf:-inf):(LD)(Y(j)-Y(i))/(X(j)-X(i));}
inline void CDQ(Re L,Re R){
    if(L==R){Re j=a[L].id;a[L].y=dp[j]+(LL)H[j]*H[j]-S[j];return;}//此时dp[j]必定已经求出来了，直接算计Y(j)即可
    Re mid=L+R>>1,p1=L,p2=mid+1,h=1,t=0;
    for(Re i=L;i<=R;++i)a[i].id<=mid?b[p1++]=a[i]:b[p2++]=a[i];//按照i的大小分到左右两边（两边的k0[i]分别递增）
    for(Re i=L;i<=R;++i)a[i]=b[i];
    CDQ(L,mid);//处理完左边后，左边的X(j)是递增的，此时右边还没处理，所以右边k0[i]是递增的
    for(Re i=L;i<=mid;++i){//把左边的点拿出来维护凸包（使用单调队列）
        while(h<t&&slope(Q[t-1],Q[t])>=slope(Q[t-1],i))--t;
        Q[++t]=i;
    }
    for(Re i=mid+1,j,id;i<=R;++i){//把右边的点拿来决策（依旧是单调队列）
        while(h<t&&slope(Q[h],Q[h+1])<=a[i].k)++h;
        if(h<=t)id=a[i].id,j=Q[h],dp[id]=min(dp[id],a[j].y-(LL)a[i].k*a[j].x+S[id-1]+(LL)H[id]*H[id]);
    }
    CDQ(mid+1,R);//处理完右边后，两边都按照X(j)排好了序
    Re w=L-1;p1=L,p2=mid+1;//把两边按照X(j)从小到大归并起来
    while(p1<=mid&&p2<=R)b[++w]=a[p1]<a[p2]?a[p1++]:a[p2++];
    while(p1<=mid)b[++w]=a[p1++];while(p2<=R)b[++w]=a[p2++];
    for(Re i=L;i<=R;++i)a[i]=b[i];
}
int main(){
//    freopen("123.txt","r",stdin);
    in(n);
    for(Re i=1;i<=n;++i)in(H[i]);
    for(Re i=1;i<=n;++i)in(W[i]);
    for(Re i=1;i<=n;++i)S[i]=S[i-1]+W[i],dp[i]=inf;
    for(Re i=1;i<=n;++i)a[i].k=(H[i]<<1),a[i].x=H[i],a[i].id=i;
    sort(a+1,a+n+1,cmp);//先按k0[i]排序
    dp[1]=0,CDQ(1,n);//注意左边界上的点要单独求
    printf("%lld
",dp[n]);
}
```
4.【题目链接】
（以此处为分界线，上面都是 (X(j)) 与 (k_0[i]) 均单调的例子）
- 任务安排 (3) ( ext{[SDOI2012] [P5785]}) ( ext{[Loj10186]}) ( ext{[Bzoj2726]})（(X(j)) 单调 (k_0[i]) 不单调）
- 高速公路 ( ext{[P3994]})（(X(j)) 单调 (k_0[i]) 不单调。树上转移）
- 购票 ( ext{[NOI2014] [P2305]})（(X(j)) 单调 (k_0[i]) 不单调。树上转移）
- ( ext{Building Bridges [CEOI2017] [P4655]})（(X(j)) 与 (k_0[i]) 均不单调）
- 货币兑换 ( ext{[NOI2007] [P4027]})（(X(j)) 与 (k_0[i]) 均不单调）
【参考资料】

（本文部分内容摘自以下文章）
查看全文

相关阅读:
扩展json序列化datatime类型数据
 用select实现socket的IO多路复用
 Python单例模式
 Django（信号相关）
将字符串按固定长度分隔成子串
 Android Handler介绍
 Android activity生命周期
 Java 启动线程的方式
 java线程中的sleep和wait区别
 JAVA 统计字符串中中文，英文，数字，空格的个数

原文地址：https://www.cnblogs.com/Xing-Ling/p/11210179.html

【学习笔记】动态规划—斜率优化DP（超详细）

【学习笔记】动态规划—斜率优化DP（超详细）

【前言】

一.【理解方式】

1.【代数法（数形结合）】

(1).【维护一个凸包】

(2).【寻找最优决策点】

2.【线性规划】

(1).【高中数学知识】

(2).【寻找最优决策点】

3.【两种思考方式的结合】

二.【维护凸包】

三.【再优化】

(1).【决策单调性证明】

(2).【单调队列】

(3).【再证决策单调性】

【代数法】

【线性规划】

【其他】

四.【Code】

五.【各种玄学问题】

六.【关于单调性的研究】

(1).【X(j) 单增与单减】

(2).【决策点横坐标 X(j) 不单调】

(3).【待决策点斜率 K0[i] 不单调】

(4).【X(j) 与 K0[i] 均不单调】

七.【例题】

1.【预处理DP 初始值】

【Code】

2.【单调队列+二分】

(1).【T1】

(2).【T2】

(3).【T3】

3.【CDQ/平衡树】

【Code】

4.【题目链接】

【参考资料】