机器学习-线性规划(LP)

线性规划问题

首先引入如下的问题：

假设食物的各种营养成分、价格如下表：

Food	Energy（能量）	Protein（蛋白质）	Calcium（钙）	Price
Oatmeal（燕麦）	110	4	2	3
Whole milk（全奶）	160	8	285	9
Cherry pie（草莓派）	420	4	22	20
Pork with beans（猪肉）	260	14	80	19

要求我们买的食物中，至少要有2000的能量，55的蛋白质，800的钙，怎样买最省钱？

设买燕麦、全奶、草莓派、猪肉为x₁,x₂,x₃,x₄

于是我们可以写出如下的不等式组

example_for_introduction_to_linear_programming_formulation

其实这些不等式组就是线性规划方程（Linear programming formulation）：

简单的说，线性规划就是在给定限制的情况下，求解目标。

可行域

来看一个算法导论中的例子，考虑如下的线性规划：

我们可以画出下面的图：

example_for_feasible_region

看图a，灰色的区域就是这几个约束条件要求x₁,x₂所在的区域，而我们最后的解x₁,x₂也要在这里面。我们把这个区域称为可行域（feasible region）

图b可以直观的看出，最优解为8, 而 x₁= 2 , x₂=6

线性规划标准形式

线性规划的标准形式如下：

就是

求的是min
所有的约束为<=的形式
所有的变量均 >=0

如何变为标准形式？

原来是max, 直接*-1求min
若原来约束为=，转为 >= 和<=
约束原来为 >= 同样的*-1，就改变了<=
若有变量 x_i < 0 ，那么用 x^‘ – x^”来替代，其中 x’>=0 x”>=0

线性规划松弛形式

松弛形式为：

min c^Tx

s.t. Ax=b

x≥0

就是通过引入变量把原来的 <= ，变为=的松弛形式.

如：

写为松弛形式就是

<= vs <

为什么我们的线性规划的形式都是可以 <= 或者 >=的形式的？把等号去掉可以么？不可以

举个例子

$\begin{aligned} max & x \\ s.t. & x \leq 1 \end{aligned}$

$\begin{aligned} max & x \\ s.t. & x < 1 \end{aligned}$ $\begin{aligned} max & x \\ s.t. & x < 1 \end{aligned}$

$\begin{aligned} max & x \\ s.t. & x < 1 \end{aligned}$

显然第二个是无解的。

单纯形算法的思想与例子

如何求解线性规划问题呢？

有一些工具如GLPK，Gurobi 等，不在本文的介绍范围内。

本文要介绍的是单纯形算法，它是求解线性规划的经典方法，虽然它的执行时间在最坏的情况下是非多项式的（指数时间复杂度），但是，在绝大部分情况下或者说实际运行过程中却是多项式时间。

它主要就三个步骤

找到一个初始的基本可行解
不断的进行旋转（pivot）操作
重复2直到结果不能改进为止

以下面的线性规划为例:

将其写为松弛的形式：

其实，就是等价于（仍然要求 x₁,x₂,x₃,x₄,x₅,x₆,x₇ >=0）：

在上述的等式的左边称为基本变量，而右边称为非基本变量。

现在来考虑基本解就是把等式右边的所有非基本变量设为0，然后计算左边基本变量的值。

这里，容易得到基本解为：(x₁,x₂….x₇) = (0,0,0,4,2,3,6)，而目标值z = 0，其实就是把基本变量x_i设置为b_i。

一般而言，基本解是可行的，我们称其为基本可行解。初始的基本解不可行的情况见后面的讨论，这里假设初始的基本解就是基本可行解，因此三个步骤中第一步完成了。

现在开始，来讨论上面的第二个步骤，就是旋转的操作。

我们每次选择一个在目标函数中的系数为负的非基本变量x_e，然后尽可能的增加x_e而不违反约束，并将x_e用基本变量x_l表示，然后把x_e变为基本变量，x_l变为非基本变量。

这里，假设我们选择增加x₁，那么在上述的等式（不包括目标函数z那行）中，第1个等式限制了x₁ <=4（因为x4>=0），第2个等式有最严格的限制，它限制了x₁ <=2，因此我们最多只能将x₁增加到2，根据上面的第二个等式，我们有： x₁ = 2 – x₅，带入上面的等式就实现了x_e和x_l的替换：

z=−2−14x2–6x3+x5

x4=2–x2−x3+x5

x1=2–x5

x6=3–x3

x7=6–3x2–x3

这样其实就是一个转动(pivot)的过程，一次转动选取一个非基本变量（也叫替入变量）x_e 和一个基本变量（也叫替出变量） x_l ，然后替换二者的角色。执行一次转动的过程与之前所描述的线性规划是等价的。

同样的，将非基本变量设为0，于是得到：(x₁,x₂….x₇) = (2,0,0,2,0,3,6)， Z = -2，说明我们的目标减少到了-2

接下来是单纯形算法的第三步，就是不断的进行转动，直到无法进行改进为止，继续看看刚才的例子：

我们接着再执行一次转动，这次我们可以选择增大x₂或者x₃，而不能选择x₅，因为增大x₅之后，z也增大，而我们要求的是最小化z。假设选择了x₂，那么第1个等式限制了x₂ <=2 , 第4个等式限制了x₂ <= 2，假设我们选择x₄为替出变量，于是有： x₂ = 2 – x₃ – x₄ + x₅ ，带入得：

z=−30+8x3+14x4−13x5

此时，我们的基本解变为(x₁,x₂….x₇) = (2,2,0,0,0,3,0)， Z = -30

我们可以继续的选择增大x₅，第4个等式具有最严格的限制（0 – 3x₅ >=0），我们有x₅ = 2/3 x₃ + x₄ – 1/3 x₇

带入得

此时，我们的基本解变为(x₁,x₂….x₇) = (2,2,0,0,0,3,0)， Z = -30，这时候并没有增加，但是下一步，我们可以选择增加 x₃。第2个和第3个有最严格的限制，我们选第2个的话，得：x₃ = 3 – 3/2 x₁ – 3/2 x₄ + 1/2 x₇ $，然后老样子，继续带入：$

z=−32+x1+2x4+4x7

x2=1+12x1+12x4–12x7

x3=3–32x1–32x4+12x7

x6=32x1+32x4–12x7

x5=2–x1

现在，已经没有可以继续增大的值了，停止转动，z=-32就是我们的解，而此时，基本解为：(x₁,x₂….x₇) = (0,1,3,0,2,0,0)，看看最开始的目标函数：z = -x₁ -14x₂ – 6x₃ ,我们将x₂=1,x₃=3带入得，z=-32，说明我们经过一系列的旋转，最后得到了目标值。

退化(Degeneracy)

在旋转的过程中，可能会存在保持目标值不变的情况，这种现象称为退化。比如上面的例子中，两次等于-30.

可以说退化可能会导致循环（cycling）的情况，这是使得单纯形算法不会终止的唯一原因。还好上面的例子中，我们没有产生循环的情况，再次旋转，目标值继续降低。

《算法导论》是这样介绍退化产生循环的：

Degeneracy can prevent the simplex algorithm from terminating, because it can lead to a phenomenon known as cycling: the slack forms at two different iterations of SIMPLEX are identical. Because of degeneracy, SIMPLEX could choose a sequence of pivot operations that leave the objective value unchanged but repeat a slack form within the sequence. Since SIMPLEX is a deterministic algorithm, if it cycles, then it will cycle through the same series of slack forms forever, never terminating.

如何避免退化？一个方法就是使用Bland规则：

在选择替入变量和替出变量的时候，我们总是选择满足条件的下标最小值。

替入变量x_e：目标条件中，系数为负数的第一个作为替入变量
替出变量x_l：对所有的约束条件中，选择对x_e约束最紧的第一个

在上面的例子中，我也是这么做的。^ ^

另一个方法是加入随机扰动。

无界(unbounded)的情况

有的线性规划问题是无界的，举个栗子对于下面的线性规划

画出区域为：

example_for_unbounded_case

显然可以不断的增大。让我们来看看单纯形算法是如何应对的：

上述的写成松弛形式为：

也就是，

选择x₁ 为替入变量，x₃为替出变量，有：

这时候我们只能选择x₂ 为替入变量,才能使得目标值变小，但是我们发现，对于x₂没有任何的约束，也就是说，x₂可以无限大，所以这是没有边界的情况。

这个情况是我们有一个替入变量，但是找不到一个替出变量导致的，这时候就是无界的情况了，写算法的时候注意判断一下即可。

从几何角度看单纯形算法

上面我们介绍单纯形算法的时候，是通过最直观的等式变换（就是旋转操作）介绍的。

我们知道，线性规划就是在可行域围成的多胞形中求解，现在从几何的视图来看看单纯形算法。

只需考虑顶点

一个引入的证明

我们假设x⁽⁰⁾ 是最优解，连接x⁽¹⁾和x⁽⁰⁾ 与 x⁽²⁾和x⁽³⁾相交于点x’

我们可以把x⁽⁰⁾ 分解，x⁽⁰⁾ = λ₁ x⁽¹⁾ + (1 – λ₁)x’ 其中λ₁ = p / (p + q)

同样的把x‘ 分解，x’ = λ₂ x⁽²⁾ + (1 – λ₂)x⁽³⁾ 其中λ₂ = r / (r + s)

因此有：x⁽⁰⁾ = λ₁ x⁽¹⁾ + (1 – λ₁)λ₂ x⁽²⁾ + (1 – λ₁) (1 – λ₂)x⁽³⁾，而λ₁ + (1 – λ₁)λ₂ + (1 – λ₁) (1 – λ₂) = 1

小结

我们的顶点要在可行域才行，而不要跑到(0,0)去了。初始方法和之前的一样。

单纯形算法的调用(Python内置工具包)

python真的是非常强大。scipy包里面包含了很多科学计算相关的模块方法。