解密SVM系列（二）：SVM的理论基础(转载)

zoukankan html css js c++ java

解密SVM系列（二）：SVM的理论基础(转载)

解密SVM系列（二）：SVM的理论基础原文博主讲解地太好了收藏下

解密SVM系列（三）：SMO算法原理与实战求解

支持向量机通俗导论（理解SVM的三层境界）

上节我们探讨了关于拉格朗日乘子和KKT条件，这为后面SVM求解奠定基础，本节希望通俗的细说一下原理部分。

一个简单的二分类问题如下图：

我们希望找到一个决策面使得两类分开，这个决策面一般表示就是

这里我们把问题反过来看，假设我们知道了结果，就是上面这样的分类线对应的权值W和b。那么我们会看到，在这两个类里面，是不是总能找到离这个线最近的点，向下面这样：

然后定义一下离这个线最近的点到这个分界面（线）的距离分别为d1,d2。那么SVM找最优权值的策略就是，先找到最边上的点，再找到这两个距离之和D，然后求解D的最大值，想想如果按照这个策略是不是可以实现最优分类，是的。好了还是假设找到了这样一个分界面

好了再看看D=d1+d2怎么求吧，假设分界面

这里W=(w1,w2)，是个向量，||W||为向量的距离，那么

我们知道，如果一个一次函数分界面为
$m i n$
把约束条件换成小于号的形式：

好了那样的话就可以引入拉格朗日乘子法了，优化的目标变为：
$L (w, b, α) = 1 2 w T w + α 1 h 1 ( x ) + . . . + α n h n ( x )$

$\partial L \partial w = w - \sum i = 1 N α i y i x i = 0 \Rightarrow w = \sum i = 1 N$

好了得到上面的两个公式，再带回L中把去w和b消掉，你又可能发现，w确实可以消，因为有等式关系，那b怎么办？上述对b求导的结果竟然不含有b，上天在开玩笑吗？其实没有，虽然没有b，但是有那个求和为0呀，带进去你会惊人的发现，b还真的可以消掉，就是因为了那个等式。简单带下：
$W (α) = L (w, b, α) = 1 2 ( \sum i = 1 N α i y i x i ) T ( \sum$

$m a x$

细心的你肯可能会发现，上述所有的构造等等都是在数据完全线性可分，且分界面完全将两类分开，那么如果出现了下面这种情况：

正负两类的最远点没有明显的分解面，搞不好正类的最远点反而会跑到负类里面去了，负类最远点跑到正类里面去了，要是这样的话，你的分界面都找不到，因为你不可能找到将它们完全分开的分界面，那么这些点在实际情况是有的，就是一些离群点或者噪声点，因为这一些点导致整个系统用不了。当然如果不做任何处理确实用不了，但是我们处理一下就可以用了。SVM考虑到这种情况，所以在上下分界面上加入松弛变量

好了那么因为松弛变量的加入，导致每个点的约束条件就变化了点，像上界面以上的点，它满足的条件可能就是：
$m i n$

$L (x, α, β) = 1 2 W T W - \sum i = 1 N α i ( y i ( W x i + b ) + ϵ i$

$\partial L \partial w = w - \sum i = 1 N α i y i x i = 0 \Rightarrow w = \sum i = 1 N$

$W (α) = - 1 2 ( \sum i , j = 1 N α i y i α j y j x i * x j ) +$

$W (α) = - 1 2 ( \sum i , j = 1 N α i y i α j y j x i * x j ) +$
剩下的问题是怎么去找这样一组最优解

查看全文

相关阅读:
css一div内文字居中
 (三)maven出错记录
 (二)在eclipse中使用maven
单点登录原理及实现sso
java定时器2-spring实现
 内存溢出
 IDE配置jvm参数
 CheckStyle
表单提交数据量大于2m，java 后台接受不到表单传递过来的数据
 JVM实用参数（一）JVM类型以及编译器模式

原文地址：https://www.cnblogs.com/Vae1990Silence/p/8393103.html