《机器学习》周志华 读书笔记
1. 间隔与支持向量
给定样本集,在样本空间中找到一超平面将不同的类别的数据划分开。我们希望能够找到两类样本“正中间”的那个超平面。因为那个超平面的容忍度最好,鲁棒性最好。
超平面方程可使用下面的线性方程来描述:
为方程的法向量。b为位移量,决定超平面和原点之间的距离。
超平面可有法向量和位移量表示,记为(w,b)。
样本空间中任意点x的超平面的距离为
样本能被正确分类时,令
距离超平面最近的训练样本使上式等号成立,他们被称为支撑向量。
两个类别支持向量到超平面的距离之和为
, 这也被称为间隔(margin)。
寻找具有最大间隔的超平面就是要找满足
中约束的参数,,使最大。即:
这里乘以类别能够把两个式子统一成一个式子。
上面的表示等价于:
这就是SVM的基本型。