支持向量机是一个类分类器,能够将不同的样本在样本空间分割的超平面。
给定一些标记好的样本,SVM输出一个最优化的分割平面。
支持向量机
1.支持向量机是一种监督式学习方法,可广泛的用于统计学习及线性回归,支持向量机
属于一般的线性分类器,这类分类器的特点是他们能够同时最小化经验误差与最大化
几何边缘区,因此支持向量机也被成为最大边缘区分类器。
2.支持向量机将向量映射到一个更高维的空间里,在这个空间里建有一个最大间隔超平
面。在分开数据的超平面的两边建有两个互相平行的超平面,分割超平面使两个平行
超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。
3.假设给定一些分属于两类的二维点,这些可以通过直线分割,我们要找到一条最优的
分割线,如何来界定一个超平面是否最优:
在 上图中,a和b都可以作为分类超平面,但最优超平面只有一个,最优分类平面使间隔
最大化,定义直线好坏的标准:
距离样本太近的直线不是最优的,因为这样的直线对噪声的敏感度高,泛化性较差。因此
我们的目标是找到一条直线,离所有点的距离最远。
由此,SVM算法的实质是找出一个能够将某个值最大化的超平面,这个值就是超平面离所
有训练样本的最小距离,这个最小距离用SVM术语来说叫间隔。