在做svm的时候我们碰到了结构风险最小化的问题,结构风险等于经验风险+vc置信范围,当中的vc置信范围又跟样本的数量和模型的vc维有关,所以我们看一下什么是vc维
首先看一下vc维的定义:对一个指标函数集,假设存在H个样本可以被函数集中的函数按全部可能的2的H次方种形式分开,则称函数集可以把H个样本打散;函数集的VC维就是它能打散的最大样本数目H
比如有个样本,一个函数可以将这h个样本打散,打散指的是样本最后被分类的情况有2^h种可能。则这个函数可以打散的最大样本数就是vc维
例如以下图所看到的。一条直线可以将三个点打散成2^3种结果,可是不能将4个点打散成2^4种结果。所以vc维是3
參考
http://blog.csdn.net/mingspy/article/details/8858270