交叉验证是一种检测model是否overfit的方法。最常用的cross validation是k-fold cross validation。
具体的方法是:
1.将数据平均分成k份,0,1,2,,,k-1
2.使用1~k-1份数据训练模型,然后使用第0份数据进行验证。
3.然后将第1份数据作为验证数据。进行k个循环。就完成了k-fold cross validation
这个交叉验证的方法的特点是:所有的数据都参与了验证,也都参与了训练,没有浪费数据。