zoukankan      html  css  js  c++  java
  • 对交叉验证的理解

    1. 交叉验证, 每一折都对应一个模型,例如5折交叉验证就需要训练5个模型。
    2. 交叉验证重点在于验证,通过模型在验证集上的表现,来选择相应的参数,交叉验证,会让验证值更为可靠。
    3. 对于有独立测试集的数据,用不用交叉验证来调参根据实际情况,这个时候交叉验证是可有可无的,因为只要测试集是一样的,其他的不管怎么样都行。
    4. 对于需要自己划分测试集的情况,模型最终在测试集上的表现,是需要进行,交叉验证的,应该说是交叉测试,因为测试集是随机的,不具有说服力,进行交叉测试用到了全部的数据,这样更有说服力。
    5. 对于有独立测试集的情况,在划分训练集和验证集之后,同样可以使用交叉验证,训练多个模型,然后多个模型在测试集上进行测试,最后结果取平均。大家在论文上作指标比较的时候,需要通过前面论文报道结果的方式来选择对应的计算方式,这样才公平。
    6. 最终论文报道的结果都是,跑过多次,然后取最高值,因为大家都这样做(滑稽)。
    7. 通过验证集上的表现来选择模型参数,一般使用early stop。
    8. 我个人是不太喜欢交叉验证的,因为交叉验证浪费时间,神经网络训练一次需要不少时间。
    9. 我们在打比赛的时候一般需要用到交叉验证,因为这个时候的测试集没有标签,利用交叉验证我们可以得到较为可靠的验证值。
  • 相关阅读:
    我们失去了,我们又没有失去什么
    人过 40
    KPI绩效考核为何在国内不管用?
    再也不必当心我的密码了,多个SAP 客户端自动输入密码
    大器晚成
    人际能量相吸定律
    SQL SERVER函数——表值函数的处理
    MS-SQL SERVER单列合并的四种常用方法
    实战 SQL Server 2008 数据库误删除数据的恢复
    唉,怎么一眨眼就老了!
  • 原文地址:https://www.cnblogs.com/mlgjb/p/11719925.html
Copyright © 2011-2022 走看看