zoukankan      html  css  js  c++  java
  • 对交叉验证的理解

    1. 交叉验证, 每一折都对应一个模型,例如5折交叉验证就需要训练5个模型。
    2. 交叉验证重点在于验证,通过模型在验证集上的表现,来选择相应的参数,交叉验证,会让验证值更为可靠。
    3. 对于有独立测试集的数据,用不用交叉验证来调参根据实际情况,这个时候交叉验证是可有可无的,因为只要测试集是一样的,其他的不管怎么样都行。
    4. 对于需要自己划分测试集的情况,模型最终在测试集上的表现,是需要进行,交叉验证的,应该说是交叉测试,因为测试集是随机的,不具有说服力,进行交叉测试用到了全部的数据,这样更有说服力。
    5. 对于有独立测试集的情况,在划分训练集和验证集之后,同样可以使用交叉验证,训练多个模型,然后多个模型在测试集上进行测试,最后结果取平均。大家在论文上作指标比较的时候,需要通过前面论文报道结果的方式来选择对应的计算方式,这样才公平。
    6. 最终论文报道的结果都是,跑过多次,然后取最高值,因为大家都这样做(滑稽)。
    7. 通过验证集上的表现来选择模型参数,一般使用early stop。
    8. 我个人是不太喜欢交叉验证的,因为交叉验证浪费时间,神经网络训练一次需要不少时间。
    9. 我们在打比赛的时候一般需要用到交叉验证,因为这个时候的测试集没有标签,利用交叉验证我们可以得到较为可靠的验证值。
  • 相关阅读:
    Confluence 6 连接一个目录
    卸载 PrestaShop 1.7
    一“脚”到位-淋漓尽致的自动化部署
    从细节处谈Android冷启动优化
    视觉设计师的进化
    网易对象存储NOS图床神器
    移动端互动直播(入门篇)
    SpringBoot入门(五)——自定义配置
    SpringBoot入门(四)——自动配置
    SpringBoot入门(三)——入口类解析
  • 原文地址:https://www.cnblogs.com/mlgjb/p/11719925.html
Copyright © 2011-2022 走看看