首先把数据集划分为训练集和测试集;
再把训练集细分为训练集和验证集,划分的方式常常是K折交叉验证法。
训练集(training set):用于训练模型,拟合的数据样本。
验证集(validate set):用于决定什么时候停止训练模型、使用多少层网络、使用什么正则化方式、网络参数量等超参。
测试集(test set):用来评估模最终模型的泛化能力。但不能作为调参、选择特征等算法相关的选择的依据。
【参考资料】
训练集、验证集、测试集以及交验验证的理解
训练集、验证集和测试集