1:train-val-test数据集的划分(6:2:2)
[注]val 数据集其实质也是test,其只不过是在train数据集中划分出来的test数据集以选择合适的参数(防止选择的参数出现过拟合现象如图1中,当Degrees=5时,参数的选择最好,大于5会出现过拟合现象)。
2:k-flod cross validation划分
[注]由于pytorch中没有val set的划分,故可以通过train_db,val_db=torch.utils.random_split(train_db,[50000,10000])函数将划分好的train_db再次划分,即可得到三个部分的数据集。