转自:https://blog.csdn.net/l8947943/article/details/80328721
training set:训练集是用来训练模型的。遵循训练集大,开发,测试集小的特点,占了所有数据的绝大部分。
development set:用来对训练集训练出来的模型进行测试,通过测试结果来不断地优化模型。
test set:在训练结束后,对训练出的模型进行一次最终的评估所用的数据集。
所有数据之间都应该属于同分布,才能进行训练测试,如果不同分布,则不能进行训练测试