test set:在机器学习、统计或实验中,用于最终评估模型/方法表现的一组数据(或样本)。通常不参与训练,用来衡量模型在“未见数据”上的泛化能力。(也常有 training set / validation set 等配套概念。)
/ˈtɛst sɛt/
The test set is kept separate from the training data.
测试集与训练数据是分开的。
After tuning the model on the validation set, we reported the final accuracy on an untouched test set to estimate real-world performance.
在验证集上调参后,我们在一份未被使用过的测试集上报告最终准确率,以估计真实世界中的表现。
由 test(测试、检验)+ set(一组、一套)构成,字面意思是“用于测试的一组(数据)”。在现代数据科学语境中,它特指用于最终评估的那部分数据集合。