V2EX  ›  英汉词典

Data Split

释义 Definition

数据划分;数据集切分:把一个数据集按用途分成不同部分(常见为训练集、验证集、测试集),用于建模、调参与评估,减少“只在已见数据上表现好”的风险。(在机器学习与统计建模语境中最常见)

发音 Pronunciation (IPA)

/ˈdeɪtə splɪt/

例句 Examples

We used a 70/30 data split for training and testing.
我们用 70/30 的数据划分来进行训练和测试。

To avoid information leakage, the team performed the data split by time so that the model was evaluated only on future data.
为避免信息泄漏,团队按时间进行数据划分,使模型只在“未来”的数据上被评估。

词源 Etymology

data 源自拉丁语 datum(“给予之物、给定之物”),后来发展为“资料/数据”的含义;split 来自古英语 splittan(“劈开、分开”)。组合成 data split,字面即“把数据分开”,在现代数据科学中固定指“将数据集切分为不同用途的子集”。

相关词 Related Words

文学与著作 Literary & Notable Works

  • The Elements of Statistical Learning(Hastie, Tibshirani & Friedman)——讨论训练/测试划分与模型评估思路(常以“training/test split”等表述出现)。
  • Pattern Recognition and Machine Learning(Christopher M. Bishop)——在实验设置与泛化评估中涉及数据集划分。
  • Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow(Aurélien Géron)——实践章节中频繁使用“train-test split / data split”来构建训练与测试流程。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1958 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 15:22 · PVG 23:22 · LAX 07:22 · JFK 10:22
♥ Do have faith in what you're doing.