(机器学习/深度学习中)数据增强:通过对已有训练数据进行一系列保持标签语义不变或近似不变的变换(如旋转、裁剪、加噪、同义改写等),来“扩充”数据的多样性,从而提升模型的泛化能力、缓解过拟合。(在不同任务中也可包含生成合成数据的方法。)
/ˈdeɪtə ˌɔːɡmɛnˈteɪʃən/
We used data augmentation to improve the model’s accuracy.
我们使用数据增强来提高模型的准确率。
By applying random crops, flips, and color jitter as data augmentation, the network became more robust to variations in lighting and viewpoint.
通过将随机裁剪、翻转和颜色抖动作为数据增强手段,网络对光照与视角变化变得更鲁棒。
data 源自拉丁语 datum(“给出的东西”,datum 为 dare“给予”的过去分词),后来在英语中常指“资料/数据”。
augmentation 源自拉丁语 augmentare(“增加、扩充”),与 augere(“使增长”)同源。合起来 data augmentation 字面义即“对数据进行扩充”。