V2EX  ›  英汉词典

Loss Scaling

Definition / 释义

损失缩放:在(尤其是 FP16 等低精度)训练神经网络时,把损失值乘以一个缩放因子,以便放大反向传播得到的梯度,减少数值下溢(underflow)带来的梯度变成 0 的问题;之后再按相同因子把梯度缩回去以保持更新量正确。常见有静态损失缩放动态损失缩放两种。

Pronunciation / 发音

/lɔs ˈskeɪlɪŋ/

Examples / 例句

Loss scaling can prevent gradients from underflowing in FP16 training.
损失缩放可以在 FP16 训练中防止梯度发生下溢。

With dynamic loss scaling, the scale is adjusted to avoid overflow while keeping mixed-precision training stable.
使用动态损失缩放时,缩放因子会被自动调整,以避免上溢并保持混合精度训练的稳定性。

Etymology / 词源

loss 原指“损失、失去”,在机器学习语境中引申为“损失函数值(衡量误差的指标)”;scaling 来自 “scale(缩放)”,表示按比例放大或缩小。合起来的 loss scaling 就是“对损失值做缩放”,以改善数值计算的稳定性(尤其在低精度浮点数中)。

Related Words / 相关词

Literary Works / 文学与著作例证

  • Micikevicius et al.(2018)Mixed Precision Training(常被引用来解释混合精度训练与损失缩放/动态缩放的做法)
  • NVIDIA Developer Blog(多篇混合精度训练文章中系统介绍 loss scaling 的动机与实践)
  • 《Deep Learning》(Ian Goodfellow, Yoshua Bengio, Aaron Courville)及相关深度学习教材(在数值稳定性、梯度与浮点精度的讨论中与该概念密切相关)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   718 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 22:24 · PVG 06:24 · LAX 14:24 · JFK 17:24
♥ Do have faith in what you're doing.