robust-scaling(稳健缩放/稳健尺度化):一种数据预处理(特征缩放)方法,通常用中位数(median)来居中、用四分位距(IQR)来缩放,从而降低异常值(outliers)对尺度变换的影响。常见于机器学习中,让不同特征处于更可比较的量级,但比均值-标准差标准化更“抗异常值”。
Robust-scaling makes the data less sensitive to outliers.
稳健缩放会让数据对异常值不那么敏感。
Before training the model, we applied robust-scaling to skewed features so that extreme values wouldn’t dominate the learning process.
在训练模型之前,我们对偏态特征做了稳健缩放,以避免极端值主导学习过程。
/roʊˈbʌst ˈskeɪlɪŋ/
该短语由两部分组成:robust(“稳健的、强健的”)源自拉丁语 robustus(“坚硬/强壮”之意);scaling 来自 scale(“尺度、比例”)。在统计与机器学习语境中,“robust”常指对噪声或异常值不敏感的方法,因此 robust-scaling 指“对异常值更稳健的缩放”。