伪标签(伪标注):一种常用于半监督学习的技术。先用已训练的模型给未标注数据预测“标签”,把这些预测当作临时的“真标签”(伪标签),再将其加入训练以提升模型表现(通常会配合置信度阈值来筛选可靠样本)。在一些语境中也可泛指“用模型自动生成标签”的做法。
/ˈsuːdoʊ ˈleɪbəlɪŋ/
Pseudo-labeling can help when you have very few labeled images.
伪标签可以在你只有很少标注图像时提供帮助。
By iteratively applying pseudo-labeling with a confidence threshold, the team improved accuracy on the target domain without collecting new annotations.
通过在设定置信度阈值的前提下迭代使用伪标签,该团队在不新增人工标注的情况下提升了目标领域的准确率。
pseudo- 源自希腊语 pseudes,意为“假的、伪的”;label 来自中古法语 label/lebel,指“标签、标记”。组合成 pseudo-label(伪标签),再加 -ing 构成名词 pseudo-labeling,表示“进行伪标注/使用伪标签的过程与方法”。