稳健过拟合抑制的平滑方法

对抗性扰动 15/06/2021

三个要点
✔️ 引入两种平滑方法来抑制鲁棒超拟合
✔️ 使用对数平滑法和权重平滑法作为平滑方法
✔️ 成功地同时提高了标准精度和稳健精度

Robust Overfitting may be mitigated by properly learned smoothening
written by Tianlong Chen, Zhenyu Zhang, Sijia Liu, Shiyu Chang, Zhangyang Wang
(Submitted on 29 Sept 2020 (modified: 25 Feb 2021))
Comments: Published as ICLR 2021 Poster
Subjects: Machine Learning (cs.LG); Machine Learning (stat.ML)

code：

研究概要

对抗性攻击是一种针对深度学习模型的攻击技术。这种攻击被称为对抗性实例，即在正常数据的基础上给模型输入小的噪音，使其分类错误。为了防止这种攻击，一种叫做 "对抗性训练 "的学习方法被认为是有效的，它是在正常的训练数据之外，提前训练对抗性实例，以便对抗性实例能够被正确分类。我们的想法是要能够正确地对对抗性实例进行分类。

虽然这种对抗性训练取得了一定程度的成功，但它也有一个缺点，就是容易出现过拟合（称为鲁棒过拟合）。为了防止鲁棒过拟合，作者引入了两种平滑方法，成功地同时提高了标准精度和鲁棒精度。

建议的方法

对抗性训练中的Logit平滑化

作者认为，Robust过拟合的部分原因是在对抗训练的早期阶段产生的对抗例证过拟合。因此，作者使用logit平滑法来防止对初始Adversarial实例的过度拟合。具体来说，学习是通过解决以下优化问题来进行的。

我们将损失函数定义为三个损失函数的加权和：普通对抗性训练的损失函数（第一项），由对抗性训练模型监督的知识蒸馏的损失函数（第二项），以及由正常训练模型监督的知识蒸馏的损失函数（第三项）。损失函数被定义为三个损失函数之和。通过使用这个损失函数，我们可以用其他两个正则化项（知识提炼的损失项）来正则化普通对抗训练。