2018 年 Top 10 影响力 AI 研究论文( 四 )

论文思想要点

目前有三种常见的梯度模糊做法:

梯度破碎(shattered gradients),防御方法会有意地(通过不可微的运算)或者无意地(通过数值的不稳定性)提供不正确的梯度,或者不提供梯度;通过随机防御提供随机梯度;通过非常深的深度神经网络评估带来消失梯度/爆炸梯度。基于梯度的方法有一些问题,我们可以看到下面这些迹象:

一步式的攻击比迭代式的攻击效果更好;黑盒攻击比白盒攻击的效果更好;无限制攻击也无法达到 100% 成功率;随机采样也可以找到对抗性样本;提高图像扭曲的容忍度并不能提高攻击成功率。论文的关键成果是,通过实验表明如今使用的大多数防御技术都还很脆弱。ICLR 2018 接收论文中的 9 种防御技术中,有 7 种都使用了梯度模糊,而论文作者们提出的新攻击方法可以完全绕过 7 种中的 6 种防御,并部分绕过最后 1 种。

领域内学者评价

这篇论文获得了 ICML 2018 的最佳论文奖;这篇论文清晰地展示出了我们现有技术的优点和缺点未来可能的相关研究

推荐阅读