摘要:对抗样本能作为训练数据辅助提高模型的表达能力, 还能够用来评估深度学习模型的稳健性. 然而, 通过在一个小的矩阵范数内扰乱原始数据点的生成方式, 使得对抗样本的规模受限于原始数据. 因此, 为了更高效地获得任意数量的对抗样本, 探索一种不受原始数据限制的对抗样本生成方式具有重要意义. 本文提出一种基于生成对抗网络的对抗样本生成模型 (Multiple Attack Generative adversarial networks, M-AttGAN), 模型设计为同时训练两组生成对抗网络来分别对原始数据样本分布和模型潜在空间下的扰动分布进行建模, 训练完成的 M-AttGAN 能够不受限制地高效生成带有扰动的对抗样本, 从而为对抗训练和提高深度神经网络的稳健性提供更多可能性. 通过 MNIST 和 CIFAT-10 数据集上的多组实验, 证明了利用生成对抗网络对数据分布良好的学习能力来进行对抗样本生成是可行的, 相较于常规攻击方法, M-AttGAN 不仅能够脱离原始数据的限制生成高质量的对抗样本, 而且样本具备良好的攻击性和攻击迁移能力.