论文发表在AAAI 2020阅读笔记,暂时没有官方的代码。
论文主要提出了SPT(Sampling Perturbation Technology)和WPT(Weighted Perturbation Technology)两种方法,使得生成的音频对抗样本更低噪声、鲁棒、快速生成(分钟级)。
论文Adversarial Attacks on Copyright Detection Systems, ICML 2020阅读笔记。
使用音频对抗攻击的思路和方法,论文攻击了版权检测(Copyright Detection)系统。作者首先使用神经网络去还原了一个公开的音频指纹(Audio Fingerprint Models)提取算法,然后使用常规的对抗攻击算法攻击了这个模型(白盒),然后在放大(scale up)了一些扰动之后,黑盒攻击了谷歌的AudioTag版权检测系统和YouTube的Content ID系统。
混叠现象发生的细节
对抗样本生成技术(图像)总结(待续…)。
论文Interpretable Explanations of Black Boxes by Meaningful Perturbation阅读笔记,论文提出了一种optimization-based的可视化方法。
论文Interpretable Deep Learning under Fire (Usenix Security 2020)中关于ReLU高阶导为零的处理方法,及其PyTorch实现。
ReLU神经网络是分段线性函数(Piecewise Linear)。
论文Semantic Hierarchy Emerges in Deep Generative Representations for Scene Synthesis阅读笔记。
对于场景(scene)生成,指出生成模型在生成图片过程中“语义层级”结构的存在,类似于TCAV的方法。
PyTorch版本代码 → Github,我在别人的基础上修改,一个能跑的版本。
使用“概念激活向量”提供卷积分类模型的解释,一种全局的解释方法。