选自arXiv
作者:Rowan Zellers 等
机器之心编译
机器之心编辑部
之前,OpenAI GPT-2 因为太能生成假新闻而不提供开源。而最近,华盛顿大学和艾伦人工智能研究所的研究者表示,要想对抗假新闻,用对应的假新闻生成器是最好的方法。研究者通过大量实验表示,最了解假新闻缺点、假新闻「造假水平」的会是原本的生成器。因此想要判别 GPT-2 生成的假新闻,还是需要先开源 GPT-2 大模型。
论文地址:https://arxiv.org/pdf/1905.12616.pdf
自然语言生成领域近期的进展令人喜忧参半。文本摘要和翻译等应用的影响是正面的,而其底层技术可以生成假新闻,且假新闻可以模仿真新闻的风格。
现代计算机安全依赖谨慎的威胁建模:从攻击者的角度确定潜在威胁和缺陷,并探索可行的解决方案。同样地,开发对假新闻的稳健防御技术也需要我们认真研究和确定这些模型的风险。
来自华盛顿大学和艾伦人工智能研究所的研究人员近期的一项研究展示了一个可控文本生成模型 Grover。给出标题「Link Found Between Vaccines and Autism」,Grover 可以生成文章内容,且 Grover 生成的内容比人类写的假消息看起来更加可信。
图 1:该研究介绍了一个能够检测和生成假新闻的模型 Grover。
开发对抗 Grover 等生成器的稳健验证技术非常重要。该研究发现,当目前最好的判别器能够获取适量训练数据时,其辨别假新闻和人类所写真新闻的准确率为 73%。
而对 Grover 最好的防御就是 Grover 本身,它可以达到 92% 的准确率,这表明开源强大生成器的重要性。研究人员进一步研究了这些结果,发现数据偏差(exposure bias)和缓解其影响的采样策略都会留下相似判别器能够察觉的缺陷。最后,该研究还讨论了这项技术的伦理问题,研究人员计划开源 Grover,帮助更好地进行假新闻检测。
Grover 生成文章示例
图 8:上图是同样标题的两篇文章,一篇是人类书写的,另一篇则是 Grover 生成的,标题来自《卫报》。右下角为人类评分者给出的分数。
针对假新闻,该研究做了什么?
在本文中,研究人员力图在假新闻大量出现前去理解并解决这一问题。他们认为这一问题属于依赖计算机安全领域,依赖于威胁建模:分析系统的潜在威胁和缺陷,并探索稳健的防御措施。
为了严谨地研究这一问题,研究人员提出了新模型 Grover。Grover 能够可控并高效地生成完整的新闻文章,不仅仅是新闻主体,也包括标题、新闻源、发布日期和作者名单,这有助于站在攻击者的角度思考问题(如图 1 所示)。
人类评分表明他们认为 Gover 生成的假消息是真实可信的,甚至比人工写成的假消息更可信。因此,开发对抗 Grover 等生成器的稳健验证技术非常重要。研究人员假设了一种情景:一个判别器可以获得 Grover 生成的 5000 条假新闻和无限条真实新闻。
在这一假设下,目前最好的假新闻判别器(深度预训练语言模型)可达到 73% 的准确率 (Peters et al., 2018; Radford et al., 2018; 2019; Devlin et al., 2018)。而使用 Grover 作为判别器时,准确率更高,可达到 92%。这一看似反直觉的发现说明,最好的假新闻生成器也是最好的假新闻判别器。
本文研究了深度预训练语言模型怎样分辨真实新闻和机器生成的文本。研究发现,由于数据偏差,在假新闻生成过程中引入了关键缺陷:即生成器是不完美的,所以根据其分布进行随机采样时,文本长度增加会导致生成结果落在分布外。然而,缓解这些影响的采样策略也会引入强大判别器能够察觉的缺陷。
该研究同时探讨了伦理问题,以便读者理解研究者在研究假新闻时的责任,以及开源此类模型的潜在不良影响 (Hecht et al., 2018)。由此,该研究提出一种临时的策略,关于如何发布此类模型、为什么开源此类模型更加安全,以及为什么迫切需要这么做。研究人员认为其提出的框架和模型提供了一个坚实的初步方案,可用于应对不断变化的 AI 假新闻问题。
具体方法
下图 2 展示了利用 Grover 生成反疫苗文章的示例。指定域名、日期和标题,当 Grover 生成文章主体后,它还可以进一步生成假的作者和更合适的标题。
图 2:如图展示了三个 Grover 生成文章的例子。在 a 行中,模型基于片段生成文章主体,但作者栏空缺。在 b 行中,模型生成了作者。在 c 行中,模型使用新生成的内容重新生成了一个更真实的标题。
架构
研究者使用了最近较为流行的 Transformer 语言模型 (Vaswani et al., 2017),Grover 的构建基于和GPT-2相同的架构 (Radford et al., 2019)。研究人员考虑了三种模型大校
最小的 Grover-Base 使用了 12 个层,有 1.17 亿参数,和 GPT 及 Bert-Base 相同。第二个模型是 Grover-Large,有 24 个层,3.45 亿参数,和 Bert-Large 相同。最大的模型 Grover-Mega 有 48 个层和 15 亿参数,与 GPT-2 相同。
数据集
研究者创建了 RealNews 大型新闻文章语料库,文章来自 Common Crawl 网站。训练 Grover 需要大量新闻文章作为元数据,但目前并没有合适的语料库,因此研究人员从 Common Crawl 中抓取信息,并限定在 5000 个 Google News 新闻类别中。
该研究使用名为「Newspaper」的 Python 包来提取每一篇文章的主体和元数据。研究者抓取 2016 年 12 月到 2019 年 3 月的 Common Crawl 新闻作为训练集,2019 年 4 月的新闻则作为验证集。去重后,RealNews 语料库有 120G 的未压缩数据。
ѵ