人工智能技术或许比我们大多数人想象中来得更快。
如果说 Siri 企图在信息输入上有所突破,那么 Narrative Science 的努力方向就是更加拟人化的“输出”。过去,计算机“写作”技术只停留在利用庞大文本库所进行的简单拼凑。因此,生成的结果当然不尽如人意。
西北大学教授 Kristian Hammond 联手前 Double Click 管理团队的成员,Stuart Frankel 和西北大学计算机系和新闻系的精英们花费了两年时间在2010年共同研发出了新一代的智能写作软件 Narrative Science,将新闻报道和电脑工程进行了一次新世代的结合。
这个在学校实验室代号为“Stats Monkey”的项目,通过对给定主题的数据分析,会自动选择合适的写作角度,快速“写就”一篇具有标准新闻报道结构的文章。神奇的是,程序甚至可以根据不同的出版社特点用不同的行文风格“写作”。Narrative Science 最初被应用在即时报道西北大学棒球和垒球的比赛中。自此以后,Narrative Science 也被应用在财经报道等领域,包括 Forbes 等网站都已经开始与 Narrative Science 建立了合作伙伴关系。
Hammond 教授认为 Narrative Science 的特别之处就在于满足了人们倾向读故事的心理。在此之前,虽然计算机已经拥有了强大的运算能力,可以图形化复杂的数据,却依然不能根据数据以自然语言输出成一篇人性化的文章。而Narrative Science 就是为解决这个问题而设计的。当前,该程序的写作表现足以达到一位八年级学生的写作水平。
随着技术的持续完善,有业界专家大胆预测,类似计算机记者将在未来二十年内成为普利策(Pulitzer)新闻奖的有力竞争者。虽然 Hammond 教授始终在强调 Narrative Science 是在真正地进行“创作(Composition)” 而非生搬硬套,仍有相当部分人对此技术持保留态度。在这群人中(相当一部分是记者),主要认为再先进的计算机算法始终也无法模仿人类的感性流露,这项技术最终只能生成低质量的数据报告式的文章。
同时,自动化写作也让诸如 Google 等在线搜索公司产生隐忧。如果程序已经能自动生成如此高质量的“拟人化”文章,那么辨别在线垃圾内容的任务将会变得异常艰巨。华盛顿大学人工智能的专家 Oren Etzioni 在谈及这个问题时,毫无掩饰地将 Narrative Science 比作数字化装备竞赛中的核武器。而 Narrative Science 则表示,他们不会将此技术转让/部署到这些网站中。
最后,我们提供了两段文字,其中一段就是 Narrative Science 自动生成的,你能分辨出是哪一段吗?请在下面的留言中给出你的答案。
A: “Michigan held off Iowa for a 7-5 win on Saturday. The Hawkeyes (16-21) were unable to overcome a four-run sixth inning deficit. The Hawkeyes clawed back in the eighth inning, putting up one run.”
B:”The Iowa baseball team dropped the finale of a three-game series, 7-5, to Michigan Saturday afternoon. Despite the loss, Iowa won the series having picked up two wins in the twinbill at Ray Fisher Stadium Friday.”