通过人工智能分析,快速用200字以内描述读完长篇小说《傲慢与偏见》
但可惜现在并未计划对外开放此项技术
借助微调后的GPT-3语言模型,OpenAI实现以不到200个字词精简描述原本长达12万个字词撰写的《傲慢与偏见》小说情节。
按照OpenAI研究人员说明,此项技术先将《傲慢与偏见》小说情节精简为24796个字词数的276段摘要,进而缩减为3272个字词的25段摘要,以及更进一步缩减为475个字词的4段摘要,最后再精简为175个字词数组成摘要,不仅让文章长度缩减为原文的千分之一,更保留完整剧情走向。
其他通过此语言模型精简摘要的小说,还包含将全文浓缩为136个字词的《艾丽斯梦游仙境》、缩减为119个字词的《罗密欧与朱丽叶》,以及减少为192个字词的《自由之心》。
就技术原理来看,此款微调后的GPT-3语言模型,将会按照文章长度进行判断,其中包含文章长度较短内容直接撷取结论,长篇文章则会在各个片段撷取重点,并且持续缩减文章字数,进而将这些内容以相同撰写口吻连接成通顺可读内容。
而此项语言模型则是通过平均字词数在10万以上的小说内容进行训练,而这样的训练模式更可更换为不同语言模型、不同采样方式,以
及不同训练数据类型持续升级,并且借助强化学习以对抗生成方式,产生可让人类轻易阅读结果。
同时,在强化学习部分也采用三种变体抽样训练方式,借此让语言模型确实能理解小说内容表达主轴。
在训练过程中,研究人员通过Goodreads 2020榜单上最受欢迎的40本书籍,分别涵盖幻想、恐怖、爱行、推理等20种内容类,并且通过两名研究人员与语言模型个别针对此类书籍进行总结,让研究人员与语言模型总结结果能有80%比例相近,借此让分析结果更接近人类预期内容。
另外,研究人员也会通过语言模型撷取摘要内容,能否用于回答与原始内容相关问题作为评估,借此判断摘要内容是否正确。即使未能完整回答问题,但内容方向至少不会有明显偏离。
但按照OpenAI方面表示,现阶段并未有计划开源此项微调后的GPT-3语言模型,因此主要还是聚焦在研究阶段。
科技改变世界,知识改变命运!
欢迎点赞、关注“新千万个为什么”,了解电脑、手机、相机、数码、3C新资讯!
来都来了,就加个关注吧!