通过人工智能分析，快速用200字以内描述读完长篇小说《傲慢与偏见》

77 0 0

导读：通过人工智能分析，快速用200字以内描述读完长篇小说《傲慢与偏见》但可惜现在并未计划对外开放此项技术借助微调后的GPT-3语言模型，OpenAI实现以不到200个字词精简描述原本长达12万个字词撰写的《傲慢与偏见》小说情节。按照OpenAI研究人员说明，此项技…

但可惜现在并未计划对外开放此项技术

借助微调后的GPT-3语言模型，OpenAI实现以不到200个字词精简描述原本长达12万个字词撰写的《傲慢与偏见》小说情节。

按照OpenAI研究人员说明，此项技术先将《傲慢与偏见》小说情节精简为24796个字词数的276段摘要，进而缩减为3272个字词的25段摘要，以及更进一步缩减为475个字词的4段摘要，最后再精简为175个字词数组成摘要，不仅让文章长度缩减为原文的千分之一，更保留完整剧情走向。

其他通过此语言模型精简摘要的小说，还包含将全文浓缩为136个字词的《艾丽斯梦游仙境》、缩减为119个字词的《罗密欧与朱丽叶》，以及减少为192个字词的《自由之心》。

就技术原理来看，此款微调后的GPT-3语言模型，将会按照文章长度进行判断，其中包含文章长度较短内容直接撷取结论，长篇文章则会在各个片段撷取重点，并且持续缩减文章字数，进而将这些内容以相同撰写口吻连接成通顺可读内容。

而此项语言模型则是通过平均字词数在10万以上的小说内容进行训练，而这样的训练模式更可更换为不同语言模型、不同采样方式，以

及不同训练数据类型持续升级，并且借助强化学习以对抗生成方式，产生可让人类轻易阅读结果。

同时，在强化学习部分也采用三种变体抽样训练方式，借此让语言模型确实能理解小说内容表达主轴。

在训练过程中，研究人员通过Goodreads 2020榜单上最受欢迎的40本书籍，分别涵盖幻想、恐怖、爱行、推理等20种内容类，并且通过两名研究人员与语言模型个别针对此类书籍进行总结，让研究人员与语言模型总结结果能有80%比例相近，借此让分析结果更接近人类预期内容。

另外，研究人员也会通过语言模型撷取摘要内容，能否用于回答与原始内容相关问题作为评估，借此判断摘要内容是否正确。即使未能完整回答问题，但内容方向至少不会有明显偏离。

但按照OpenAI方面表示，现阶段并未有计划开源此项微调后的GPT-3语言模型，因此主要还是聚焦在研究阶段。

科技改变世界，知识改变命运！

欢迎点赞、关注“新千万个为什么”，了解电脑、手机、相机、数码、3C新资讯！

来都来了，就加个关注吧！

文章版权归作者所有，未经允许请勿转载。

aixure

aixure

aixure

aixure

aixure

aixure

暂无评论

暂无评论...