陈根:理解“他她它”,人工智能如何做到?

人工智能应用1年前 (2023)发布 aixure
77 0 0
导读:文/陈根 具有代替和指示作用的代词,作为实词在句法和文本中具有重要作用。代词令语言简洁且更富有变化性。 对于人类来说,识别代词指代对象并不算困难,凭借对上下文和对句子的理解就可以找出代词的指代对象。然而,对于人工智能来说,却并不容易机器对文本…

文/陈根

具有代替和指示作用的代词,作为实词在句法和文本中具有重要作用。代词令语言简洁且更富有变化性。

对于人类来说,识别代词指代对象并不算困难,凭借对上下文和对句子的理解就可以找出代词的指代对象。然而,对于人工智能来说,却并不容易机器对文本的理解通常需要核心性解析。换言之,能否准确搜索、追踪、分析代词与实体之间的关联,对于人工智能能否准确理解文本内容至关重要

这种能力被称为共指消解(Conference Resolution),是自然语言处理(NLP)领域的重要研究方向,即通过追踪长句、段落、文章中的代词,找到其对应的指代对象或内容。

尽管目前有很多体量庞大的众包数据集,但它们主要考察模型理解局部语义以及谓词参数结构,涉及共指消解的问题很少见

针对这一问题,艾伦人工智能研究所的研究团队最近公布了一个新的众包数据集,被称为为QUOREF,里面包含超过 2400 个广度选择问题,旨在专门考察模型的共指消解能力。这些问题需要在维基百科的 4.7K 多个英文段落中分析并找到各个实体的指代对象。

作为专门测试共指消解能力的数据集,QUOREF 足以证明目前常见的机器阅读理解模型仍有很大的进步空间。通过分析错误答案背后的原因,NLP 研究者才能更好地改进模型,实现在复杂、多元、大跨度的文本内容中准确对应实体与代词,做到真正意义上的的语义理解。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...