为什么人工智能还远不能取代人类？语言理解能力仍然欠缺

AI1年前 (2023)发布 aixure

76 0 0

导读：新浪科技讯北京时间5月10日消息，和许多新生事物一样，人工智能(AI)近期的发展同样经历了一些起伏和波折。在前不久举行的一场被广泛认为是人工智能领域里程碑事件的人机对弈比赛中，人工智能取得了对人类前世界冠军的胜利。然而也就在一周之前，在国外…

近几年内人工智能领域取得了一些重要的突破，这背后很重要的因素之一就是一项名为“深度学习”的技术

在前不久举行的一场被广泛认为是人工智能领域里程碑事件的人机对弈比赛中，人工智能取得了对人类前世界冠军的胜利。图为谷歌公司的围棋智能对弈程序“阿尔法狗”正在与韩国前世界围棋冠军李世石对弈中

谷歌公司开发的无人驾驶汽车

和许多新生事物一样，人工智能(AI)近期的发展同样经历了一些起伏和波折。在前不久举行的一场被广泛认为是人工智能领域里程碑事件的人机对弈比赛中，人工智能取得了对人类前世界冠军的胜利。然而也就在一周之前，在国外社交网站推特上一个旨在通过与真实的人类进行对话并能够从中学习的“聊天机器人”却因为网民们的恶意调侃而迅速“学坏”，很快变得满嘴污言秽语，还充斥着种族主义思想，以至测试方只能赶忙将它下线处理。

这些事情究竟是如何发生的？它们对于迅速发展中的人工智能领域研究将产生什么样的作用？

在今年3月初，由谷歌公司设计的围棋对弈系统“阿尔法狗”击败了韩国的前围棋世界冠军李世石。围棋对弈的复杂性被认为远超国际象棋，因此在此之前常常被研究人员用来评估人工智能能够达到的水平高度。而在谷歌的“阿尔法狗”亮相之前，大部分专家都认为人工智能如果想要在围棋领域击败人类顶尖水平选手恐怕还需要数十年时间的发展。

但就在这场里程碑式的胜利之后不久，微软公司推出了一款名为“Tay”的推特线上聊天机器人，其设计能够模仿一名19岁的美国少女。推特用户可以与Tay在线聊天，微软公司表示Tay能够通过这样的对话学习真实人类的说话方式并不断完善自己，并更好地与人类交流。但就在Tay上线之后仅仅16小时之后，微软就不得不将其紧急下线处理，因为这款聊天机器人开始频繁爆出粗口，其中不乏种族歧视、侮辱女性以及污秽不堪的词句。在紧急下线之后微软公司很快就此事向公众表达了歉意，同时指责这一事件是一次“针对这一技术探索项目”的“薄弱点”所开展的“有组织的攻击”。

不过尽管微软公司将这一令人失望的状况归结为黑客攻击行为。但人工智能专家，美国康奈尔大学的计算机科学教授巴特赛尔曼(Bart Selman)博士则认为，微软所称的这种所谓“技术薄弱点”似乎更像是一种过滤机制的缺陷，那就是Tay往往倾向于直接获取别人对她说过的词汇并为自己所用，而在此过程中并不加以适当的过滤。赛尔曼博士表示，他对此感到非常惊讶，因为微软竟然没有建立足够有效的安全措施来防止此类事件的发生，但他也表示，这一事件凸显了人工智能领域目前所面临的一大弱点：语言能力。

教授AI

赛尔曼博士表示，人工智能非常擅长句子解构，它们能够找出隐藏在文字背后的语法模式。这种能力让Tay这样的聊天机器人能够创建出一种符合人类语言语法习惯的句子。这种能力也正是谷歌和Skype软件翻译功能背后的技术基矗但是赛尔曼同时也指出：“但说到对于语句意义的理解就是另外一回事了。”

近几年来人工智能的迅速发展在很大程度上得益于一种被称之为“深度学习”的技术的进步，这项技术可以说在某些地方模仿了人类大脑内神经系统的运作模式。当输入海量信息时，它非常擅长从中找出某种模式，这也解释了为何人工智能领域近几年来一些最成功的突破都发生在知觉任务领域，如图像或语音识别等方面。

英国牛津大学计算机科学系助理教授西蒙威特森(Shimon Whiteson)指出，传统技术方法中，研究者必须“告诉”人工智能去看什么，它们才能去学习。而相比之下，深度学习的优势就在于这类系统能够自动发现其中的模式。

人工智能的决策网络第一层被设计用于在数据中识别一些最基本的模式，比如图像中某个物体的边界。随后这一结果被输入到第二层决策网络，后者将继续搜寻更为复杂的模式，如方形或者圆形。这一过程不断递进迭代，每一层决策网络都能够识别比上一层更加复杂的模式，于是随着时间推移，人工智能的模式识别能力不断提升，比如它能够借助低层次决策网络得到的机构外观信息最终准确地鉴别出一些物体，如一辆汽车或是一辆自行车。

威特森表示：“借助深度学习技术，你能够将海量数据输入一个大型神经网络，然后它自己就能完成从头到尾的自我训练。”

巨大的回报

这一技术的发展已经产生了一些拥有超人般能力的人工智能。赛尔曼表示深度学习系统已经被证明能够在医学核磁共振影像判读方面超越人类专家。另外还有一种技术被称为“增强学习”(reinforcement learning)，该技术主要原理是机器通过奖励信号来不断修正自己的最优策略并不断进步的技术方法。加拿大人工智能初创公司“Maluuba”的首席技术官兼联合创始人卡希尔苏勒曼(Kaheer Suleman)表示，当将深度学习与增强学习两者相结合，机器还能够进行精确的虚拟仿真。谷歌公司的人工智能系统“阿尔法狗”正是通过自己与自己对弈超过数百万局，并不断总结这些对弈中学习到的方法，提升自己的技术与策略，从而迅速成为水平甚至能够击败人类最顶尖大师的围棋专家。

苏勒曼表示：“人工智能面临的重大挑战还在于那些缺乏大规模标记数据集的领域，或者难以对相关环境进行较好模拟的领域。”他说：“语言就是这种领域的一个很好例子。互联网上包含有无穷无尽的网页，但上面全都是文字，没有一个地方找得到以机器能够理解的形式所书写的关于这些文字‘意思’的内容。”

“Maluuba”公司目前正致力于开发一种算法，其能够阅读文字并回答关于这段文字的问题，但苏勒曼表示语言的一些特点让这项工作变得尤其困难。仅举一例，语言的复杂性难以想象某一段文字可以有不同深度上不同的意思，其中的每一个字、每一个词和每一句句子都有着各自的含义。这些不同的含义可以相互组成成近乎无限多的组合，而且不同的人使用语言的方式和风格又不一样。

除此之外，所有的语言都是抽象的：文字只是真实世界中事物的抽象标记，而所有这些真实世界中的事物对于机器来说都是它从未经历过的。威特森表示：“从机器学习的角度来看，学习完成后的机器水平也不过是和你输入其中的数据量所能提供的信息相当。”

由于缺乏对真实世界的体验数据以及人类社会已经积累起来的数量巨大的社会互动经验，很容易理解为为何微软公司的聊天机器人Tay无法很好地理解什么是“Holocaust”(大屠杀)，以及为何否认它是一种不合适的行为。

未来发展

但尽管面临这样或是那样的挑战，Maluuba公司在上个月在论文预印本网站arXiv上贴出一篇论文，描述了该公司目前开发出的一款智能系统已经能够以大约70%的正确率阅读一篇它不熟悉的文章，并回答关于这段文章的多选题。这样的准确率水平已经超出同类其他系统最高水平15%以上。Maluuba公司研究人员所采用的技术方法结合了深度学习与神经网络结构，通过这两者之间的相互作用输出非常初级的推理结果。这家公司目前同样还致力于机器语音对话系统的开发，其设计目标是能够非常自然流畅地介入与人类之间的正常对话。

赛尔曼表示，未来在一些主题内容较为有限的领域，侧重语言能力的人工智能将拥有极大的应用前景。比如说一些技术支持热线在未来可能就将逐渐由人工智能代替，另外一些常规性的管理岗位，其职责主要就是升级一些表格并发送一些格式化的邮件，那么这样的工作就很可能可以由人工智能代替，并且它们或许可以做的更好。

赛尔曼说：“而在一些不受控制的，非常开放环境下的设置中，履行任务将需要借助人类智力的多种维度，并且需要你真正理解他人。在这样的领域，人工智能就会出现非常明显的局限性。”

但威特森也指出，即便在这些方面，进步仍然是明显的。比如谷歌公司正在开发的全自动无人驾驶汽车就是一个很好的例子。与真实的人类驾驶员所驾驶的车辆在同一条公路上行驶，计算机所需要掌握的显然并不仅仅是交通法规，它还需要能够理解并遵循一些不成文的社会准则并在避让碰撞风险时应对一些道德层面的两难问题。

正如人工智能和机器人领域的技术进展大大增加了真实世界中机器的使用量一样，机器与人类的自然互动也将不再只是停留在科幻领域。研究人员目前正在寻找新的途径来帮助机器不仅能够感知，还能够理解它周围的世界。

威特森表示：“深度学习是一项伟大的技术，但它并非万能。还有很多事情有待完善，因此自然而然的下一步，也就是人们目前正在做的事情就是，如何在深度学习中加入更多的东西，从而使它能够具备更多功能。”他说：“现在所有这些问题，包括我们需要机器做些什么，以及我们如何教会它们去做这些事，因为这些事具有现实的重要性，因此人们现在对它们更加重视了。”(晨风)

# AI