OpenAI 解散机器人研究团队：理想很丰满，现实很骨感

AI1年前 (2023)发布 aixure

74 0 0

导读：多年研究能学会执行解魔方之类的任务的机器后，OpenAI解散了其机器人团队。公司联合创始人Wojciech Zaremba在初创公司Weights Biases主持的播客中悄然透露，OpenAI已将重心转向数据更唾手可得的其他领域。 Zaremba说：结果证明，只要我们能获得数据，就能取…

多年研究能学会执行解魔方之类的任务的机器后，OpenAI解散了其机器人团队。公司联合创始人Wojciech Zaremba在初创公司Weights & Biases主持的播客中悄然透露，OpenAI已将重心转向数据更唾手可得的其他领域。

Zaremba说：“结果证明，只要我们能获得数据，就能取得巨大的进步；我们所有的机器学习、非监督学习和强化学习，它们效果极好，实际上很多领域有非常丰富的数据。最终，数据问题阻碍了我们在机器人方面的进展。[解散机器人团队]对我来说是很艰难的决定。但前段时间我意识到，实际上，从公司的角度来看这又是最好的决定。”

OpenAI发言人在一份声明中告诉IT外媒VentureBeat：“在通过我们的魔方项目及其他项目推进强化学习技术向前发展之后，去年10月我们决定不开展进一步的机器人研究，而是将团队的注意力转移到其他项目上。由于AI及其能力日新月异，我们发现其他方法（比如结合人类反馈的强化学习）有助于我们在强化学习研究领域更迅速地取得进展。”

OpenAI于2019年10月首次广泛展示了其机器人研究工作，当时它发表了研究成果，详述了由积累13000年经验的AI模型引导的五指机械手。性能最好的系统可以在大约20%到60%的时间内成功破解魔方，这个成绩似乎不是特别出色。但令人瞩目的是，模型发现了遇到挑战后迎刃而解的技术，比如当机器人的手指被绑在一起以及机械手戴着皮手套时。

这是两年多研究工作的结晶。2017年5月，OpenAI发布了 Roboschool，这个开源软件用于模拟控制机器人。同年，该公司表示已开发出一种机器人系统，完全在模拟环境中训练，并部署在物理机器人上，只要见过一次新任务完成就能学会。2018年，OpenAI提供了模拟机器人环境和Hindsight Experience Replay的基准实现，这是一种能从失败中学习的强化学习算法。

Zaremba补充道：“如果我们是一家机器人公司，公司使命会不一样；我认为我们会继续大力发展机器人技术的这种方法和[这个]方向；但从我们想要实现的目标即通用人工智能（AGI）这个角度来看，又缺少某个部分。”

通用人工智能

OpenAI长期以来一直声称，强大的计算能力是迈向通用人工智能（AGI）的必经之路：人能学会处理的任务，这种AI也能学会。虽然Mila创始人Yoshua Bengio和Facebook副总裁兼首席AI科学家Yann LeCun等大咖认为AGI不可能存在，但OpenAI的联合创始人和支持者却认为功能强大的计算机与强化学习、预训练及其他技术相结合，就能实现带来重大变化的AI进步，其中包括Greg Brockman、首席科学家Ilya Sutskever、Elon Musk、Reid Hoffman 和Y Combinator前总裁Sam Altman。

《麻省理工科技评论》杂志在2020年报道，OpenAI下面的Foresight团队进行了试验，测试通过用越来越多的数据和计算来训练算法，可以将AI能力提升到怎样的程度。据同一篇文章报道，OpenAI在使用大量计算资源，开发用图像、文本及其他数据进行训练的系统，公司领导层认为这是通向AGI的最有希望的道路。

这项工作的成果之一是DALL-E，这种文本到图像引擎本质上是一个视觉创意生成器。提供文本提示，OpenAI系统就会生成与提示匹配的图像，提示暗示图像必须包含未明确说明的细节时就填充空白。DALL-E可以结合不同的创意以合成物体，其中一些物体在现实世界中不太可能存在，比如蜗牛和竖琴的混合体。

Brockman和Altman尤其认为AGI将能够胜任比任何人都多的领域，主要是通过识别人类专家无法厘清的复杂的跨学科联系。此外他们预测，负责任部署的AGI（换句话说，与社会科学等相关领域的研究人员“密切配合”部署的 AGI）可能有助于解决气候变化、医疗保健和教育等方面的长期挑战。

Zaremba坚称，预训练是开发大型复杂AI系统的一种特别有效的技术。大致说来，预训练帮助模型学习可以在目标任务上重用的通用特征，从而提高准确性。预训练用于开发 OpenAI的Codex，这个模型用数十亿行公共代码进行了训练以支持 Copilot，而Copilot是GitHub的服务，为Microsoft Visual Studio等开发环境中的大量整行代码提供建议。Codex是OpenAI的GPT-3的微调版本，GPT-3这种语言模型用来自众多网站、书籍、维基百科及其他网络资源的超过一万亿个单词进行了预训练。

商业现实

OpenAI放弃机器人可能反映了该公司面临的经济现状。由于研发成本增加，Alphabet旗下的AI研究实验室DeepMind近年来也出现了类似的转变，由知名项目转向有商用价值的项目，比如蛋白质形状预测。

机器人是一个资本密集型领域，这是公开的秘密。工业机器人公司Rethink Robotics试图寻找买家，但结果未能如愿，七个月后关门大吉。波士顿动力被认为是最先进的机器人公司之一，先被谷歌收购，后卖给软银，最终现代同意斥资11亿美元收购控股权。经过十多年的开发后，本田叫停了其Asimo机器人项目。

大约一年前，微软宣布将向总部位于旧金山的OpenAI投资10亿美元，共同为微软的Azure云平台开发新技术。作为交换，OpenAI同意将其部分知识产权许可给微软，然后微软将其打包出售给合作伙伴，并同意在Azure上训练和运行AI模型，OpenAI致力于开发下一代计算硬件。

在随后几个月，OpenAI发布了一套基于Microsoft Azure的API，便于开发人员探索GPT-3的功能。（OpenAI最近表示，GPT-3现被“成千上万的”开发人员用于300多个不同的应用程序，每天生成45亿个单词。）到2020年底，微软宣布独家购买GPT-3的许可权，为客户开发和交付AI解决方案，以及开发利用自然语言生成强大能力的新产品。

微软最近宣布GPT-3将与其低代码应用程序开发平台Power Apps“深度”集成，专门用于生成公式。比如说，基于AI的功能将让构建电子商务应用程序的用户可以使用对话式语言来描述编程目标，比如“查找名称以‘kids’开头的产品。”

至于像DALL-E和Jukebox这样的项目Jukebox这个AI系统可以从头开始生成任何风格的音乐，它们也有明显的商用价值。OpenAI预测DALL-E有一天可以增强甚至取代3D染引擎。比如说，建筑师可以使用该工具来建筑物可视化，平面设计师则可以将其用于软件和视频游戏设计。

# AI