如今,AI算法几乎成了苹果许多应用的基础,从处理照片以便让照片看起来更明亮、更清晰,到为智能助手Siri提供动力,甚至可能驱动“苹果汽车”。
科技新闻讯 10月19日,像其他所有大型科技公司一样,苹果也迫切需要人工智能(AI)程序员加盟。如今,AI算法几乎成了苹果许多应用的基础,从处理照片以便让照片看起来更明亮、更清晰,到为智能助手Siri提供动力,甚至可能驱动“苹果汽车”。
因此,早在2016年,苹果就聘请了卡内基梅隆大学教授鲁斯兰萨拉克胡迪诺夫(Ruslan Salakhutdinov)领导其AI部门,并出人意料地推出了一个研究博客,发表该公司自己的一些研究成果。对于这家向来喜欢守口如瓶的科技巨头来说,这是个出人意料的举动。
苹果之所以愿意将其部分研究成果公之于众,是因为AI领域的支柱仍然是学术领域,而发表新研究的能力是博士生们进入科技界的主要考虑因素。Facebook首席科学家雅恩勒昆(Yann LeCun)在2016年接受采访时表示:“你不能这样对招募的人才说:‘来为我们工作,但你不能告诉人们你在做什么’,因为这样说意味着你基本上毁了他们的职业生涯。”
如今,四年时间过去了,苹果仍然在其研究博客上发表文章,让人们对该公司的研究人员正在从事的工作有了些最新的见解。目前还不能保证这项研究会成为苹果的真正产品,但这项研究显示了苹果正在投资的那些想法。这些论文中的许多都集中在支持Siri上,通常它被认为不如Google Assistant和亚马逊Alexa。
苹果公司的研究人员正试图让Siri更好地理解问题背后的意图,甚至试图在人们说出命令时解码他们的情绪。一篇论文还谈到了“声学活动识别”,也就是倾听特定的噪音。在论文附带的一段视频中,智能音箱HomePod听到厨房周围发出的噪音后竟然问道:“那是什么声音?”一位研究人员回答说“微波炉”。
Siri的其他改进与虚拟助手的多语言使用有关,苹果公司制作了自己的数据集,以衡量虚拟助手用26种不同语言回答问题的能力。还有一项研究是关于让Siri“被唤醒”来倾听用户的命令这一简单任务。
虽然这项具体的研究是新的,但对于那些关注苹果AI努力的人来说,这是一个老生常谈的故事。2017年,一名AI界专业人士发送了苹果在业内最大会议之一的闭门活动中演示的幻灯片,幻灯片显示,苹果的研究团队正在研究健康、Siri、图像处理甚至自动驾驶汽车的AI系统。
今天,许多相同的主题都可以在苹果网站上找到。而且Siri仍然远远落后于谷歌助手和Alexa,也许比三年前还要落后。
在苹果准备用HomePod Mini扩大其HomePod智能音箱系列之际,对语音助手和智能音箱的投资有重要意义。谷歌和亚马逊凭借各自的智能音箱设备积累了巨大的市场份额,很明显,苹果正在迎头赶上。
以下是关于苹果AI研究团队正在进行的工作的更多细节:
让Siri变得更智能化
苹果公司今年夏天发表了相当多关于语音助理的论文。一个目标是更好地理解用户意图,或者弄清楚一个人想要Siri做什么。苹果研究人员描述了一种方法,它不仅考虑了一个人说了什么,还考虑了上下文背景,包括用户的位置、浏览历史、是否在开车,以及之前的其他Siri请求。
另一种方法则试图通过分析一个人的声音来推断他的情绪。还有一款应用引入了新的数据集,使Siri能够更可靠地回答不同语言的问题。这项研究集中在26种语言上,目的是更好地衡量语音助理跨多种语言工作的能力。
胰岛素-血糖预测
今年8月,苹果发表了一篇论文,研究人员试图通过将AI算法与更传统的胰岛素预测模型相结合,来解决寻找正确胰岛素剂量的反复试验问题。研究小组强调,他们还没有解决这个问题,但引入了一种新的思维方式来预测血糖。然而,更大的图景是苹果对健康研究的兴趣,以及有证据表明该公司正在考虑如何让其产品为那些患有糖尿病的用户服务。
AI支持的辅助工具
在10月份的一篇论文中,苹果研究人员描述了一种名为Rescribe的新工具,它使录制视频的音频描述变得更容易。就像论文中详细描述的那样,“Inline”音频描述本质上是视频的画外音,以帮助那些看不到媒体视频的人加强理解。
Rescribe的目标是让一个人更有效地录制这些音频描述,而不需要一个由音频工程师、配音演员和制片人组成的团队。苹果对这个工具的使用可能会很广泛,从将其添加到自己的视频编辑软件中,到使用它来使其原创电影和电视节目更容易获得。 (科技新闻审校/金鹿)