正如电力在过去一个世纪里改变了工业的运行方式那样,人工智能将在未来100年里大幅改变社会。AI正被整合应用到家用机器人、机器人出租车以及心理健康聊天机器人中。一家创业公司正在利用AI技术开发机器人,让它们更接近人类的智能水平。AI本身已经进入到人们的日常生活中,比如为数字助理Siri和Alexa的大脑提供动力。它让消费者能够更准确、更高效地在网上购物和搜索,以及执行其他人们认为理所当然的任务。
Coursera联合创始人、斯坦福大学教授吴恩达(Andrew Ng)博士上周在硅谷举行的AI前沿会议上发表主题演讲时表示:“AI就像是一种新的电力。大约100年前,电力改变了每一个主要行业。AI已经发展到同样的水平,有能力在未来几年改变所有主流行业。”吴恩达说,尽管人们认为AI是一种相当新的技术,但它实际上已经存在了几十年。但它之所以现在才实现腾飞,这要归功于数据和计算能力的扩展。
吴恩达表示,目前通过AI创造的大部分价值都是通过监督学习完成的。但有两大波的进步:一波利用深度学习来预测消费者是否会在算法获得有关他的信息后点击在线广告。而当输出不再是一个数字或整数,而是语音识别、另一种语言或音频的句子结构时,第二波进步就出现了。例如,在无人驾驶汽车中,图像的输入会形成其他在路上的车辆位置输出。
微软首席科学家黄学东(Xuedong Huang)表示,实际上,深度学习(即电脑从数据集学习到执行功能,而不是执行它被编程的特定任务)对实现与人类相媲美的语音识别目标是有帮助的。2016年,黄学东领导微软团队取得了历史性成就,当时他们的系统记录到5.9%的错误率,这与人类转录员的情况相同。黄学东在会议上说:“多亏了深度学习,我们能够在20年之后达到人类的程度。”此后,该团队将错误率进一步降低至5.1%。
数字助理的崛起
从2010年开始,语音识别的质量开始改善,最终Siri和Alexa诞生了。吴恩达说:“现在,你几乎认为这是理所当然的。亚马逊Alexa总监Ruhi Sarikaya说,除此之外,预计语音将取代触控输入。提高准确性的关键是理解上下文语境,例如,如果一个人问Alexa晚餐应该做什么,这位数字助理必须评估他的意图。他是想让Alexa去餐馆预订位置、点餐还是寻找食谱?如果他要求Alexa找到《饥饿游戏》(Hunger Games),他是想要听音乐、看视频亦或是听有声读物?
谷歌的研究科学家迪勒克·哈卡尼-图尔(Dilek Hakkani-Tur)表示,数字助理的下一步研究将是一项更先进的任务,即理解“超越文字的意义”。举例来说,如果用户使用“今天晚些时候”这样的短语,可能意味着晚上7点到9点之间,或者下午3点到5点开会。哈卡尼-图尔说,下一阶段还需要更复杂、更生动的对话、多领域任务以及超越领域界限的互动。此外,数字助理应该能够做更多事情,比如轻松阅读和总结电子邮件。
语音识别之后,就是“计算机视觉”,即计算机识别图像并对其进行分类的能力。随着许多人上传图片和视频,将元数据添加到所有内容中变得很麻烦,这就需要一种将它们分类的方法。Facebook人工智能研究院可视化识别技术专家Manohar PaluriLumos说,Facebook开发了一种能够理解和大规模分类视频的AI,名为Lumos。Facebook利用Lumos进行数据收集,例如,收集烟花图像和视频。该平台还可以利用人们的姿势来识别视频,比如将人们在沙发周围忙碌的场景归类为“即将外出闲逛”。
谷歌视频理解主管拉胡尔·苏山卡尔(Rahul Sukthankar)补充说,关键是要确定上传视频的主要语义内容。为了帮助计算机正确识别视频中的内容,苏山卡尔的团队在YouTube上挖掘了AI可以学习的类似内容,比如针对非专业内容的特定帧率。苏山卡尔补充说,未来研究的一个重要方向是使用视频对计算机进行训练。所以,如果机器人看到一个人把麦片倒进碗里的多个角度视频,它应该能通过观察视频来学习。
阿里巴巴用AI来促进销售。例如,淘宝电商网站上的购物者可以上传自己想买的产品照片,比如街上某个陌生人的时髦手袋,网站会提供最接近照片的手袋。阿里巴巴还使用了增强现实(AR)/虚拟现实(VR)技术,让人们可以在Costco这样的商店里浏览和购物。在Youku视频网站上,阿里巴巴正在开发一种方法,将虚拟3D物体插入用户上传的视频中,以此来增加收入。这是因为许多视频网站都在致力于增强盈利能力。阿里巴巴AI首席科学家任晓峰(Xiaofeng Ren)说:“YouTube仍然在亏损。”
罗西(Rosie)和家庭机器人
尽管AI技术在不断进步进步,但它仍然无法与人类的大脑相匹配。Vicarious是一家旨在通过开发相当于人类智能水平的机器人来缩小AI与人类智商差距的创业公司。其联合创始人狄丽普·乔治(Dileep George)说,这些组件都是用于组装智能机器人的。他说:“我们有廉价的马达、传感器、电池、塑料以及处理器……我们为什么不能拥有罗西呢?”他指的是20世纪60年代太空时代卡通片《杰森一家》(The Jetsons)中的多用途机器人女佣。乔治说,目前AI的水平就像他所说的“老大脑”,类似于老鼠的认知能力。而“新大脑”更发达,比如在灵长类和鲸鱼身上看到的东西。
乔治说,当较小的输入被改变时,“老大脑”会感到困惑。举例来说,一个可以玩电子游戏的机器人,当颜色变得更亮时,就会出错。他说:“今天的AI还没有准备好!” Vicarious利用深度学习技术让机器人更接近人类的认知能力。在同样的测试中,尽管亮度发生了变化,但有拥有Vicarious AI的机器人始终能够坚持玩这个游戏。另一个让“老大脑”混淆的东西是把两个物体放在一起。人们可以看到两件东西叠加在一起,比如咖啡杯在照片中遮住了一个花瓶,机器人常会把它误认为是一个身份不明的物体。Vicarious的目标就是解决这类问题,且Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)也是它的投资者。
作为机器人伴侣和视频摄影师,Kuri的情况有所不同。Kuri的开发公司Mayfield Robotics首席技术官Kaijen Hsiao表示,在机器人的左眼后面有一个摄像头,可以在高清格式下收集视频。Kuri有深度传感器来绘制房屋地图,并使用图像来改善导航。她也有宠物和人类检测功能,这样当他们出现在周围的时候,Kuri就可以展露微笑或做出反应。Kuri也拥有识别能力,所以即使灯光发生了变化,她也能记得自己曾去过的地方,比如白天或晚上的厨房。“瞬间选择”是这个机器人的另一项功能,它可以让Kuri识别她记录的类似视频,比如爸爸在客厅逗弄婴儿等,同时还能清除多余的视频。
Kaijen Hsiao解释称:“Kuri的工作就是给你的家庭带来生活气息。它还能提供娱乐服务,比如播放音乐、播客、有声读物等。你可以在任何地方查看你的家。” Kuri是这个家庭的录像制作人,它在屋子里四处走动。Kuri使用了愿景和深度学习算法,Kaijen Hsiao说:“Kuri最大的特点是有自己的个性,可以作为可爱的伴侣。”Kuri将于12月份上市,售价799美元。
商业对AI回应
麦肯锡全球研究所主席兼董事詹姆斯·曼伊卡(James Manyika)认为,美国和中国在AI领域的投资居于世界领先地位。去年,北美地区的AI投资从150亿美元到230亿美元不等,而亚洲(主要是中国)的投资额为80亿美元至120亿美元,欧洲则仅有30亿美元至40亿美元,处于落后状态。科技巨头是AI领域的主要投资者,其资金规模在90亿美元至300亿美元之间,另外还有60亿至200亿美元,投资方包括风险资本家和私人股本公司。
他们把钱投到哪里去了?机器学习占投资总额的56%,计算机视觉位居其次,占28%。自然语言占7%,无人驾驶汽车占6%,其余部分则被虚拟助理瓜分。不过,曼伊卡表示,尽管投资不断增加,但AI的实际应用仍然有限,即使是那些知道其能力的公司也是如此。大约40%的公司都在考虑部署AI,40%的公司进行了实验,只有20%的公司在某些领域采用了AI。
之所以保持沉默,是因为41%的受访企业认为自己的投资回报不高,30%的受访企业表示,它们的商业价值还不够充分,其他公司则表示,它们没有掌握AI技能。然而,麦肯锡认为,AI可以将其他分析的影响提高一倍以上,并有可能大幅提升企业业绩。
有些公司能做到这一点,比如在AI领域领先的行业包括电信和科技公司、金融机构以及汽车制造商。曼伊卡说,这些早期采用者往往是更大的、数字化成熟的公司,它们将AI融入到核心活动中,专注于增长和创新,而不是节省成本,并需要首席执行官的力挺。最慢的采用者是医疗保舰旅游、专业服务、教育以及建筑行业的公司。然而,专家表示,随着AI的普及,企业大规模采用AI也只是时间问题。