据连线杂志网站报道,在澳大利亚的西海岸,生物学家阿曼达·霍奇森(Amanda Hodgson)控制无人机飞向印度洋上的高空。这位儒艮专家使用无人机帮助他们观察濒临灭绝的研究对象。不过霍奇森和她的团队并没有能力来筛查所有拍得的照片。在45000张照片中寻找儒艮的身影,对于未经过训练的眼睛来说太难了。她的解决之道是把这工作交给深度神经网络来完成。
神经网络是种机器学习模型,大众所熟知的“人脸识别”便是其应用之一。此外,手机的智能语音助理之所以能理解你说的话,谷歌搜索引擎之所以能呈现准确的搜索结果,也都有它在背后的功劳。通过对人类大脑神经网络进行模仿,这些扫描数学模型通过对大量数据的分析来习得专项功能。前文所述霍奇森博士便使用这种技术在数千张航拍照片中寻找儒艮的踪迹。霍奇森的神经网络基于TensorFlow打造,这是谷歌研发的第二代人工智能学习系统。
由于儒艮习惯在水面以下捕食,所以检测这些动物的任务需要格外的精确度。“它们的身迹很容易跟水面眩光相混淆。”她说。现在她的神经网络可以识别散布海面80%的儒艮。
该项目尚处在早期阶段,但它却展示了深度学习在刚过去的一年里广泛的影响。深度学习在2016年风光无限。这个古老的技术被赋予新的活力,帮助谷歌在世界瞩目的围棋大战中击败人类。这在几个月前还是几乎不可能的事。AlphaGo(“围棋”的英文名字即叫“Go”)仅仅是最突出的例子。一年过去,深度学习不再只是科技极客的小众玩宠,转而走向了风光台面。谷歌、Facebook、微软和亚马逊籍着它从里到外焕然一新。反过来这些互联网巨头的推波助澜——通过开放源代码和提供云服务——也加速了深度学习的流行。
新翻译
去年,神经网络在Google Photo等应用上将图像识别技术提升到新台阶,Google Now和微软小娜也因它的加持实现了更优异的语音识别效果。今年,轮到了翻译界被改造。机器翻译实现了大跃进。九月份,谷歌推出“神经机器翻译”服务。这种翻译完全通过神经网络运行,将翻译误差率降低了55%~85%。
谷歌通过大量现有翻译的集合数据来对神经网络进行训练。培训材料既包括旧版翻译软件差强人意的翻译,也包括由人类语言专家提供的信雅达式翻译,后者无疑对提高素材质量有加分。深度学习拥有克服缺陷的神奇魔法:尽管培训材料质量参差不齐,但神经网络最终能够实现远超低水平的翻译水准。
虽然谷歌的首席工程师麦克·舒斯特(Mike Schuster)坦诚他们的造物还远非完美,但它仍然不失是一个突破性成就。由于该服务完全基于深度学习运行,未来改进工作也将轻松许多。开发人员可以集中精力从整体上对系统做出改进,而不是像过去那样再为小部件纠结。
谷歌之外,微软也在朝同一方向努力。本月,微软也发布了自己翻译应用的新版本。号称能够在九种语言之间实现即时翻译。微软副总裁沈向洋(Harry Shum)表示微软翻译的系统同样完全运行在神经网络上。这意味着微软翻译的水平也有迅速提升的可能。
新聊天
2016年,深度学习也在聊天机器人领域大显身手。其中最引人注目的当数Google Allo。Allo于今年秋天推出,通过对用户文本和照片的分析,能够提供即时的智能回复。其功能的实现基于谷歌此前一项名为“智能回复”(Smart Reply)的技术,该技术与电子邮件技术在很大程度上有相似之处。
Allo不仅仅是一个聊天app,它还能在你毫无察觉中提升你的谷歌搜索体验。程序帮助搜索引擎理解你的需求,从而使搜索返回的结果更合乎你的需求。根据谷歌搜索产品经理大卫·奥尔(David Orr)的说法,如果没有深度学习,程序就无法实现回答。“使用神经网络是我们找到的唯一方法。”他说。“我们必须使用我们所掌握的最先进科技。”
尽管有其强项,但进行真正的对话仍然让神经网络力不能及。造出这种完全以假乱真的“聊天机器人”还有很长的路要走。当下,谷歌、Facebook和其他地方的研究员正在积极探索深度学习技术,以期有朝一日能实现宏伟目标。可以确定的是这些技术探索将会带来和“语音识别”、“图像识别”和“机器翻译”一样伟大的进步。“聊天机器人”就是下一个技术前沿。
新数据中心
谷歌在深度学习的路上停都停不下来。今年夏天,在打造了名声大噪的AlphaGo之后,Google DeepMind实验室领导人杰米斯·哈萨比斯(Demis Hassabis)表示他们还开发了一个AI来管理谷歌全球计算机数据中心网络。使用一种被称为“深度强化学习”(Deep Reinforcement Learning)的技术,AI能够智能管理服务器中冷却风扇的开关和温度控制。总之一个数据中心超过120项功能全由它掌控。
彭博社报道,这个AI的部署帮助谷歌节省了数亿美元。2014年谷歌花6.5亿美元收购DeepMind,现在已经完全捞回了成本。目前DeepMind正计划在这些计算设施外安装更多传感器,收集更多数据来训练AI到更高的水平。
新的云计算
当互联网巨头纷纷用新技术武装自己时,他们也通过自家服务将之献给大众。2015年底,谷歌宣布将TensorFlow开源。仅仅一年内,这个一度专有的软件造福了像阿曼达·霍奇森这样的千万大众。与此同时,谷歌还与微软、亚马逊一道在云计算服务中提供自己的深度学习技术,让任何个人或组织开发者使用它们来构建自己的程序。“人工智能服务”可能成为这三个网络巨头的最大业务。
在过去的十二个月中,技术的火热让领域内的人才变得炙手可热。李飞飞(Fei-Fei Li)是AI研究领域技术领袖级人物,谷歌聘请她来管理其AI云计算组织。亚马逊则聘请卡内基梅隆大学教授亚历克斯·斯摩纳(Alex Smolna)坐镇其云计算帝国。科技巨头竭尽全力招揽人才,彼此毫不相让。所幸他们竞争产生的研究成果都会为公众所用,这倒不是坏事。
随着AI的演变,计算机科学家的角色也正在发生改变。传统意义上能够编写代码的人变的不那么重要,新趋势需要的是更多能够训练神经网络的人。后者所需的技能非同以往,与自己开发东西相比,它更像是诱导数据产生结果。谷歌这些大企业不仅积极招徕新式人才,并且也在将已有员工往这方向引导。未来AI将会使每个人生活中的技术变革一新。