普林斯顿大学的研究人员发明了一种新型芯片,可以在降低能耗的同时加速被称为神经网络的人工智能系统。这种芯片可能有助于将先进的应用带到汽车和智能手机等远程设备上。作者:贾洪阳/普林斯顿大学
为了应对人工智能对计算机网络的爆炸式需求,普林斯顿大学(Princeton University)的研究人员近年来大幅提高了专业人工智能系统的速度,并大幅削减了能源使用。现在,研究人员通过共同设计硬件和软件,使设计者能够将这些新型系统融合到他们的应用中,从而使他们的创新更接近于广泛使用。
“软件是实现新硬件的关键部分,”普林斯顿大学(Princeton)电子与计算机工程教授、研究小组负责人纳文维尔马(Naveen Verma)说。“我们希望设计师们能够继续使用同样的软件系统,让它的工作速度提高10倍或更高效。”
通过减少电力需求和从远程服务器交换数据的需求,普林斯顿技术制造的系统将能够将人工智能应用,如无人机的驾驶软件或高级语言翻译,带到计算基础设施的最边缘。
维尔马是该校凯勒工程教育创新中心(Keller Center for Innovation in Engineering Education)的主任,他说:“为了让人工智能与我们周围的实时和经常是个人的过程相接触,我们需要通过将计算本身移动到边缘来解决延迟和隐私问题。”“这需要能源效率和性能。”
这种新芯片是基于模拟计算的,它使用电路来模拟正在求解的方程,而不是像数字计算机那样生成1和0。作者:贾洪阳/普林斯顿大学
两年前,普林斯顿大学的研究小组制造了一种新的芯片,旨在提高神经网络的性能,而神经网络是当今人工智能的本质。这种芯片的性能比其他先进的微芯片好几十到几百倍,在几个方面标志着一种革命性的方法。事实上,这种芯片与用于神经网络的任何东西都是如此不同,这对开发人员构成了挑战。
维尔马在2018年的一次采访中说:“这种芯片的主要缺点是它使用了一种非常不同寻常的颠覆性架构。”“这需要与我们目前拥有和使用的大量基础设施和设计方法相协调。”
在接下来的两年里,研究人员致力于改进这种芯片,并创建一个软件系统,使人工智能系统能够利用这种新芯片的速度和效率。演讲的国际固态电路虚拟会议2021年2月,第一作者弘扬,研究生时的研究实验室,描述了新软件将允许新芯片处理不同类型的网络和允许可伸缩的系统硬件和软件的执行。
Verma说:“所有这些网络都可以编程。“网络可以很大,也可以很校”
维尔马的团队开发这种新型芯片是为了应对人工智能日益增长的需求,以及人工智能给计算机网络带来的负担。在图像识别、翻译、自动驾驶汽车等新技术领域,能够模仿学习、判断等认知功能的人工智能(ai)发挥着重要作用。理想情况下,无人机导航等技术的计算应该基于无人机本身,而不是远程网络计算机。但是数字微芯片的电力需求和对存储的需求使设计这样一个系统变得困难。通常,该解决方案将大部分计算和内存放在一个远程服务器上,该服务器与无人机进行无线通信。但这增加了对通信系统的要求,并带来了安全问题和向无人机发送指令的延迟。
为了解决这个问题,普林斯顿大学的研究人员从几个方面重新思考了计算。首先,他们设计了一种在同一个地方进行计算和存储数据的芯片。这种技术被称为内存计算,它减少了与专用内存交换信息所需的能量和时间。这种技术提高了效率,但也带来了新的问题:由于它将两个函数挤在一个小区域内,内存计算依赖于模拟操作,而模拟操作对电压波动和温度峰值等源的破坏很敏感。为了解决这个问题,普林斯顿大学的研究小组使用电容而不是晶体管来设计芯片。电容器是储存电荷的设备,可以更精确地制造,不受电压变化的很大影响。电容器也可以非常小,并放置在存储单元的顶部,增加处理密度和减少能源需求。
但是,即使在使模拟操作变得强大之后,仍然存在许多挑战。模拟核心需要有效地集成在一个大部分数字架构中,这样它就可以与其他功能和软件相结合,从而使实际系统工作。数字系统使用开关来表示1和0,计算机工程师用它们来编写构成计算机程序的算法。模拟计算机采用完全不同的方法。在《IEEE Spectrum》的一篇文章中,哥伦比亚大学教授Yannis Tsividis将模拟计算机描述为一种物理系统,它被设计成由与程序员想要解的方程相同的方程控制。例如,算盘是一种非常简单的模拟计算机。齐维迪斯说,水桶和软管可以作为模拟计算机来解决某些微积分问题:要解决积分函数,你可以做数学运算,或者你可以测量桶里的水。
在第二次世界大战期间,模拟计算一直是主导技术。它被用来执行从预测潮汐到指挥海军火炮的功能。但是模拟系统建造起来很麻烦,通常需要训练有素的操作人员。晶体管出现后,数字系统证明更有效率,适应性更强。但是新的技术和新的电路设计使工程师能够消除模拟系统的许多缺点。对于像神经网络这样的应用,模拟系统提供了真正的优势。现在的问题是如何将两个世界的优点结合起来。
维尔马指出,这两种系统是互补的。数字系统发挥着核心作用,而使用模拟芯片的神经网络可以非常快速和有效地运行专门的操作。这就是为什么开发一个能够无缝且有效地集成这两种技术的软件系统是如此关键的一步。
他说:“我们的想法不是把整个网络放到内存计算中。”“你需要整合功能,以一种可编程的方式来做所有其他事情。”
除了维尔马和贾之外,作者还包括普林斯顿大学博士后研究员侯赛因瓦拉维;Jinseok Lee, Murat Ozatay, Rakshit Pathak和Yinqi Tang,普林斯顿大学的研究生。这个项目的部分支持是由普林斯顿大学工程和应用科学学院的威廉艾迪在1982年慷慨资助的。