导读:集微网消息,据外媒报道,在日前举行的年度I/O开发者大会上,谷歌宣布推出一款拥有26000个H100 GPU的AI超级计算机Compute Engine A3,成为它与微软争夺AI霸权的斗争中投入更多资源进行反攻的又一证据。 与谷歌A3的规格相比,目前世界上最快的超级计算机Front…
集微网消息,据外媒报道,在日前举行的年度I/O开发者大会上,谷歌宣布推出一款拥有26000个H100 GPU的AI超级计算机Compute Engine A3,成为它与微软争夺AI霸权的斗争中投入更多资源进行反攻的又一证据。
与谷歌A3的规格相比,目前世界上最快的超级计算机Frontier拥有37000个AMD Instinct 250X GPU。
该超级计算机面向希望训练大型语言模型的客户,谷歌为希望使用超级计算机的公司发布了A3虚拟机实例。谷歌表示,A3超级计算机是对现有A2虚拟机与Nvidia A100 GPU提供的计算资源的重大升级。谷歌正在将所有分布在不同地理位置的A3计算实例汇集到一台超级计算机中,“A3超级计算机的规模提供高达26 exaflops的AI性能,这大大减少了训练大型ML模型的时间和成本”。
多年来,谷歌一直在大肆宣传其TPU系列人工智能芯片,这些芯片被用于训练内部人工智能应用程序的大模型,例如谷歌的Bard产品,谷歌的AI子公司DeepMind业正在用其开展通用和科学应用的AI开发。
相比之下,使用“竞争对手”英伟达GPU的A3超级计算机用途更广泛,可以针对广泛的AI应用程序和大模型进行调整。目前,英伟达GPU几乎已经成为云提供商的必需品,因为客户正在CUDA中编写AI应用程序,这是该公司专有的并行编程框架。
值得一提的是,A3虚拟机是第一个通过名为Mount Evans的IPU单元连接GPU实例的虚拟机,该单元由谷歌和英特尔联合开发。IPU允许A3虚拟机卸载网络、存储管理和安全功能,这些功能传统上是在CPU上完成的。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...