配备26000颗H100,谷歌推出A3超算竞逐AI云计算市场

云计算1年前 (2023)发布 aixure
53 0 0
导读:集微网消息,据外媒报道,在日前举行的年度I/O开发者大会上,谷歌宣布推出一款拥有26000个H100 GPU的AI超级计算机Compute Engine A3,成为它与微软争夺AI霸权的斗争中投入更多资源进行反攻的又一证据。 与谷歌A3的规格相比,目前世界上最快的超级计算机Front…

集微网消息,据外媒报道,在日前举行的年度I/O开发者大会上,谷歌宣布推出一款拥有26000个H100 GPU的AI超级计算机Compute Engine A3,成为它与微软争夺AI霸权的斗争中投入更多资源进行反攻的又一证据。

与谷歌A3的规格相比,目前世界上最快的超级计算机Frontier拥有37000个AMD Instinct 250X GPU。

该超级计算机面向希望训练大型语言模型的客户,谷歌为希望使用超级计算机的公司发布了A3虚拟机实例。谷歌表示,A3超级计算机是对现有A2虚拟机与Nvidia A100 GPU提供的计算资源的重大升级。谷歌正在将所有分布在不同地理位置的A3计算实例汇集到一台超级计算机中,“A3超级计算机的规模提供高达26 exaflops的AI性能,这大大减少了训练大型ML模型的时间和成本”。

多年来,谷歌一直在大肆宣传其TPU系列人工智能芯片,这些芯片被用于训练内部人工智能应用程序的大模型,例如谷歌的Bard产品,谷歌的AI子公司DeepMind业正在用其开展通用和科学应用的AI开发。

相比之下,使用“竞争对手”英伟达GPU的A3超级计算机用途更广泛,可以针对广泛的AI应用程序和大模型进行调整。目前,英伟达GPU几乎已经成为云提供商的必需品,因为客户正在CUDA中编写AI应用程序,这是该公司专有的并行编程框架。

值得一提的是,A3虚拟机是第一个通过名为Mount Evans的IPU单元连接GPU实例的虚拟机,该单元由谷歌和英特尔联合开发。IPU允许A3虚拟机卸载网络、存储管理和安全功能,这些功能传统上是在CPU上完成的。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...