配备26000颗H100，谷歌推出A3超算竞逐AI云计算市场

云计算2年前 (2023)发布 aixure

55 0 0

导读：集微网消息，据外媒报道，在日前举行的年度I/O开发者大会上，谷歌宣布推出一款拥有26000个H100 GPU的AI超级计算机Compute Engine A3，成为它与微软争夺AI霸权的斗争中投入更多资源进行反攻的又一证据。与谷歌A3的规格相比，目前世界上最快的超级计算机Front…

集微网消息，据外媒报道，在日前举行的年度I/O开发者大会上，谷歌宣布推出一款拥有26000个H100 GPU的AI超级计算机Compute Engine A3，成为它与微软争夺AI霸权的斗争中投入更多资源进行反攻的又一证据。

与谷歌A3的规格相比，目前世界上最快的超级计算机Frontier拥有37000个AMD Instinct 250X GPU。

该超级计算机面向希望训练大型语言模型的客户，谷歌为希望使用超级计算机的公司发布了A3虚拟机实例。谷歌表示，A3超级计算机是对现有A2虚拟机与Nvidia A100 GPU提供的计算资源的重大升级。谷歌正在将所有分布在不同地理位置的A3计算实例汇集到一台超级计算机中，“A3超级计算机的规模提供高达26 exaflops的AI性能，这大大减少了训练大型ML模型的时间和成本”。

多年来，谷歌一直在大肆宣传其TPU系列人工智能芯片，这些芯片被用于训练内部人工智能应用程序的大模型，例如谷歌的Bard产品，谷歌的AI子公司DeepMind业正在用其开展通用和科学应用的AI开发。

相比之下，使用“竞争对手”英伟达GPU的A3超级计算机用途更广泛，可以针对广泛的AI应用程序和大模型进行调整。目前，英伟达GPU几乎已经成为云提供商的必需品，因为客户正在CUDA中编写AI应用程序，这是该公司专有的并行编程框架。

值得一提的是，A3虚拟机是第一个通过名为Mount Evans的IPU单元连接GPU实例的虚拟机，该单元由谷歌和英特尔联合开发。IPU允许A3虚拟机卸载网络、存储管理和安全功能，这些功能传统上是在CPU上完成的。

# 云计算