就在刚刚!备受全球瞩目的权威AI基准测试MLPerf公布了今年最新的推理测试榜单。浪潮AI服务器NF5488A5一举创造18项性能纪录,问鼎最强“AI机王”。
也许你不知道MLPerf在当前全球AI发展中意味着什么,它可谓是最具影响力的AI计算基准评测组织,由图灵奖得主大卫帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立,每年组织全球AI训练和AI推理性能测试并发榜。
浪潮AI服务器NF5488A5在此次测试中战绩彪炳,一举创造18项MLPerf推理性能新纪录,成为创纪录最多的AI服务器。
浪潮NF5488A5创造18项MLPerf推理性能纪录
今年的测试中,数据中心AI性能最受关注,全部参与机构提交了507项性能测试数据。浪潮NF5488A5创下了数据中心22个赛项中的13项性能纪录,以绝对优势领先。而在此前的MLPerf训练榜单中,NF5488A5在最核心的Resnet50训练任务中也创下了性能新纪录,单机性能高居榜首!
在这次基准测试中,浪潮AI服务器NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50基准性能测试中,均表现优异,相比2019年MLPerf推理榜单的服务器最好性能提升高达3倍。
MLPerf ResNet50推理性能2019 VS 2020对比
NF5488A5还是这次MLPerf全球竞赛中唯一可以在4U空间内支持8块安培架构A100芯片实现NVLink高速互联的AI服务器。
浪潮NF5488A5在系统拓扑上采用了超低延迟设计,支持PCIe 4.0全链路极致优化,高频通信单元采用一级拓扑最近连接,最大限度提升处理器到AI芯片间的通信性能。
在这次基准测试中,浪潮展示出了卓越的AI计算软硬件协同优化能力。
硬件层面,通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;
软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展;
深度学习算法层面,结合GPU Tensor Core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化,在精度无损的情况下性能提升近2倍。
忍不住为浪潮点赞!作为全球领先的AI计算领导厂商,浪潮AI服务器在中国的市场份额已连续三年保持在50%以上,市场的肯定便是浪潮AI服务器实力的最好证明!