焕然一“芯”再铸算力辉煌 英特尔第四代至强持续赋能数据中心

云计算1年前 (2023)发布 aixure
63 0 0
导读:随着潘帕斯雄鹰阿根廷队时隔36年的再次夺冠,卡塔尔世界杯也在上个月正式落下了帷幕,除了球员们精湛的球艺之外,让人印象深刻的还有各类黑科技,比如配备了阿迪达斯悬挂系统的芯片足球,首次被应用到世界杯赛场的半自动越位识别技术(SAOT)等等。 这正是科…

随着潘帕斯雄鹰阿根廷队时隔36年的再次夺冠,卡塔尔世界杯也在上个月正式落下了帷幕,除了球员们精湛的球艺之外,让人印象深刻的还有各类“黑科技”,比如配备了阿迪达斯悬挂系统的芯片足球,首次被应用到世界杯赛场的半自动越位识别技术(SAOT)等等。

这正是科技改变生活的真实写照,而支撑这些黑科技正常运转的,正是被快速运算和流动的数据,诚然,作为信息时代发展的产物,数据已经成为了当下最具经济价值的资源。在数据量暴增、场景应用越来越复杂的当下,算力决定了数字化信息处理能力的强弱,也影响着小到生活方式,大到经济发展等方方面面。

这其中,数据中心自然“功不可没”,通过对数据的连接、传递、储存、运算,数据中心为我们对生活提供便利和帮助,也成为了社会发展中不可忽视的重要基础设施。身为数据中心平台和解决方案的技术引领者,英特尔也在上周,为整个数据中心行业带来了高度创新的全新平台:第四代至强可扩展处理器Sapphire Rapids。

虽说SapphireRapids的发布遭遇了一些波折,但毫无疑问的是,采用Intel 7制程工艺制造、具备全新芯片架构、集成高性能核、更多内核数量、满足业内高需求数据中心工作负载的相关加速器以及DDR 5、CXL 1.1、PCIe 5.0等先进技术的SapphireRapids,正是“加速无所不在”的最好诠释。

七大算力神器带来全新加速体验

仅仅依靠核心频率的提升和核心数量的增强,能够满足真实工作负载场景下对CPU性能的高要求吗?英特尔的答案是不可以,无论是行业应用的需求,还是真实世界的局限性都在印证着这点,基于长期而广泛的用户需求收集,英特尔也专门针对人工智能、5G网络、数据分析、科学计算等现代工作负载引入了全新的设计理念,并采用系统级的设计方法,在CPU芯片架构中内置了专用工作负载加速器,以提高性能和效率。

具体来说,在AI方面,加速深度学习实时推理和训练性能提升的英特尔AMX加速器标志着Sapphire Rapids的矩阵乘法运算性能得到了大幅提升,与上一代相比,第四代英特尔至强可扩展处理器将PyTorch实时推理和训练性能提升了10倍,将广泛的AI工作负载的推理和训练性能提升到了新的高度。

浪潮信息服务器产品部总经理赵帅在接受采访时介绍道:“当前AI主要分为两类应用,一类是基于GPU的重负载训练应用,另一类是轻负载的应用,不过这类应用也有两种处理方式,一种是把所有AI应用卸载到另外一个AI加速卡上,另一种是用一种平台解决所有问题,现在英特尔的第四代至强可扩展处理器在AMX加速器的加持后,本身CPU的AI处理能力已经达到了一个相当高的水平,这个时候客户就可以用一种平台,一种软件来解决所有问题,这其实对我们的价值是非常大的,因为可以保证客户可以只使用一种平台部署去解决中低负载的AI应用,并且取得很好的效果。”

除了浪潮信息这样的OEM厂商之外,火山引擎这样的CSP厂商也获得了实打实的AI加速能力提升,“从目前火山引擎的应用和算力来看,可以分为在线、离线和近线三类,其中近线推荐对AI的应用比较多,因为它也是数据密集型处理,但不是偏处理的模式,因此对延时有比较高的要求,这一类我们很早就用到了例如VNNI,还有现在的AMX一系列指令集做整体的优化。字节的转码、推荐,实际上都在很大程度上利用了英特尔在AI加速上的优势,并且均取得了良好的效果。”火山引擎云基础产品负责人罗浩总结道。

在网络方面,英特尔动态负载均衡器(DLB)则能加速处理网络数据系统并带来性能提升,具体来说,DLB支持在多个CPU内核及线程间高效分布网络工作负载,实现分布式处理,并在负载不平衡时,动态地将数据负载重新分配到各个CPU内核上,实现动态负载均衡。

不但如此,动态负载均衡加速器还可以调整CPU内核上同时处理的网络数据包的顺序,实现动态网络处理重排序,从而达到更高的整体系统性能。测试数据表明,与Istio入口网关软件在6核12线程上的工作性能相比,第四代英特尔至强可扩展处理器在相同吞吐量(RPS)下可降低96%延迟。与前一代处理器相比,在相同功率范围下,vRAN工作负载的容量提升高达2倍。

针对数据密集型工作负载的应用场景,英特尔也在第四代至强可扩展处理器中添加了数据流加速器(Intel DSA),以加快CPU、内存、缓存以及存储和网络设备之间的数据移动。应用将数据活动从CPU内核迁移到DSA专属加速器,可大幅释放CPU性能并降低时延,让用户可以更高效地管理CPU内核,提高利用率。测试数据显示,与ISA-L软件相比,内置IntelDSA加速器可使SPDK-NVMe的IOPs提高1.7倍;与上一代相比,大数据包顺序读取的IOPS提升60%,并降低37%时延。

英特尔存内分析加速器(Intel IAA)针对数据库和分析工作负载,可提高内存查询吞吐量,减少内存数据库和大数据分析工作负载的内存占用。是内存数据库、开源数据库和数据存储(如RocksDB和ClickHouse)的理想选择。与上一代相比,Intel IAA加速器可使RocksDB性能提高3倍。

此外,英特尔QAT加速器则能加速网络吞吐量以及压缩解压缩功能,可通过卸载加密、解密和压缩释放处理器内核,从而让系统能够支持更多客户端运行或实现降低能耗的目的。得益于英特尔QAT加速器,第四代英特尔至强可扩展处理器已成为为单一数据流压缩并加密数据性能最高的CPU。

安全能力方面,第四代至强可扩展处理器采用了全面的安全技术策略组合,具体来说,工作负载保护方面,通过SGX技术可以将敏感代码和数据保存到SGX飞地;英特尔密码操作硬件加速(Intel Crypto Acceleration)可以在每个时钟周期内处理更多加密运算,还可用于重载或连续加密;英特尔MRT技术则通过使用前沿的AI技术,预测并阻止内存故障的发生;最后平台安全启动功能则能确保平台引导到已知的良好状态。

最后,针对受内存带宽限制整体性能的现代工作负载,集成了HBM的英特尔至强CPUMax系列可以提供进一步的性能增强,值得一提的是,这是第一款也是唯一一款基于X86的高带宽内存(HBM)处理器,可支持高达64GB超高带宽封装内存。在最高56个CPU核心数量下,至强CPU Max也可以为每个CPU核心提供1.14GB的HBM容量,极大地提升系统级现代工作负载性能。测试数据显示,与上一代相比,英特尔至强CPU Max可使科学计算工作负载性能提高3.7倍。

“在英特尔第四代至强可扩展处理器上,加速器是一个非常大的重点,涵盖了包括人工智能、网络、数据处理等一系列重要负载,虽然大家普遍印象英特尔是一家芯片公司,但是我们也有上百上千的软件工程师,因为在已有的众多功能优化之上,如何让客户更好地使用这些指令,看到它们的性能并且得到收益是我们关注的。接下来一整年,我们会投入很多的软件服务以及客户合作,让更多中国的产业伙伴,无论是互联网厂商还是ISV伙伴,或是软件方面的合作伙伴,能够更好地运用第四代至强处理器的功能,这是我们未来的方向。”英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立总结道。

不过这里也要说明一下,在早些时候的英特尔ON技术创新峰会上,英特尔提出了英特尔按需服务(Intelon Demand),可用于扩展和/或升级大多数第四代至强处理器SKU中的加速器和硬件增强功能。

科技向善,第四代至强可扩展处理器助力可持续发展

作为英特尔迄今为止最具可持续性的数据中心处理器,第四代英特尔至强可扩展处理器为客户提供一系列功能,以优化产品功率和性能,旨在通过充分利用CPU资源助力其实现可持续发展的目标。

具体来说,在产品层面,通过丰富的内置加速器,意味着英特尔能够提供平台级的功率节省,并缓解对额外独立加速方面的需求,帮助客户实现可持续发展目标。此外,新的优化电源模式可以为某些工作负载带来高达20%的插槽节能,而对性能的影响仅有不到5%。另外,根据英特尔至强处理器的路线图,在未来的产品上,英特尔也会为能效专门定制一款产品,有望进一步提高能效比。

在运营减碳和制造减碳方面,英特尔也做出了承诺,即在整个第四代英特尔至强可扩展处理器芯片生产流程当中,不管它是来自于全世界的哪一个工厂,都能够保证80%以上的工厂能源都是绿能,此外风冷和液冷的创新也进一步降低了数据中心的总能耗,第四代至强可扩展处理器在英特尔工厂制造时,运用了超过90%的可再生电力,并同时配备了一流的水资源回收设施。

不但如此,随着“双碳”战略的确立,“新基建”“东数西算”等国家工程的推进,中国数据中心建设正朝着具有高能效、高算力、高技术、高安全的新型数据中心方向迈进,绿色计算已经成为可持续发展的关键动力,低碳节能正在重新定义未来数据中心的全新架构。

为此,英特尔和产业伙伴协力合作,积极参与了“东数西算”工程的8个国家节点,10个国家数据中心集群的筹备建设中。在一批具备技术领先性和产业示范性的标杆项目上,展开了深入的合作和前沿的探索。

经过多年的技术积累和探索,英特尔构建了完备的绿色数据中心解决方案矩阵,在数据中心电源效率与密度、先进制冷技术和基础设施智能化三个垂直领域,以及芯片、服务器、机架、数据中心基础架构四个水平方向,积累了丰富的解决方案和实践案例。

此外,英特尔也发挥自身优势,携手合作伙伴推动先进节能技术的普及化,促进行业参考设计的标准化,并加速前沿绿色技术的突破性探索、创新与应用。并在近日正式发布了首版OCP浸没式液冷液体规范Rev1.0,引入方法来评估单相和两相浸没式液冷液体,为浸没式液冷行业提供参考规范。

与此同时,英特尔将为在浸没式液冷场景下使用第三代和第四代英特尔至强可扩展处理器的客户提供1年保修的购买服务,英特尔也将是第一个为客户提供风冷解决方案以外保修范围的芯片供应商。

正如英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰所言,“英特尔立足技术创新、助力产业发展、繁荣生态建设,加速无所不在。而践行企业社会责任是英特尔公司战略的重中之重,'科技向善'不仅是英特尔的运营理念,更是深入到每位员工心中的价值观。”

结语

不难看出,第四代至强可扩展处理器承载着英特尔夺回数据中心领导力的野心,其性能表现和可持续性都展现出了强大的潜力。不但如此,其模块化架构让英特尔能够提供广泛的处理器,针对客户的使用场景或应用提供接近50个有针对性的SKU,其中包括从主流通用SKU到面向云、数据库和分析、网络、存储和单插槽边缘使用场景的专用SKU。目前第四代英特尔至强可扩展处理器已经出货并被诸多客户所采用,并获得了生态系统的广泛支持,包括阿里云、AWS、爱立信、安擎、百度智能云、宝德、超聚变、德晟达、戴尔、东软、烽火超微等公司。

虽说第四代至强可扩展处理器已经算是英特尔为数据中心领域祭出的大杀器,但很显然英特尔并不打算就此止步,凭借着强大的执行力,英特尔正在积极加注和推动产品路线图,目前未来几代服务器产品均展现出良好势头和里程碑式进展,其中Emerald Rapids正按节奏推进2023年的进展。在许多配置中运行多个操作系统的Granite Rapids,以及能效核产品Sierra Forrest,都在2024年的产品路线规划中稳步推进。

随着数据量的爆发式增长,算力需求也在持续增加,这让数据中心对处理器的性能也提出了更高的要求,可以看到的是,PCIe 5.0、DDR 5到CXL 1.1等底层技术升级正在驱动服务端的产业进行新一轮的迭代,第四代至强可扩展处理器的发布,既是英特尔XPU战略上的重要一环,也是“五大超级技术力量”引导下的产品标杆,更是支撑数据中心行业不断创新,加速千行百业云数智转型的最佳选择。

(8117367)

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...