对话|燧原推出中国最大AI计算芯片,三年两代技术刷新国内云端芯片纪录

云计算1年前 (2023)发布 aixure
53 0 0
导读:刚刚于上海落幕的 2021 世界人工智能盛宴办了四届,从第一到四届这段期间,堪称是人工智能与机器学习技术积累与需求同步快速成长的井喷期,更让 AI 芯片成为国内造芯的主战…

刚刚于上海落幕的 2021 世界人工智能盛宴办了四届,从第一到四届这段期间,堪称是人工智能与机器学习技术积累与需求同步快速成长的“井喷期”,更让 AI 芯片成为国内“造芯”的主战常

成立于 2018 年的燧原科技,是国内AI产业“算力爆发”的三年期间,耀眼的一颗明日之星。

日前,燧原刚刚完成 AI 训练芯片的二次迭代,发布了第二代 AI 训练产品“邃思 2.0” 芯片、基于邃思 2.0的 “云燧 T20” 训练加速卡、“云燧 T21” 训练 OAM模组,以及全新升级的“驭算 TopsRider”软件平台、全新“云燧集群 CloudBlazer Matrix”,是国内首家发布第二代 AI 训练产品的企业。

邃思 2.0 是目前中国最大的 AI 计算芯片,这次新产品的亮点在于架构上的革新。

值得注意的是,燧原这次发布的邃思 2.0,是国内第一个支持最先进高带宽存储器 HBM2E 的产品,搭载了 4 颗三星的 HBM2E。HBM对于人工智能、高性能计算HPC、超级计算机而言,是一种最佳的内存解决方案。

邃思 2.0 在算力规格上也获得显著提升,是国内第一个支持TensorFloat-32(TF32)数据精度的AI芯片。

TF32 是 Nvidia A100 GPU中,用于处理矩阵数学的新数学格式。矩阵数学也被称为张量计算,是AI和部分HPC应用主要使用的计算。与Volta GPU上的单精度浮点数学(FP32)相比,在 Nvidia A100 GPU Tensor核心上运行的TF32可提供高达10倍的加速。

这次燧原选择采用 TF32 数据精度,反映着背后的技术路线大力追赶国际大厂步伐的决心。

高举高打大芯片路线确立

燧原创立时的初衷,就是奔着“大芯片”来的。

当时燧原在考虑了 CPU、GPU、AI 芯片后,最后定下 “锁定数据中心、切入 AI 训练芯片” 这个高举高打的路线。

这是一条艰辛的道路,不单是 AI 芯片本身研发具备高复杂度,更需要用到先进工艺技术,会导致流片成本非常高,很多新创公司都未有胆识走上这一条路。

但考虑到国际大厂在 CPU 和 GPU 领域扎根数十年,已建立了厚实的技术根基、生态系统和客户积累。燧原要走出一条成功之路,与中国具优势的 AI 算法紧密结合,赢面最大。

之后,见到越来越多玩家进入 AI 训练芯片领域,这也代表燧原当初的眼光正确,且已占据先发者优势,领先竞争对手至少两年之久。

不过,正确的道路,也让挑战者越来越重磅。市场一直有云计算厂商自研芯片的讨论,如今又有字节跳动入局云端芯片的传闻,燧原这类的云计算芯片的厂商是否会遇到强敌?

燧原科技创始人及 COO 张亚林对《问芯Voice》指出,云端计算平台厂商不仅提供中立产品更带来泛化性支持,市场对于通用泛化性的需求正在提升,国际厂商的市场表现便是论证。

相比在发布第一代产品时,纯粹发布软件、芯片和板卡,燧原在此次发布会上也展示了绿色一体化超算智能集群。

张亚林谈到当今的人工智能市场需要怎样的产品,他认为,“不应再用芯片这样的维度,而是应该从客户的角度来看产品。”

他进一步指出,用户使用的计算系统包含基本的板卡、CPU、互联、存储和软件,AI 芯片只是一个部分。对客户而言,算力不等同于 AI 芯片,而是关乎客户真正拿到手里的算力。客户需要的是算力,公司交付的是系统级解决方案。因此,公司定位于云端技术平台提供商,而非 AI 芯片厂商。

张亚林也认为,AI 市场一直都要求供给方从系统角度看问题。同时,市场对系统化、集成度的要求越来越高。

他也强调,“客户关心的是系统和软件是不是好用、易用可迁移,能够商业化落地的公司在讲解决方案,不谈芯片谈系统,可以提供满足客户需求的集群,燧原此次发布的新产品组合即是这一战略的印证。

商用落地:AI赛道的最大门槛

近年,人工智能赛道持续火热,但在二级市场的名声却不太好。究其原因,不少 AI 企业商业模式不清晰,缺乏真实需求和可持续收入。

有投资人在接受《问芯Voice》采访时表示,一些公司并不是在做科技产业创新,而是在做科研创新,既没有产业化产品,也没有可持续的收入。

作为创业公司,燧原一直将商业落地和产品研发放到同等重要的位置,也被业内寄予了云端芯片赛道首家业务规模化公司的厚望。

燧原发布的第二代训练芯片邃思 2.0,以及产品云燧 T20 和 T21,已经在国内率先步入第二代训练产品。更为重要的是,燧原在 2020 年 9 月实现训练产品的商业化落地并实现了第一笔收入。

燧原科技 CEO 赵立东在发布会上介绍:第一代产品商业化有些已经落地,有些正在过程当中,这将形成公司今年的收入;随着我们第二代产品的发布以及人工智能赋能各个传统行业的提速,公司各个业务落地场景也会加速扩大。

在发布会上,上海集成电路产业投资基金董事长沈伟国表达期许:希望燧原成为云端 AI 芯片领域第一家业务规模化的公司。

事实上,AI 芯片实现业务规模化的说法并不新鲜,其关键在于如何量化。

燧原已经握有先发优势,未来跑通落地之路又将采用怎样的方法?

以智慧金融为例,燧原已和上海银行签署战略框架合作协议,基于明确的金融应用场景,提供算力及其配套软件等。

燧原也会和浪潮这样提供标准或定制服务器的企业合作,一同构建超大规模的液冷智能数据中心,以响应国家“低碳算力”和“绿色一体化智能计算”的战略方向。

发力新基建,未来的收入来自这些市场

今年,工信部发布《全国一体化大数据中心协同创新体系算力枢纽实施方案》,以绿色集约、自主创新、安全可靠三大关键词说明了新基建市场的发展趋势。

燧原科技最新发布的云燧计算集群即着眼于这一市场,云燧集群包含邃思 2.0 芯片、云燧CloudBlazerT20和T21、以及驭算软件 TopsRider2.0。张亚林指出,“CloudBlazer Matrix” 的发布,可以有效降低人工智能超算集群的整体复杂度和成本,意味着燧原科技正式用集群化的产品登上新基建舞台。

在这两年出现的“国产替代”的趋势之下,相较于国际厂商,本土厂商又有哪些优势?

张亚林分析,本土厂商相较于国际供应商更具有性价比优势,这一优势主要在性价比、能效比和部署三方面呈现。

他认为,适应绿色计算的诉求也要用系统思维,例如液态冷冻技术能带来绿色环保的冲击,而云燧 T20 和 T21 可以提供高密度的集群化算力。

此外,还要考虑部署时间、易用性等关乎中后期成本的因素。

据介绍,基于云燧 T20 和 T21 训练产品、GCU-LARE 互联技术和新一代驭算,燧原打造的超大规模的集群产品可以有效降低人工智能超算集群的整体复杂度和成本,同时通过与合作伙伴的联合开发,一起构建超大规模的液冷智能数据中心,以响应国家低碳算力和绿色一体化智能计算的战略方向。

整体来看,燧原未来将着重面向泛互联网、传统行业(金融、交通、电力、医疗、工业等)以及新基建三大业务方向发力。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...