财联社7月23日讯(编辑 若宇)英伟达凭借着GPU“一家独大”,越来越多的企业试图紧随其后抢占AI芯片的“蓝海”。马斯克近日称特斯拉正自研芯片,但不会叫做GPU或是100s、H100s等,Dojo2将向大模型方向发力。稍早前英特尔推出“中国特供版”Gaudi2芯片,性价比超H100,其与浪潮信息联手开发AI服务器,Gaudi2国内首批还将与百度智能云、紫光新华三、超聚变等公司合作。
业内普遍认为,英伟达想要守住这块蛋糕并非易事。长城证券侯宾7月13日研报指出,我国AI芯片市场与海外相比未来三年增速较高,存在较大的发展空间,市场空间广阔。据招商证券张夏7月18日研报预测,2025年我国AI芯片市场规模将达1780亿元,较2022年增长近100%,2021-2025年我国AI芯片市场规模CARGΪ42.9%,快于同期全球市场规模增速(32.1%)。
按市场格局划分,目前在AI芯片领域有三类玩家,其一是以英伟达、AMD为代表的老牌芯片巨头,近年来都进行了巨资收购,以增强其人工智能产品线的实力;其二是以Google、百度、华为为代表的云计算巨头,纷纷布局通用大模型,并自研AI芯片支持其发展;其三是AI芯片独角兽,如寒武纪、壁仞科技、地平线等。据IDC数据,2022年中国AI加速卡出货量约为109万张,其中英伟达在中国AI加速卡市场份额为85%,华为市占率为10%,百度市占率为2%,寒武纪和燧原科技均为1%。
AI芯片市场百舸争流:英伟达A800价格大涨下国内企业“火拼”GPU谋出路 寒武纪扛起国产AI芯片大旗却仍走不出连年亏损困境
今年AIGC市场带热GPU,旺盛需求下,GPU始终供不应求,其紧俏程度让不少终端企业感到焦头烂额。优刻得7月3日在投资者互动平台表示,公司订购的GPU目前陆续到货,对公司贡献有限,剩余GPU的交付时间和数量存在不确定性;浪潮信息上周披露半年报预告,公司预计上半年归母净利润2.86亿元至3.82亿元,同比下滑60%至70%,营收同比预降30%,主要受全球GPU及相关专用芯片供应紧张等因素的影响。
“一切都在等英伟达”,某AI公司高管告诉财联社记者,其公司在4月下单了服务器产品,但是因为服务器公司的GPU尚未到货,至今没有准确交货期,“现在再签服务器合同都是没有违约条款,不签货期的,只能选择等或者直接取消订单”。
祸不单行的是,近日GPU市场再度迎来风暴,一方面,英伟达A800一周涨价超30%,甚至有价无市,联想集团在MWC上海展上称,搭载A800芯片的高端服务器交期10个月;另一方面,据上月底美媒引述两位知情人士爆料,美国商务部最早将于7月要求停止向中国客户提供英伟达和其他芯片公司生产的芯片产品。
业内透露,A800的紧缺除了需求旺盛、政策因素,还有英伟达自己的“私心”,“英伟达目前也在减少A800的出货,推更赚钱的H800”。一颗H800的单卡GPU价格高达20余万元,远高于涨价后的A800,今年6月开始,H800正式大规模推广。
在此背景下,不少人关心国内GPU企业未来会否有机会分一杯羹。天数智芯董事长盖鲁江谈到,事实上,不管英伟达的产品能不能卖给中国,我们的产品已经能够用起来了。芯谋咨询分析师商君曼表示,对国产GPU发展整体持比较积极的态度,但是目前国内外产业链在设计、代工、生态软件平台方面都存在一定差距。
据财联社不完全统计,在GPU领域有所布局的A股上市公司包括景嘉微、芯原股份、航锦科技、卓翼科技、好利科技、全志科技和通富微电等,具体如下:
作为“科创板AI芯片第一股”的寒武纪此前在互动平台回复,公司设计、研发的智能芯片不属于GPU,是面向人工智能领域专门设计的芯片。智能芯片的性能和能效优势主要集中于智能应用,在人工智能领域可以替代GPU芯片,但不适用于人工智能之外的其他领域。
值得注意的是,5月25日,英伟达发布2024财年第一季度财报,营收71.9亿美元,同比下降13%,但依旧超出市场预期的65.2亿美元,Q2营收指引107.8亿-112.2亿美元;净利润同比增长26.3%至20.43亿美元。与英伟达业绩形成鲜明对比的是,寒武纪2023年一季度净亏损2.55亿元,去年同期亏损2.87亿元。
事实上,自2019年以来,寒武纪净利润始终处于亏损状态,或受此影响,股价上市至今累计最大跌幅高达84.35%。公司曾在2022年年报中表示,高质量的研发投入是芯片行业实现长远发展的坚实基础,2022年全年,寒武纪研发费用高达15.23亿元,同比增长34.11%。
国产AI大算力芯片换道狂飙?英特尔、华为等全球玩家加速布局存算一体
就目前炒热的AIGC大模型所需的大算力AI芯片来说,能否通过现有的技术途径来开发性能上可以与英伟达GPGPU对标的AI芯片呢?一些“守正出奇”的技术包括:软件定义芯片、chiplet、3D堆叠和先进封装、存算一体等。业内分析,只有深度整合计算、存储、网络和软件资源,加快数据共享和融合,才能更好地支撑计算,进而充分挖掘数据价值。
7月14日,华为发布大模型时代AI存储新品“OceanStor A310深度学习数据湖存储”。该产品面向基础/行业大模型数据湖场景,实现从数据归集、预处理到模型训练、推理应用的AI全流程海量数据管理。其可以实现多协议无损互通,简化数据归集流程;通过近存计算实现近数据预处理,减少数据搬移,预处理效率提升30%。
所谓近存计算(PNM),便属于存算一体,后者也被称为“AI算力的下一极”,方正证券认为其有望成为继CPU、GPU之后的算力架构“第三极”。除了华为之外,国内外众多企业都已开展存算一体技术研发,包括英特尔、IBM、SK海力士、美光、三星、台积电、阿里等大厂,几乎都在布局PNM;而知存科技、亿铸科技、智芯科等初创公司,押注PIM(存内处理)、CIM(存内计算)等“存”与“算”更亲密的存算一体技术路线。
在ASIC芯片的弱通用性难以应对下游算法的快速演化、GPGPU受制于高功耗与低算力利用率的大背景下,存算一体芯片凭借着低功耗但高能效比的特性,正成为芯片赛道冉冉升起的一颗新星。据财联社不完全统计,涉及存算一体的A股公司包括东芯股份、恒烁股份、罗普特、首都在线、长电科技、澜起科技和润欣科技等,具体如下:
一级市场方面,存算一体也是近两年芯片投资最热门的赛道,据睿洞察统计,亿铸科技、知存科技等七家存算一体玩家,备受资本青睐。值得注意的是,存算一体赛道下的四家初创公司亿铸科技、知存科技、苹芯科技、后摩智能,已连续两年获得融资。
分析人士认为,GPU跟存算是合大于竞的关系:GPU作为目前最成熟的方案,不能放弃,需要有一批公司扛着,来正面刚;而存算属于包抄穿插进攻,打破国外技术壁垒,实现新技术的换道超车。
展望未来,业内指出,中国的算力已经成为一个越来越稀缺的资源,为了满足大模型对大算力的需求,算力集群化将是未来趋势。在2023世界人工智能大会上,华为宣布腾AI集群全面升级,集群规模从最初的4000卡集群扩展至16000卡,拥有更快的训练速度和30天以上的稳定训练周期。基于腾AI,原生孵化和适配了30多个大模型,到目前为止,中国有一半左右的大模型创新,都是由腾AI来支持的。
(财联社 若宇)