“大装置+大模型”战略:助力商汤迅速获取生成式AI商业化果实

导读:从技术到具体的应用场景,生成式AI正在全球卷起一股浪潮。一组预测数据显示,2035年生成式人工智能有望在全球贡献近90万亿元(人民币,下同)的经济价值,其中,我国将突破30万亿元,占比超过四成。 不难想象,一轮新的竞赛正在科技领域展开,众多涌入者想要…

从技术到具体的应用场景,生成式AI正在全球卷起一股浪潮。一组预测数据显示,2035年生成式人工智能有望在全球贡献近90万亿元(人民币,下同)的经济价值,其中,我国将突破30万亿元,占比超过四成。

不难想象,一轮新的竞赛正在科技领域展开,众多涌入者想要抓住的是,生成式AI狂飙突进背后带来的跃升机会。从AI1.0向AI2.0演进,全球领先的人工智能软件公司商汤集团股份有限公司(下文简称“商汤”)成为立于潮头的那个。

3月26日,在商汤亮出的2023年成绩单中,生成式AI业务收入达12亿元,同比增速高达200%。这不仅是商汤成立十年以来,以最快速度实现从无到有,取得超过10亿收入体量的新业务,更成为业界迅速获得生成式AI商业化果实的范本。

“商汤生成式AI业务的增长,得益于各行各业对大模型的训练和推理的广泛需求。”在商汤科技董事长兼CEO官徐立看来,中国硬科技投资的新周期正式开启,而商汤能踏准这一关键的机遇点,则是基于其前瞻性的基础设施设计,通过“大装置+大模型”的深度协同,推动了自身“日日新SenseNova”(下文简称“日日新”)大模型体系的迭代,模型能力领先下更加速了生成式人工智能的商业化进程。

新的增长曲线

原本收入构成由智能城市、智慧商业、智慧汽车、智慧生活四大业务支撑的商汤,在一年前进行了重构。

2023年3月,商汤宣布将以AGI作为核心战略目标,以SenseCore AI大装置(下文简称“大装置”)作为大模型生产的核心平台,以商汤AIDC人工智能计算中心平台作为大算力AI基础设施能力,既打造具备通用能力的多模态大模型,也将深入垂直行业开发专业大模型,从根本上降低模型的应用门槛,同时让生成式AI技术实现普惠。

基于新的目标和使命愿景,商汤将其业务板块划分为生成式AI、传统AI和智能汽车,并以生成式AI业务作为重点发展方向,同时保持其传统AI业务和智能汽车的优势。

徐立说,“生成式AI对商汤来说,已不仅仅是技术领域的变革行创新,更成为公司的核心业务。”这并非一句口号,商汤践行变革的决心之大,从其系列动作中得以窥见。

自去年4月公布“日日新”大模型体系以来,短短三四个月时间里,便实现了2.0与3.0版本的升级,而其自研的中文语言大模型应用平台“商量”,不仅发布了不同参数量级的模型版本,还可以适配移动端等不同终端及场景的应用需求。与此同时,商汤大模型在去年8月首批通过《生成式人工智能服务管理暂行办法》备案,生成式AI商业化得以迅速推进,广泛服务于公众和企业客户。

今年2月,“日日新”大模型体系的4.0版本面市,其模型能力在代码编写、数据分析、医疗问答等多个场景下可达到与GPT-4相匹配的水平。

值得关注的是,自2015年起,商汤便与全球几乎所有头部安卓手机厂商以及主流车厂合作,至今赋能了超过20亿台手机和上百万台汽车,而今可以看到,像“绝影”智能汽车业务实现收入4亿元人民币,同比增长31%。

可以看到,智能汽车业务稳步增长之余,传统AI业务也为商汤发展端侧生成式AI业务提供了广阔的空间。通过构建业界领先的终端小模型,商汤挖掘着更多新的场景应用,短短一年时间,生成式AI业务成长为一条新的增长曲线。

得益于在基模型、多模态、编程和工具调用、百万字无损上下文、终端小模型上,都达到国内领先水平,商汤的生成式AI业务在商业化方向上迈出了坚实步伐。

通过推出“模型即服务”商业模式,商汤使得客户能够轻松地在大装置微调和调用各类生成式AI能力,数据显示,生成式AI业务中有超70%的客户,成为企业在过去12月内的新客户,其中,数十家客户的订单金额超过千万人民币。

另据财报显示,“日日新”大模型体系在C端的调用量,过去半年呈现出近120倍的增长,而商汤的典型客户来自各行各业,比如三大运营商,招商银行、海通证券等金融机构,京东、小米、阅文等头部互联网公司,HiDream.ai、澜舟科技等创业公司、清华大学、上海交通大学等学术机构。

基建深度协同

业务实现爆发式增长,商汤自然有其核心优势。其实,早在AI 1.0时代,商汤就凭借其在感知智能、决策智能领域近十年的创新研发积累,实现了多模态数据的储备,从而强化了其基础模型对物理世界的理解和多模态能力。

当然,要实现AI 2.0的突围,支撑“日日新”大模型体系得以高速迭代至4.0版本的关键,在于商汤打造的高效率、低成本、规模化的AI基础设施。

据悉,商汤AI大装置中包含了AI原生基础设施层、深度学习平台层、算法模型层,打通了算力、平台、算法。那么,如何通过“大装置+大模型”协同,在商汤的AI进化中发挥效应呢?

过去一年,商汤大装置的总算力规模实现突破性增长达12,000 petaFLOPS,使得运营GPU数量达45,000卡,进而支持了模型在多个场景中传统AI业务领域积累的客户资源和场景运用。

基于大装置,商汤将不同技术层集中建设、按需调配,从而为千行百业提供解决方案,降低AI模型应用的边际成本,将领先的AI技术下沉到关键垂直领域中。换言之,当全球乃至中国展开一场模型竞赛,商汤遵循尺度定律,采取“大装置+大模型”的协同策略,集中资源,支持自身试错的同时,不断推进大模型实现高速迭代,同时将其模型能力及经验散播至千行百业的客户中去。

一直以来,商汤都在坚持AI技术的原始创新研究,尤其在生成式AI的赛道上,坚持原创大模型技术的同时,它还选择将大装置开放给客户,为市场提供业界性能领先的AI基础设施和模型选择。

例如通过服务包括中国银行、招商银行、中国工商银行等金融行业巨头,赋能上海交通大学医学院附属新华医院、瑞金医院以及郑州大学第一附属医院等机构,以及与金山办公等头部科技合作,商汤的“日日新”大模型体系在金融、医疗、Copilot助手、拟人交互、智能终端等关键领域,相继确立了其应用价值和领先地位。

基于高计算密度、高能效芯片的协同发展,商汤已经看到“日日新”大模型体系在算力和数据规模的“协同”下,能力稳步提升,生成式AI业务更是飞速增长,未来更释放出一股潜力势能。

AGI的目标愿景之下,让身处竞逐中的商汤,为进一步提升和保障其大模型体系的能力,更为注重发展其算力大装置。在覆盖上海、深圳、广州、福州、济南、重庆等地,设立计算节点的基础上,商汤预计年内将会更大面积地拓展全国的算力节点,输出更丰厚的“新质生产力”外,实现全国联网下对算力的统一调度,支持更高规模参数的大模型研发与生产。

战略长期聚焦

2023年,自商汤“日日新”大模型发布以来,其能力每隔三个月就会实现显著提升,而在年报中,商汤方面透露,预计今年4月份将发布“日日新”5.0版本,其性能更是全面对标GPT4-Turbo。

徐立总结,在尺度定律的指引下,大模型正处于技术革命与性能提升的黄金时期。如此机遇,商汤又怎能错过?

2023年,商汤成功实现了从生成式AI大模型的研发到商业化应用的闭环,成为国内最早在生成式AI领域突破10亿人民币收入规模的公司之一。生成式AI已经成为商汤的核心业务。

展望未来,商汤预计生成式AI业务仍会保持长期增速,并将在2024年内实现收入再翻一番,甚至在新的财年里,其收入会在公司总收入中占据半壁江山。为此,商汤决定长期聚焦生成式AI这一核心业务,全力推动其盈利,不单单为商汤带来较为显著的现金流改善和亏损收窄,还要确保公司在AI 2.0的突围赛中抢占优势地位。

锚定生成式AI,商汤是经过了“大装置+大模型”战略协同与商业实践的相互印证,为实现下一步发展,它还明确了两大宗旨:一是在技术领域与全球领先的科技力量保持同步,二是促进商业实践的快速落地,实现价值的有效循环。

在生成式AI备受瞩目之时,商汤早早抓住各行各业对大语言模型训练和推理的需求,通过深化“大装置+大模型”协同效应,在各业务层面深入融合生成式AI能力,为客户低成本解锁通用人工智能任务能力的同时,更近一步高效率、规模化的推动着AI创新应用的发展和落地。

正如徐立所判断的,中国硬科技产业一个全新的周期开启,而商汤正通过跑通生成式AI的商业价值闭环,真正朝着人工智能进入工业化发展的2.0阶段迈近。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...