中国AI大模型竞速：机遇当头与人潮汹涌

AI2年前 (2023)发布 aixure

76 0 0

导读：经济观察报记者钱玉娟任晓宁实习记者陶思羽大模型最疯狂时的一张照片。日前出门问问CEO李志飞从极客公园创始人兼总裁张鹏的朋友圈盗图，并写下如上配文。那是2月12日，张鹏在他组的一个饭局上拍的。短短两个月时间过去，照片中的多位科技圈企业家，相…

经济观察报记者钱玉娟任晓宁实习记者陶思羽

“大模型最疯狂时的一张照片。”日前出门问问CEO李志飞从极客公园创始人兼总裁张鹏的朋友圈“盗图”，并写下如上配文。那是2月12日，张鹏在他组的一个饭局上拍的。

短短两个月时间过去，照片中的多位科技圈企业家，相继涌入通用人工智能（AGI）的浪潮中，张鹏不禁在图片配文中感慨，这是“最早一批AGI信徒的聚会”。

饭局时李志飞感慨自己“过度兴奋和严重缺少睡眠”，用他自己的话说，“那时的我想不顾一切地学OpenAI搞法，去做大模型。”

然而，两个月飞逝而过，李志飞想法变了，4月10日，他说，自己变成了“大模型劝退派”。回看让他“冷静”下来的大背景：首先是当天，大模型领域不只“添丁”王小川，还有商汤科技发布了大模型体系，昆仑万维提早宣布“天工”大模型也将启动邀请测试；其次是在那之前，百度文心一言发布、阿里通义千问启动测试，华为盘古大模型与京东“ChatJD”大模型也已经“犹抱琵琶半遮面”。4月14日，腾讯也加入竞赛，推出新一代算力集群，用来训练大模型。

在社交媒体上，不少人将大模型比拟为当前科技互联网产业，一个新的“造梦场”，不同于其它的是，这个领域中的逐梦人，需要的是协同大于竞争。

从新冠疫情黑天鹅突袭到经济趋向复苏，整整三年过去，没想到在ChatGPT之后，一股竞赛风乍起，将中国AI创业这一池春水吹皱，甚至涌起一波浪潮。

一批人，涌入浪潮

“这是一个确定性的机会，如果输了，五年最高亏一百亿美金，但要是成了，20年赚一万亿美金。要是你，怎么选？”某科技上市公司CTO告诉记者，一家公司即便数据不够多，但有一定的资本、算力技术等资源，“是我，我也会选择做大模型。”

4月13日，知乎创始人兼CEO周源走上“2023知乎发现大会”的舞台，对外发布了联合面壁智能开发的中文大模型“知海图AI”。

两天前，4月11日晚，李志飞在朋友圈发出一张对于“AGI本人”的邀请函，预告出门问问将在月底进行AIGC相关战略发布。

周源、李志飞都曾在两个月前参加了一个饭局。2月12日，张鹏在一家日料店组了个局，赴约者就有李志飞、周源、搜索引擎搜狗的创始人王小川以及松果出行创始人翟光龙。

彼时席间，张鹏拍照留念并预言，“这是个有历史意义的照片。”当他4月10日将合影发在朋友圈时，坐在正中央、笑得灿烂的王小川官宣入局大模型创业，产品命名为“百川智能”。

有意思的是，就在王小川现身的搜狐网络大厦内，还有另外一个投身大模型创业的人，美团联合创始人王慧文。

“新办公室第一天，切个蛋糕。”4月6日下午，王慧文一则朋友圈发出，蛋糕上写着他创立的公司名“光年之外”，而定位地址正是搜狐网络大厦。记者了解到，王慧文一经宣布闯入AI大模型领域创业，其项目就获得VC认购高达2.3亿美金，之后美团创始人王兴还参与了公司A轮投资，出任董事。

资本青睐之外，王慧文的AI团队还吸引了搜狗输入法之父马占凯加入，后者甚至表示要“与公司共赴AGI通用人工智能的伟大征程”。

在王慧文官宣要做中国版OpenAI的前一天，极客公园的创业者社区“前沿社”进行了一场关于通用大模型的线上交流会，张鹏抛出观点称，“OpenAI正在展现出一场革命的开篇，这将是互联网和移动互联网之后，同等量级的产业变革。”

在与会者中发起投票时，王小川是第一个投票认同的人，之后他在参加张鹏的组局小聚中，还表达了入局决心。

在参加那场“AGI信徒的聚会”时，李志飞已经投身大模型相关创新研发很长一段时间。

百度是国内大厂第一个吃螃蟹的角色。3月16日，李彦宏在百度大厦内发布了文心一言，他当时的表现被外界评价为“略显紧张”。他说这是百度必须要去做的事。张勇担任阿里云智能CEO后的首度公开亮相，便是迎接这股AI浪潮，4月11日，他对外宣布阿里巴巴的所有产品，在未来都将接入“通义千问”大模型，进行全面改造，同时千行百业也将基于这一大模型，开发具备自己行业能力的“专属大模型”。

在百度、阿里之后，腾讯也有了大模型方面的动作。4月14日，腾讯发布面向大模型训练的新一代HCC（High-PerformanceComputingCluster）高性能计算集群。腾讯称，基于新一代集群，训练万亿参数的AI大模型，时间将缩短至4天。上一代训练时间为11天。

阿里在大模型方向上的动作，一度被称之为“CEO工程”。闻风而动的企业非常多，其中抓起这一“竞赛”项目的CEO中，软件工程专业出身的周源，让人多少有些意外。

在张鹏看来，“周源的思想很先进”，因为周源出现在那个“AGI信徒”的聚会中，外界对于知乎是否要闯入大模型领域倍加关注。周源的逻辑是，通过联合研发与战略投资的方式，与国内大模型团队面壁智能达成深度合作，4月13日也正式发布了两者合作推出的“知海图AI”中文大模型。

大模型，各有路径

并不是因为竞争危机，让李志飞发出“劝退”论，在他看来，“OpenAI那种不看ROI（投资回报率）而去探索AI天花板的做法，在中国没土壤，学不来。”甚至，他断言，在中国聚焦落地的大模型“将会有几十家而卷出天际，大概率跟上一代AI公司一样，商业化异常艰难。”

被李志飞一针见血指出的产业现实，确实“卷”得厉害。除了大厂，越来越多的中厂也在大模型的垂直应用领域“投石问路”。

4月9日，360集团创始人周鸿对外展示了360版的GPT大语言模型，公布了基于这一大模型开发的人工智能产品矩阵“360智脑”，落地搜索场景并面向企业用户开放内测。

周鸿称，未来，360智脑会与浏览器、数字助理、智能营销等场景应用结合。

4月10日，有赞推出了基于OpenAI的GPT-4大模型驱动开发的AI产品“加我智能”。

有赞创始人兼CEO白鸦透露，“加我智能”仅开发了一个月时间，目前只接入了一个厂商的大模型，未来会通过更多市场头部厂商的大模型合作，训练它的结果。

“不是所有企业都需要从头开始训练大模型。”阿里云智能CTO周靖人对记者表示，阿里云会为行业企业提供一个“一键生成”大模型的能力，在授权之下，去理解相关企业的各种模态数据。

周靖人告诉记者，阿里云希望进一步把技术门槛降低，能让更多的开发者参与进来。谈及技术路线，他观察“参赛者们”，“都在取长补短，大家在尝试不同的方向。”

创新奇智CTO张发恩最近就被多家制造工厂的负责人催促做研发，“他们对大模型技术跃跃欲试。”4月13日，创新奇智推出了工业大模型产品“奇智孔明”，并在两家制造业公司开启试验。

火热氛围下，伴随加入者增多，大模型产品也越来越多。趣丸网络副总裁庄明浩忍不住询问：有没有做国内大模型聚合站的？快记不过来了。随后有人给他发来了一个AI工具导航网址，里面聚集了上百个大模型平台和产品网址。

最近，李志飞总有一种“分裂”状态：既要思考大模型形而上学的“高贵”，又得接受其应用落地的“庸俗”。在他看来，一些大模型相关的学术问题至今没有被解决，不过是被大家从实用主义角度规避或近似解决了，“短期看，确实也没有更好的办法了。”

这番话说出第二天，李志飞作为大模型参赛选手之一，也敲定了其AIGC战略发布会的时间，4月20日，在这个被戏称为“大模型月”的阶段，他决定“让行业更卷”。

不过，李志飞希望劝退那些“因为FOMA而匆忙下场的创业者（包括大佬）。”记者询问获悉，“FOMA”即“FearofMissingOut（错过恐惧）”的缩写，特指一种营销策略，即通过制造“紧迫感”或“错过”的感觉，来促使人们参与某件事情。

代表着人类先进技术演进的AI行业不应如此，李志飞认为，大模型领域更需要有决心、热爱且擅长的人涌进来。

聚焦目前闯入的创业人，每个人都希望抓住机遇，成为其中的一个弄潮儿。

日前有入局者就国内大模型和OpenAI的差距发表言论而引发争议，一时间，入局者之间打起了口水战。

李志飞更希望未来同行，能够和睦共处，“找到自己的定位，为人类实现AGI以及AGI落地的事业，做出自己独特的贡献。”

道不同，亦可为谋

《ChatGPT：读懂人工智能新纪元》一书的作者、前沿科技领域作家陈根用非标准答案，测试了ChatGPT、文心一言和通义千问。在他看来，后两者相距前者，“还需要一段路要走，目前更不适合去谈对标。”

如果一定要打分，陈根觉得，国内两厂的大模型“在努力跨过及格线”，相较而言，国内已经发布的大模型都是在ChatGPT带来的压力下，快速推出的产品，“技术层面还不足以充分准备”，更大的差距是，ChatGPT已经公开销售，实现商业化，反观国内，陈根直言，“实验室产品，区别不言而喻”。

体验过多个国内产品后，互联网观察人士葛甲觉得，国内互联网公司并没有为此做好准备，都在匆匆上马。百度就是一个最明显的例子，文心一言上线已有月余，可产品依旧需要邀请码才能体验，未对公众开放。

4月中旬，国内上线的一系列大模型产品，同样都在内测，目前没有一款向公众开放。宣布接入大模型技术的国内大厂业务，同样没有对外开放。庄明浩认为，网信办发布《生成式人工智能服务管理办法（征求意见稿）》后，国内大模型产品的内测时间可能还会进一步延长。

庄明浩最近体验了国外大厂嵌入大模型技术的产品，比如微软的搜索引擎Bing，使用效果超出他的预期。除了传统搜索界面外，Bing界面右边有一个对话框，他打开一个英文报告，要求对话框总结报告要点。几秒钟后，一个详实简洁的中文总结完成了。

即便国内发展相对缓慢，大模型风潮并未受到影响，多位受访者透露，6月底之前，国内或将有50种类ChatGPT的产品问世，到年底，国内AIGC战局中的“参赛者”，甚至可能达到上百家。

一位AI上市公司技术负责人告诉记者，与2个月前相比，ChatGPT技术方面已经不是难题，当前包括GPT3.5在内的大模型技术都已经开源，这意味着创业公司不需从0起步，也能开发出自己的大模型。在这个赛道的技术层面，大厂和创业公司可以处在同一起跑线上。

“可能有的公司有一些技术储备，但绝大多数都是想搭上概念股东风，股价涨一涨，就完事了。”葛甲对此也表示理解，因为近期ChatGPT概念股的确表现很好，今年2月至今，昆仑万维公司涨了近2倍，360公司涨了1倍多，“资本市场上很久没找到强而有力的题材了，突然来了这么一个，一定要抓住机会。”

在资本逐利性的驱动下，产业内会萌生一种寻找下一个技术热点的冲动。陈根印象里，科技行业的大多数热点，往往是从华尔街或硅谷先引发，之后传导至全球资本市常

而今的大模型热潮也不例外，硅谷的一只蝴蝶扇动了翅膀，ChatGPT一经发布，科技大佬、创业者争相拥趸。

“这就如同互联网技术的出现一样，不主动，就会面临被动淘汰的危机。”陈根表示，谁率先突围成功，谁就有机会提前建立技术与应用的护城河与生态圈，进而被市场较早认可。

正因如此，在新技术、资本及企业求生欲，这三方力量驱动下，各厂涌入大模型，引发竞赛潮。

量子位联合创始人李根在AI产业深入观察多年，他更认可创新工场董事长兼首席执行官李开复对大模型的定位。

3月中旬，李开复也宣布亲自筹办新公司，成为众多创业者之一，当时他将“大模型技术变革驱动的浪潮叫做AI2.0。”李根认为，这是准确且有逻辑的判断，“这波浪潮就是AlphaGo为代表的AI1.0的延续。”

李根认为，区别于元宇宙等概念，大模型浪潮背后，会有关键技术对原有业态的颠覆式变革与创新。

人工智能产业是一个长坡厚雪的赛道，其中形成的大模型相关技术，既不是ChatGPT诞生时“一蹴而就”，也不是ChatGPT火爆后“一时兴起”，李根告诉记者，在此之前，大模型早就已经有近10年左右的蓄力、研究，自2018年以来，业内包括商汤科技、阿里等有实力的玩家，都开始在这个方向上进行投入、研究。

“GhatGPT火爆后，就像是一把火炬点燃起来。”李根看到，伴随更多的资源、人、关注度被投注到大模型领域，此前幕后的工作也推向台前，各大厂也开始用最大的资源加速。

竞逐赛，风险防范

在大模型领域，机遇会属于谁？风险又该如何规避？“就像是一场千团大战。”上述AI上市公司技术负责人以当年O2O领域的格局演变为例，各厂集体参战，但最终留在市场上拼杀的只有两极：美团和饿了么，基于此，他预判一年半时间之后，国内或会跑出三五家通用大模型平台，其余大部分都将不复存在。

李彦宏说，现在国内大厂都看好AI大模型，创业公司的机会很少，没有必要再重新发明一遍轮子。这一言论遭到了王小川的反驳，后者官宣入局大模型竞赛后表示，“历史上每次发生大的变化，都有创业公司的机会，并且创业公司会比大公司跑得快。”

技术不是本质差异化问题，最终考验的还是商业化落地能力。庄明浩觉得，行业走到后期，会和云服务的市场越来越像。“不会一家独大，而是每家都有自己擅长的领地和机会。”

李根把大模型比作发电厂，未来重要的是提供电能、输出电能……对比各家，随着时间推移，能体现各家特色的能力，完全取决于服务提供者的基因或背景。

中国社会科学院科学技术和社会研究中心主任段伟文认为，没有一家企业愿意错过颠覆式的技术浪潮，尤其是对中国企业而言，“错过可能意味着落后、掉队。”

机遇当头背后，有一把风险的达摩克利斯之剑悬于头顶。

在国内AIGC领域一片火热时，海外对模型训练的担忧和反对声音日渐加剧。

3月29日，特斯拉以及推特的CEO马斯克，与1000多名人工智能专家及行业高管签署联名信，呼吁暂停训练比GPT-4更强大的人工智能系统至少六个月，理由是这种系统对社会和人类构成潜在风险。

“中国一定要迎头赶上。”在周鸿看来，马斯克等人的请愿并不影响中国发展自己的大语言模型，一个现实是，“目前中国相关技术水平距离GPT-4至少还有两年差距”，他认为，现在担心风险为时尚早。

在大模型影响下，国内一些变化已经发生。4月12日，蓝色光标发布邮件，决定无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。此前，蓝色光标曾宣布将接入百度文心一言的能力。

更早之前，游戏行业也有人受到影响。3月2日，心动游戏CEO黄一孟发文说，和两个游戏团队聊天，团队一把原画外包团队给砍了，团队二把翻译外包公司给砍了，AI已经开始实际影响很多人的工作岗位了。

上述AI上市公司技术负责人表示，未来会有更多行业受到影响。ChatGPT面向两类人，一类是学会使用它的，一类是被它替代的。伴随ChatGPT的潘多拉魔盒开启，AI大模型这条路已经不可逆转。

段伟文认为，从技术上讲，安全治理不必采取特别措施，但在技术发展、探索的过程中，行业正陷入一个治理的悖论中，尤其涉及内容安全，一旦追求“绝对性”，大模型领域的创新便有了监管风险。

作为一种内容生成技术，“不能没有数据作为原料。”段伟文认为，AIGC是一种全新的内容生成方式，目前法律上对内容的侵权界定，早于这种使用形式之前提出，在他看来，国内要大力发展AIGC，或需重新界定内容使用的边界。

李根感慨，现在的信息技术文明，虽是人工智能浪潮里的一个小浪花，激起的却是千行百业甚至普罗大众对AI的新一轮认知。

# AI

文章版权归作者所有，未经允许请勿转载。

信通院何伟：AI新基建如何成为了数字化转型下的共识？

aixure

美15大巨头发出联合警告！敦促美国提高AI技能对抗中国

aixure

腾讯张正友：强人工智能之路很漫长需要找到新算法新技术

aixure

人类瞬间被秒杀，孙正义预测30年后AI智商将超1万

aixure

谷歌AI道德委员会解散如何让人工智能明辨是非？

aixure

奇货可居，人工智能专家今年格外紧俏

aixure

暂无评论

暂无评论...

中国AI大模型竞速：机遇当头与人潮汹涌

顶尖私募开着AI收割机进了A股韭菜地？AI大模型说不

生成式人工智能服务管理办法征求意见，AI语言模型如何规制？

相关文章

暂无评论

相关文章