中国AI大模型竞速:机遇当头与人潮汹涌

AI1年前 (2023)发布 aixure
31 0 0
导读:经济观察报 记者 钱玉娟 任晓宁实习记者 陶思羽 大模型最疯狂时的一张照片。日前出门问问CEO李志飞从极客公园创始人兼总裁张鹏的朋友圈盗图,并写下如上配文。那是2月12日,张鹏在他组的一个饭局上拍的。 短短两个月时间过去,照片中的多位科技圈企业家,相…

经济观察报 记者 钱玉娟 任晓宁实习记者 陶思羽

“大模型最疯狂时的一张照片。”日前出门问问CEO李志飞从极客公园创始人兼总裁张鹏的朋友圈“盗图”,并写下如上配文。那是2月12日,张鹏在他组的一个饭局上拍的。

短短两个月时间过去,照片中的多位科技圈企业家,相继涌入通用人工智能(AGI)的浪潮中,张鹏不禁在图片配文中感慨,这是“最早一批AGI信徒的聚会”。

饭局时李志飞感慨自己“过度兴奋和严重缺少睡眠”,用他自己的话说,“那时的我想不顾一切地学OpenAI搞法,去做大模型。”

然而,两个月飞逝而过,李志飞想法变了,4月10日,他说,自己变成了“大模型劝退派”。回看让他“冷静”下来的大背景:首先是当天,大模型领域不只“添丁”王小川,还有商汤科技发布了大模型体系,昆仑万维提早宣布“天工”大模型也将启动邀请测试;其次是在那之前,百度文心一言发布、阿里通义千问启动测试,华为盘古大模型与京东“ChatJD”大模型也已经“犹抱琵琶半遮面”。4月14日,腾讯也加入竞赛,推出新一代算力集群,用来训练大模型。

在社交媒体上,不少人将大模型比拟为当前科技互联网产业,一个新的“造梦场”,不同于其它的是,这个领域中的逐梦人,需要的是协同大于竞争。

从新冠疫情黑天鹅突袭到经济趋向复苏,整整三年过去,没想到在ChatGPT之后,一股竞赛风乍起,将中国AI创业这一池春水吹皱,甚至涌起一波浪潮。

一批人,涌入浪潮

“这是一个确定性的机会,如果输了,五年最高亏一百亿美金,但要是成了,20年赚一万亿美金。要是你,怎么选?”某科技上市公司CTO告诉记者,一家公司即便数据不够多,但有一定的资本、算力技术等资源,“是我,我也会选择做大模型。”

4月13日,知乎创始人兼CEO周源走上“2023知乎发现大会”的舞台,对外发布了联合面壁智能开发的中文大模型“知海图AI”。

两天前,4月11日晚,李志飞在朋友圈发出一张对于“AGI本人”的邀请函,预告出门问问将在月底进行AIGC相关战略发布。

周源、李志飞都曾在两个月前参加了一个饭局。2月12日,张鹏在一家日料店组了个局,赴约者就有李志飞、周源、搜索引擎搜狗的创始人王小川以及松果出行创始人翟光龙。

彼时席间,张鹏拍照留念并预言,“这是个有历史意义的照片。”当他4月10日将合影发在朋友圈时,坐在正中央、笑得灿烂的王小川官宣入局大模型创业,产品命名为“百川智能”。

有意思的是,就在王小川现身的搜狐网络大厦内,还有另外一个投身大模型创业的人,美团联合创始人王慧文。

“新办公室第一天,切个蛋糕。”4月6日下午,王慧文一则朋友圈发出,蛋糕上写着他创立的公司名“光年之外”,而定位地址正是搜狐网络大厦。记者了解到,王慧文一经宣布闯入AI大模型领域创业,其项目就获得VC认购高达2.3亿美金,之后美团创始人王兴还参与了公司A轮投资,出任董事。

资本青睐之外,王慧文的AI团队还吸引了搜狗输入法之父马占凯加入,后者甚至表示要“与公司共赴AGI通用人工智能的伟大征程”。

在王慧文官宣要做中国版OpenAI的前一天,极客公园的创业者社区“前沿社”进行了一场关于通用大模型的线上交流会,张鹏抛出观点称,“OpenAI正在展现出一场革命的开篇,这将是互联网和移动互联网之后,同等量级的产业变革。”

在与会者中发起投票时,王小川是第一个投票认同的人,之后他在参加张鹏的组局小聚中,还表达了入局决心。

在参加那场“AGI信徒的聚会”时,李志飞已经投身大模型相关创新研发很长一段时间。

百度是国内大厂第一个吃螃蟹的角色。3月16日,李彦宏在百度大厦内发布了文心一言,他当时的表现被外界评价为“略显紧张”。他说这是百度必须要去做的事。张勇担任阿里云智能CEO后的首度公开亮相,便是迎接这股AI浪潮,4月11日,他对外宣布阿里巴巴的所有产品,在未来都将接入“通义千问”大模型,进行全面改造,同时千行百业也将基于这一大模型,开发具备自己行业能力的“专属大模型”。

在百度、阿里之后,腾讯也有了大模型方面的动作。4月14日,腾讯发布面向大模型训练的新一代HCC(High-PerformanceComputingCluster)高性能计算集群。腾讯称,基于新一代集群,训练万亿参数的AI大模型,时间将缩短至4天。上一代训练时间为11天。

阿里在大模型方向上的动作,一度被称之为“CEO工程”。闻风而动的企业非常多,其中抓起这一“竞赛”项目的CEO中,软件工程专业出身的周源,让人多少有些意外。

在张鹏看来,“周源的思想很先进”,因为周源出现在那个“AGI信徒”的聚会中,外界对于知乎是否要闯入大模型领域倍加关注。周源的逻辑是,通过联合研发与战略投资的方式,与国内大模型团队面壁智能达成深度合作,4月13日也正式发布了两者合作推出的“知海图AI”中文大模型。

大模型,各有路径

并不是因为竞争危机,让李志飞发出“劝退”论,在他看来,“OpenAI那种不看ROI(投资回报率)而去探索AI天花板的做法,在中国没土壤,学不来。”甚至,他断言,在中国聚焦落地的大模型“将会有几十家而卷出天际,大概率跟上一代AI公司一样,商业化异常艰难。”

被李志飞一针见血指出的产业现实,确实“卷”得厉害。除了大厂,越来越多的中厂也在大模型的垂直应用领域“投石问路”。

4月9日,360集团创始人周鸿对外展示了360版的GPT大语言模型,公布了基于这一大模型开发的人工智能产品矩阵“360智脑”,落地搜索场景并面向企业用户开放内测。

周鸿称,未来,360智脑会与浏览器、数字助理、智能营销等场景应用结合。

4月10日,有赞推出了基于OpenAI的GPT-4大模型驱动开发的AI产品“加我智能”。

有赞创始人兼CEO白鸦透露,“加我智能”仅开发了一个月时间,目前只接入了一个厂商的大模型,未来会通过更多市场头部厂商的大模型合作,训练它的结果。

“不是所有企业都需要从头开始训练大模型。”阿里云智能CTO周靖人对记者表示,阿里云会为行业企业提供一个“一键生成”大模型的能力,在授权之下,去理解相关企业的各种模态数据。

周靖人告诉记者,阿里云希望进一步把技术门槛降低,能让更多的开发者参与进来。谈及技术路线,他观察“参赛者们”,“都在取长补短,大家在尝试不同的方向。”

创新奇智CTO张发恩最近就被多家制造工厂的负责人催促做研发,“他们对大模型技术跃跃欲试。”4月13日,创新奇智推出了工业大模型产品“奇智孔明”,并在两家制造业公司开启试验。

火热氛围下,伴随加入者增多,大模型产品也越来越多。趣丸网络副总裁庄明浩忍不住询问:有没有做国内大模型聚合站的?快记不过来了。随后有人给他发来了一个AI工具导航网址,里面聚集了上百个大模型平台和产品网址。

最近,李志飞总有一种“分裂”状态:既要思考大模型形而上学的“高贵”,又得接受其应用落地的“庸俗”。在他看来,一些大模型相关的学术问题至今没有被解决,不过是被大家从实用主义角度规避或近似解决了,“短期看,确实也没有更好的办法了。”

这番话说出第二天,李志飞作为大模型参赛选手之一,也敲定了其AIGC战略发布会的时间,4月20日,在这个被戏称为“大模型月”的阶段,他决定“让行业更卷”。

不过,李志飞希望劝退那些“因为FOMA而匆忙下场的创业者(包括大佬)。”记者询问获悉,“FOMA”即“FearofMissingOut(错过恐惧)”的缩写,特指一种营销策略,即通过制造“紧迫感”或“错过”的感觉,来促使人们参与某件事情。

代表着人类先进技术演进的AI行业不应如此,李志飞认为,大模型领域更需要有决心、热爱且擅长的人涌进来。

聚焦目前闯入的创业人,每个人都希望抓住机遇,成为其中的一个弄潮儿。

日前有入局者就国内大模型和OpenAI的差距发表言论而引发争议,一时间,入局者之间打起了口水战。

李志飞更希望未来同行,能够和睦共处,“找到自己的定位,为人类实现AGI以及AGI落地的事业,做出自己独特的贡献。”

道不同,亦可为谋

《ChatGPT:读懂人工智能新纪元》一书的作者、前沿科技领域作家陈根用非标准答案,测试了ChatGPT、文心一言和通义千问。在他看来,后两者相距前者,“还需要一段路要走,目前更不适合去谈对标。”

如果一定要打分,陈根觉得,国内两厂的大模型“在努力跨过及格线”,相较而言,国内已经发布的大模型都是在ChatGPT带来的压力下,快速推出的产品,“技术层面还不足以充分准备”,更大的差距是,ChatGPT已经公开销售,实现商业化,反观国内,陈根直言,“实验室产品,区别不言而喻”。

体验过多个国内产品后,互联网观察人士葛甲觉得,国内互联网公司并没有为此做好准备,都在匆匆上马。百度就是一个最明显的例子,文心一言上线已有月余,可产品依旧需要邀请码才能体验,未对公众开放。

4月中旬,国内上线的一系列大模型产品,同样都在内测,目前没有一款向公众开放。宣布接入大模型技术的国内大厂业务,同样没有对外开放。庄明浩认为,网信办发布《生成式人工智能服务管理办法(征求意见稿)》后,国内大模型产品的内测时间可能还会进一步延长。

庄明浩最近体验了国外大厂嵌入大模型技术的产品,比如微软的搜索引擎Bing,使用效果超出他的预期。除了传统搜索界面外,Bing界面右边有一个对话框,他打开一个英文报告,要求对话框总结报告要点。几秒钟后,一个详实简洁的中文总结完成了。

即便国内发展相对缓慢,大模型风潮并未受到影响,多位受访者透露,6月底之前,国内或将有50种类ChatGPT的产品问世,到年底,国内AIGC战局中的“参赛者”,甚至可能达到上百家。

一位AI上市公司技术负责人告诉记者,与2个月前相比,ChatGPT技术方面已经不是难题,当前包括GPT3.5在内的大模型技术都已经开源,这意味着创业公司不需从0起步,也能开发出自己的大模型。在这个赛道的技术层面,大厂和创业公司可以处在同一起跑线上。

“可能有的公司有一些技术储备,但绝大多数都是想搭上概念股东风,股价涨一涨,就完事了。”葛甲对此也表示理解,因为近期ChatGPT概念股的确表现很好,今年2月至今,昆仑万维公司涨了近2倍,360公司涨了1倍多,“资本市场上很久没找到强而有力的题材了,突然来了这么一个,一定要抓住机会。”

在资本逐利性的驱动下,产业内会萌生一种寻找下一个技术热点的冲动。陈根印象里,科技行业的大多数热点,往往是从华尔街或硅谷先引发,之后传导至全球资本市常

而今的大模型热潮也不例外,硅谷的一只蝴蝶扇动了翅膀,ChatGPT一经发布,科技大佬、创业者争相拥趸。

“这就如同互联网技术的出现一样,不主动,就会面临被动淘汰的危机。”陈根表示,谁率先突围成功,谁就有机会提前建立技术与应用的护城河与生态圈,进而被市场较早认可。

正因如此,在新技术、资本及企业求生欲,这三方力量驱动下,各厂涌入大模型,引发竞赛潮。

量子位联合创始人李根在AI产业深入观察多年,他更认可创新工场董事长兼首席执行官李开复对大模型的定位。

3月中旬,李开复也宣布亲自筹办新公司,成为众多创业者之一,当时他将“大模型技术变革驱动的浪潮叫做AI2.0。”李根认为,这是准确且有逻辑的判断,“这波浪潮就是AlphaGo为代表的AI1.0的延续。”

李根认为,区别于元宇宙等概念,大模型浪潮背后,会有关键技术对原有业态的颠覆式变革与创新。

人工智能产业是一个长坡厚雪的赛道,其中形成的大模型相关技术,既不是ChatGPT诞生时“一蹴而就”,也不是ChatGPT火爆后“一时兴起”,李根告诉记者,在此之前,大模型早就已经有近10年左右的蓄力、研究,自2018年以来,业内包括商汤科技、阿里等有实力的玩家,都开始在这个方向上进行投入、研究。

“GhatGPT火爆后,就像是一把火炬点燃起来。”李根看到,伴随更多的资源、人、关注度被投注到大模型领域,此前幕后的工作也推向台前,各大厂也开始用最大的资源加速。

竞逐赛,风险防范

在大模型领域,机遇会属于谁?风险又该如何规避?“就像是一场千团大战。”上述AI上市公司技术负责人以当年O2O领域的格局演变为例,各厂集体参战,但最终留在市场上拼杀的只有两极:美团和饿了么,基于此,他预判一年半时间之后,国内或会跑出三五家通用大模型平台,其余大部分都将不复存在。

李彦宏说,现在国内大厂都看好AI大模型,创业公司的机会很少,没有必要再重新发明一遍轮子。这一言论遭到了王小川的反驳,后者官宣入局大模型竞赛后表示,“历史上每次发生大的变化,都有创业公司的机会,并且创业公司会比大公司跑得快。”

技术不是本质差异化问题,最终考验的还是商业化落地能力。庄明浩觉得,行业走到后期,会和云服务的市场越来越像。“不会一家独大,而是每家都有自己擅长的领地和机会。”

李根把大模型比作发电厂,未来重要的是提供电能、输出电能……对比各家,随着时间推移,能体现各家特色的能力,完全取决于服务提供者的基因或背景。

中国社会科学院科学技术和社会研究中心主任段伟文认为,没有一家企业愿意错过颠覆式的技术浪潮,尤其是对中国企业而言,“错过可能意味着落后、掉队。”

机遇当头背后,有一把风险的达摩克利斯之剑悬于头顶。

在国内AIGC领域一片火热时,海外对模型训练的担忧和反对声音日渐加剧。

3月29日,特斯拉以及推特的CEO马斯克,与1000多名人工智能专家及行业高管签署联名信,呼吁暂停训练比GPT-4更强大的人工智能系统至少六个月,理由是这种系统对社会和人类构成潜在风险。

“中国一定要迎头赶上。”在周鸿看来,马斯克等人的请愿并不影响中国发展自己的大语言模型,一个现实是,“目前中国相关技术水平距离GPT-4至少还有两年差距”,他认为,现在担心风险为时尚早。

在大模型影响下,国内一些变化已经发生。4月12日,蓝色光标发布邮件,决定无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。此前,蓝色光标曾宣布将接入百度文心一言的能力。

更早之前,游戏行业也有人受到影响。3月2日,心动游戏CEO黄一孟发文说,和两个游戏团队聊天,团队一把原画外包团队给砍了,团队二把翻译外包公司给砍了,AI已经开始实际影响很多人的工作岗位了。

上述AI上市公司技术负责人表示,未来会有更多行业受到影响。ChatGPT面向两类人,一类是学会使用它的,一类是被它替代的。伴随ChatGPT的潘多拉魔盒开启,AI大模型这条路已经不可逆转。

段伟文认为,从技术上讲,安全治理不必采取特别措施,但在技术发展、探索的过程中,行业正陷入一个治理的悖论中,尤其涉及内容安全,一旦追求“绝对性”,大模型领域的创新便有了监管风险。

作为一种内容生成技术,“不能没有数据作为原料。”段伟文认为,AIGC是一种全新的内容生成方式,目前法律上对内容的侵权界定,早于这种使用形式之前提出,在他看来,国内要大力发展AIGC,或需重新界定内容使用的边界。

李根感慨,现在的信息技术文明,虽是人工智能浪潮里的一个小浪花,激起的却是千行百业甚至普罗大众对AI的新一轮认知。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...