每经记者:杨煜每经编辑:文多
历经数月的热议和期待,国产大模型于近日进入密集发布期。
4月11日,阿里云峰会在京召开,首次对外公开展示了其自研大语言模型“通义千问”。前一天(10日),商汤(HK00020,股价3.00港元,市值1104亿港元)和昆仑万维(SZ300418,股价48.03元,市值571亿元)接连宣布了旗下大模型,分别为“日日新SenseNova”大模型体系和“天工”3.5。4月9日,三六零(SH601360,股价16.36元,市值1169亿元)的“360智脑”落地搜索场景,面向企业用户开放内测。
随着国产大模型竞争加速,政府部门开始重视对于AIGC的监管。4月11日,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见,国家对AIGC的监管治理已经提上日程。
在此背景下,竞争与风险已成为AI领域新的热门主题。AI赛道熙熙攘攘,企业如何脱颖而出?
当大模型不再稀缺
ChatGPT火速出圈后,国内大模型也“赛事”吃紧。短短2个月内,已有数个国产大模型登台亮相。
3月16日,百度率先发布大语言模型“文心一言”。在发布会现场,李彦宏对发布时间进行了解释:是需求推动了文心一言的面世百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。
而其余厂商的步子也紧紧跟上。尤其在近日,国产大模型呈现密集发布的态势。
4月9日,三六零官方正式宣布,基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。
4月10日,商汤科技发布“日日新SenseNova”大模型体系,覆盖自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。同日,昆仑万维宣布,与奇点智源合作自研的国产大语言模型“天工”3.5发布在即,并将于4月17日启动邀请测试。
4月11日,阿里云峰会上,阿里巴巴大语言模型“通义千问”正式亮相。阿里巴巴集团董事会主席兼首席执行官、阿里云智能集团首席执行官张勇表示,未来阿里巴巴所有产品都将接入“通义千问”大模型,进行全面改造。
新一轮AI风口来临,掘金者步履不停。但入局门槛之高也引人注目。
模型越大,对算力的要求越高。在人工智能大模型技术高峰论坛上,浙江大学人工智能研究所所长吴飞表示,算力方面,ChatGPT的训练门槛是1万张英伟达V100芯片、约人民币10亿元,模型训练算力开销是每秒运算一千万亿次,需运行3640天。
计算机科学家、自然语言模型专家吴军在得到直播间谈及ChatGPT的训练成本时介绍:“大概可能是3000辆特斯拉的电动汽车,每辆跑到20万英里,把它跑死,这么大的耗电量,才够训练一次,这个非常花钱的一件事”。
图片来源:视频截图
“ChatGPT这样的东西,我很赞成百度的李彦宏讲的,全国有一两家搞就行了,”前述人工智能大模型技术高峰论坛上,中国工程院院士潘云鹤表示,“我们要瞄准的是它没有到的那些地方。”
竞争主题迅速转换
当大模型不再稀缺,应用层的机会展开,什么样的公司更能脱颖而出?
关于赛道竞争,4月8日,京东集团副总裁何晓冬在接受《每日经济新闻》记者采访时强调,“每个人还是想清楚自己的壁垒在什么地方。”
以AI虚拟人这样的应用为例,“数字人可能大家看得很多,但真正用的时候,细节还是很关键的。”何晓冬表示,嘴型是否有错位、姿态是否丰富,包括上线以后的各方面成本,“这是一个技术壁垒,如果是技术公司的话,你就往这方面做。”
何晓冬接着说道,如果是虚拟人的运营公司,比如通过用数字人去做大量运营、积累了大量的客户和用户,最后重构一个数字人Facebook,上面有1亿的真实用户跟你的数字人互动,“这时候你可能就不是很在乎是谁提供的数字人技术了,你这1亿用户和交互场景变成了你的壁垒。”
另一方面,一路“狂飙”的ChatGPT也引发多个国家对安全风险的重视。意大利率先宣布禁止使用聊天机器人ChatGPT,随后,不少国家开始考虑对ChatGPT采取更严格的监管措施。
4月11日,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》(以下简称《征求意见稿》)公开征求意见。其中提出,利用生成式人工智能产品向公众提供服务前,应依规向国家网信部门申报安全评估,并履行算法备案和变更、注销备案手续。
图片来源:网页截图
张卓表示,前述《征求意见稿》的发布以及全球范围内对于AIGC的监管力度加强,意味着数据安全和隐私保护已经成为AIGC发展的前提和关键。
每日经济新闻