图片来源@钛媒体拍摄(下同)
大模型在B端应用的焦虑感正在向会议办公场景袭来。在本周开幕的Infocomm China 2024展会上,全球400家巨头和新兴品牌展出超过500款新品,但只有零星品牌公开了在会议场景中大模型能力可能有的样子。
视频会议场景是否适合于大模型?腾讯会议副总裁吴祖榕一年前同样的展会上对外界表达:“腾讯会议的场景非常适合大模型训练,无论是人物讲话、视频内容、共享屏幕还是会议纪要,都是多模态大模型重要的信息来源。”
今年,腾讯会议已经将其混元大模型能力融合到会议场景中,以类似于“AI助理”的方式呈现。不仅是腾讯会议,钛媒体还注意到,今年的InfoComm展台,海康威视、大华等参展AI企业也展示出了智能会议屏等产品,科大讯飞、思必驰等AI企业也透露将基于各自所训练的大模型能力融合到会议场景。
不少企业都展示了面向会议场景的智能物联设备,包括智能交互平板、AI音频吸顶麦,以及键盘、鼠标等AI智慧办公整体解决方案。它们无一例外,对会议智能化带来的听觉、视觉、内容上更加沉浸专注的会议体验,持有积极理念。
会议,在极致效率背后的聚合思维
当你处于高度信息交流的会议现场,迟到10分钟上线,但对入会前讲话人提及的信息一无所知,你该怎么办?
当你开会时,遇到交流中专业的术语,需要你快速检索回应,能不能跳转到搜索框?
再者说,当你被动拉进冗长的会议,想偷懒摸个鱼,悄无声息地做一份“假期旅游攻略”?
这类场景其实很常见,但在此之前,没有多少产品关注到这类用户痛点。
据官方介绍,在腾讯会议4月上线的3.25版本中,针对会员版、商业版、企业版,腾讯会议“AI小助手”功能,可在会后对已录制内容分时间、章节、发言人等进行更精准地提问,实现个性化会议整理。
钛媒体了解到,目前腾讯会议上线的AI小助手,基于混元大模型,用户可通过会话框提问,小助手即可总结会议中说话人的要点信息;如果开会中走神,也可以让小助手提前设置关键词对与会者进行提醒,提高入会效率。当开会结束,用户还能在历史会议界面找到相应的“提问按钮”,找到过去提问的记录。该过程中,是跟用户与AI的互动界面,是相对私密的。
展台前,不少人士对腾讯会议这款产品功能驻足。腾讯会议产研负责人贾民伟向钛媒体介绍道,腾讯会议将在5月前后上线AI小助手新功能,与当前版本核心区别就在于,针对“会议外”的场景,也实现大模型能力的接入。可以理解为通用ChatGPT的入口,AI小助手也将实现通用AI能力。
贾民伟指出,目前该功能面向商业版和企业版,计划一个账号一年840元进行收费。举个例子,一家企业有万人企业规模,但并不代表着需要给所有人买AI助手的账号,可能其中有一千人,强会议使用者购买就可以。
此外,他还表示,对于企业员工而言,可能这也是接受和将AI能力普及化的一个入口。他们跟很多互联网企业沟通时谈到,很多企业的职能部门包括行政财务,以及一些业务人员,对AI怎么使用,怎么跟IT部门协同,其实没有清晰的认知。
相比于在检索引擎的对话框去检索问题,腾讯会议希望能减少这一动作,不需要再去跳转到另一个接口,在同一个场景内聚合所有的AI能力。“会议是一个很好的入口,大家习惯于每天去开会,先告诉你AI在会议中怎么使用,然后逐步向业务场景延伸。”
大模型落地到硬件生态,还需要多久?
会议硬件产品正逐渐吸纳先进的互联网技术实现功能适配和场景融合。
腾讯会议的展区非常显眼,这多半还源自多家硬件生态伙伴的“遥相呼应”,MAXHUB、罗技、耳目达、poly、维海德、亿联网络等多个硬件厂商,均展示了与腾讯会议合作的适配不同场景的会议解决方案,例如腾讯天籁最新升级的16mic多模态人像分割、精准区分、定位发言人和去混响等能力,就已经应用其中。
从2021年开始,腾讯会议公开布局硬件生态,核心的音视频解决方案腾讯天籁语音模组,就已经搭载到连接器、一体机、智能大屏、扬声器麦克风、摄像头等硬件设备厂家产品中。
那么,硬件产品接入大模型需要储备哪些能力?或者成本有多高?
钛媒体观察,不同于可封装适配的AI语音模组能力,会议硬件产品接入大模型能力可能也需要具备一定的端侧能力。假设有大量用户同时进行推理请求,会消耗大量的服务器计算资源,这对于服务商来讲,基于云端进行推理的成本是非常高昂的;而对于用户,基于端侧具备的计算能力,也会减少延迟,或者模型并发的情况。
在整个会议环节中,对大模型的调用也不止于文本对话框,也会有视频、图片能力的解析。因而,会议用上大模型,仍需要一定时间来探索和解决这类问题。(本文首发于钛媒体APP, 作者|杨丽,编辑 | 盖虹达)