【文/观察者网 吕栋 编辑/张广凯】
“10年前做AI的时候,我们绝对想不到,中国新能源汽车能够领先于西方,中国在造车领域也能够做到领先于欧洲。这个是没有想到的,但的确是有一波人在坚持做,让中国企业开始走进更多‘无人区。’”日前,商汤科技董事长兼CEO徐立在与中国首位F1车手周冠宇进行对话时说道。
在徐立看来,从新一波生成式人工智能浪潮的早期布局来看,拥有大量的投入的OpenAI,在大模型领域肯定是领先于中国的。但中国拥有广泛的人口基数、巨大的场景红利和优势。“每个技术叠加应用,才能真正带来一个产业化、革命化的时刻,这也是我们中国的机会。”
4月19日至21日,备受关注的F1大奖赛将重回上海,周冠宇作为中国首位F1车手将在此迎来主场首秀。他在与徐立的对话中提到,中国车手、中国的科技可以走向全世界舞台,对自己而言是鼓励和自豪,希望有越来越多的人工智能技术可以出现在F1赛道上。
周冠宇和徐立进行对话
中国AI发展的优势在哪?
过去一年多,以ChatGPT、Sora等为代表的生成式AI爆火,引发了中国社会的诸多思考。例如,中国AI企业在国际竞争中处于什么位置?在没有先发优势,先进算力获取又受阻的情况下,中国AI产业如何发挥自身特长?掌舵商汤科技的徐立表达了自己的看法。
“10年前我们刚刚开始创业的时候,说在视觉感知领域能做到世界领先,质疑声音也是很多的,因为视频理解、人脸识别,最早都是西方在做。但中国最大的特点就是巨大的场景红利和优势。”徐立坦言,在叠加这一优势后,在感知智能或者智能1.0的时代,中国企业走到了世界最前列。“对于现在的生成式人工智能,我们同样具有强大的信念和信心。”
“现在新一波生成式人工智能,像拥有大量投入的OpenAI,早期布局目前来看肯定是领先中国的。但人工智能要结合场景数据,要落到应用场景中而中国具有广泛的场景基础,由此可以深入产业,在垂直领域走出完全不一样的路线。”他表示,“中国不缺应用场景。每个技术叠加应用,才能真正带来一个产业化、革命化的时刻,这也是我们的中国机会。”
“就像如今人们所称的是‘ChatGPT时刻’,而不是GPT时刻。因为GPT是技术路线,它已经成为行业共识。但真正意义上让它家喻户晓、让大众认知认可到这件事,是因为前面有一个Chat,就是聊天的应用。”徐立说道,“AI企业只要在场景中坚持往前走,那么能够带来的结果会超乎想象。就像1.0时代一样,早期一大堆的AI企业创业,没有人认为能够走到西方前列,但是我们在不同的垂直领域、AI+的时代当中,每个企业都走出自己的特色。”
“他们想象不到中国车手能拿冠军”
F1与奥运会和世界杯并称为世界三大赛事。2022年,周冠宇首次作为F1正赛选手亮相。在外界看来,就像刘翔之于田径,姚明之于篮球,周冠宇对于中国F1同样意义非凡。随着F1大奖赛时隔4年将重回上海,周冠宇作为中国首位F1车手,也将在此迎来主场首秀。
在这次对话中,周冠宇分享了自己一路走来的心路历程。
“我记得在欧洲赛场的第一个分站冠军,也就是在法国欧洲锦标赛卡丁车拿了冠军之后,没有国歌和国旗,因为那个时候赛车是属于欧洲的领域,他们想象不到有一天会有一位中国车手拿冠军。从那之后他们把中国的国旗、国歌带到了每一场比赛的分站赛上面,让我如果再拿一个冠军的时候可以奏响。”
“对于我来说,F3的几年比较艰难,因为那时候车队选择不是最理想的,导致有一点沉淀,F2的时候离F1有一步之遥,但往往是通过金字塔最顶段的台阶,是让我无法想象的困难,因为竞争实在太激烈了,不仅是全欧洲最强的车手,他们还有最好的体系,包括亚洲有日本的引擎体系,他们有梅赛德斯、法拉力青训……”他在谈及早年的困难时说道。
AI生成图片
这次周冠宇与徐立进行对话,一个重要背景是,2022年商汤科技与周冠宇所在车队KICK索伯F1车队(原阿尔法罗密欧F1车队ORLEN)达成了技术合作。“人工智能技术,让我们可以在比赛当中优化策略,以及更加简洁地了解对手,简化无线电的沟通。”周冠宇表示。
“F1比赛是最复杂的体育运动。有一些车队不但现场有团队,在国内总部还有几十人的团队。如果人工智能介入到车队策略制定的话,尤其是对于对手未来的策略判断,制定自己的比赛策略,相信一定会节省大量时间,做出更加精准的判断。”五星体育主持人李兵称。
徐立则坦言,商汤当年出海的时候,很多人认为方块字和科技未必可以挂上钩,“但是我们希望用一代人的努力,真正意义上改变大家的认知方块字可以代表高科技。我相信我们和F1的结合,和冠宇的结合,可以重塑大家对于中国速度的认知。”
“未来整个趋势肯定非常倾向于人工智能,当然我也希望有越来越多的人工智能技术可以加入F1赛道,不仅仅在策略和决策上进行改变,包括赛车整个设计,科技化上面也会有进一步的提升,希望AI可以想到更多人类没法想到的新点子和想法。”周冠宇表示。
场景是技术变现的关键
对当前的AI公司来说,竞争获胜的关键是将技术变现,而技术变现的重要路径是场景落地。
纵观海外AI企业,已有不少出商业化道路。B端如微软、Salesforce,将AI技术集成到传统产品中并提供垂直定制服务;C端如OpenAI、Midjourney,向个人用户提供生产力解放工具,并以付费订阅模式变现。
国内企业同样在探索商业化路径。例如,百度在C端推出文心一言订阅模式,B端提供底层架构、解决方案;360在C端借助浏览器在PC端的场景优势,发力AI办公,B端聚焦AI安全和知识管理等场景;科大讯飞则试图将大模型与自身硬件产品结合;阿里也在推动通义千问在办公、文旅、电力、政务等场景落地。
作为“AI四小龙”之一,商汤去年也发布了“日日新”大模型体系,包括自然语言处理模型、文生图模型和数字人视频生成平台等。该公司透露,在最新推出的4.0版本中,日日新商量大语言模型-通用版本(SenseChat V4)的综合评测成绩已全面超越GPT-3.5,比肩 GPT-4,将在今年四月再度进行发布。
根据商汤披露的信息,“日日新大模型”已在金融、医疗、Copilot助手、拟人交互、智能终端等领域逐步落地。2023年,该公司实现营收34亿元人民币,同比下降10.6%;亏损64.9亿元,同比扩6.6%。但生成式AI业务收入取得200%的增长,占总收入的35%;同时智能汽车量产交付全年新增129万辆,同比增长163%。
在大模型能力落地方面,徐立认为,AI+体育也是未来大模型落地发展的一大潜力方向。商汤基于自身的视觉大模型体系,打造出多相机视觉动作捕捉系统,可实现智能化高光时刻抓娶精彩瞬间生成,技术数据统计,动作分析判断,赛事直播支持等功能,辅助运动员能力分析。
此外商汤透露,AI技术也能为赛事直播带来更丰富、直观的展示效果。比如,在乒乓球比赛中,商汤科技通过3D动作捕捉技术、AR特效渲染引擎,成功实现乒乓球赛事数据采集与可视化转播。不仅能看到乒乓球的运动轨迹、落点,还能将球的转速、旋转方向的可视化。
“现在AI所有对人、物件的感知可以做到非常高的准确率,例如乒乓球旋转。如果用感知获取更多数据,非常有助于普罗大众对这些项目的理解。一些细微参数呈现,对专业人士有更大的数据维度统计,这些统计是真实赛场上的数据,可能对未来的决策有用。”徐立说道。
本文系观察者网独家稿件,未经授权,不得转载。