5天就能做出刷屏的《流浪地球3》预告片,AI还会颠覆哪些场景?

人工智能应用11个月前发布 aixure
72 0 0
导读:这一年来,被称为生成式人工智能的革命性技术,激发了全球科技界把所有软件和硬件重做一遍的冲动,很多爆红应用进入大众视线,典型的代表是AI绘画板块的StableDiffusion和MidJourney大大压缩了绘画的时间成本,也有用户使用视频生成软件RunWay在5天时间内做…

这一年来,被称为“生成式人工智能”的革命性技术,激发了全球科技界“把所有软件和硬件重做一遍”的冲动,很多爆红应用进入大众视线,典型的代表是AI绘画板块的StableDiffusion和MidJourney大大压缩了绘画的时间成本,也有用户使用视频生成软件RunWay在5天时间内做出一支《流浪地球3》预告片。

AI在哪些行业获得了实际应用?AI领域的“杀手级应用”更有可能出现在ToB还是ToC板块?生成式AI发展还需要突破哪些难点?在主题为“智能涌现数开万物”的科技新闻HiTechDay暨2023数字开物大会上,科技新闻创作者胡竣昆仲资本投资副总裁陈希、清华大学交叉信息学院助理教授袁洋、木牛机器人CEO郭林、科技新闻创作者/互联网基金公司AI业务负责人张仁杰,从投资、学术、创意等角度解读最先被AI改变的应用场景。

陈希认为虽然投资人很关心AI应用和落地,但目前很多AI项目的估值存在高溢价,下半年投资人变得更加冷静,同时对于爆款应用的态度也保持谨慎,陈希表示从投资角度看,KillerAPP需要解决真正重要的需求,具有可扩展性,并产生商业价值。即使C端产品可以带来爆发式增长,但从长远来看,这些产品最终需要找到B端的应用场景。

在袁洋看来,大多数大模型目前都停留在System1阶段,即直觉性的思考阶段。如果能在System2阶段,即深思熟虑后再给出答案,那么这些模型的能力会大大增强。在医疗、教育和法律等领域的价值也会进一步凸显。

郭林看到AI和机器人的结合为行业带来的颠覆性的机会,把时间拉长来看,算法和算力资源对于所有AI机器人公司都是平等和透明的,大量积累可以被训练的高质量数据是当前初创企业唯一值得立即开始且持续投入的关键点。

张仁杰认为,AI不仅仅能提高效率,它已经颠覆了创作方式,以前不可能的事,现在能做到,以前能做的事,现在效率提高了10倍。

以下为对话实录精华版:

胡俊:无论AI到底是什么,都一定要先应用起来,今天我们有幸邀请到几位重量级嘉宾,既有投资人的代表,也有创意企业和学术的代表。

陈希:我是昆仲资本的陈希,人工智能是下一代产业赋能和革新的技术,所以从2016年上一波AI起来的时候,我们就一直专注地围绕AI+各个重点领域去做投资布局。随着AI底层技术的不断发展,从深度学习向CNN、RNN到后来的Transformer,我们也在寻找大模型以及AIGC带来的新的创业机会。

袁洋:我是清华的袁洋,自己做的科研主要是大模型技术理论,跟着学院院长一起开展人工智能、大模型的常识推理和数学题的研究,我的主要方向是做大模型的医疗,即智慧中医,打算办一个智慧诊所。

郭林:我是木牛机器人的郭林,主要从事AI技术在工业方向和传统机器人的结合,从而创造一些创新性的产品。通过机器人底层系统赋能很多产业应用,主力服务智能物流和物流搬运,主要是在生产制造的重载搬运场景。

张仁杰:以前我是做用户体验设计出身,现在是在一家互联网基金平台公司担任设计总监,今年2月开始选择去做AI自媒体。我自己对AI很感兴趣,业余也一直在玩GPT、AI绘图、AI视频、AI声音类应用。大家认识我是在8月,那个时候我做了一个AI预告片叫做《流浪地球III》,稍微火了一点。

胡俊:投资人现在怎么看待AI?你们投资这些项目的思考决策逻辑是怎样的?

陈希:最近,大家都注意到AI尤其是大型模型在上半年和下半年表现出明显的变化。上半年非常火热,我们看到了大量的融资,但下半年投资人变得更加冷静和谨慎。Gartner最近发布的报告显示,GenerativeAI现在处于期望过高阶段。市场上很多项目的估值存在高溢价。

从行业构造来看,AI分为三层:基础大模型层、中间层和应用层。其中,基础大模型层是竞争最激烈的。上半年的投资主要集中在这一层。中间层类似于云计算时代的PaaS,也是一个比较热门的领域。而最上层的应用层则是最有发展机会的,能够结合数据集以及对各个垂直行业的Knowhow,在大模型基础上做FineTurning,创造实际的商业价值。虽然当前估值普遍较高,投资人仍期待新的商业机会和前景。

胡俊:投资人特别关心的是AI的实际应用和落地。袁老师,作为教育界的专家,您如何看待AI的快速发展和学生对此的态度?

袁洋:学生们对大模型的态度各不相同。有的很想深入了解并尝试,有的则更倾向于做科研。我认为,不管是哪个领域,都应该拥抱大模型。不过,我注意到大多数大模型目前都停留在System1阶段,即直觉性的思考。如果能在System2阶段,即深思熟虑后再给出答案,那么这些模型的能力会大大增强。在医疗、教育和法律等领域,这样的模型将非常有价值。

我们自己还提出了CommunicativeReasoning,对解决医疗、教育和法律上的复杂性问题具备很高的价值,可以让AI经过深思熟虑发挥更大作用。

在我看来,大模型需要把思维流程变成像工业流水线一样的一个一个小步骤,然后将这些步骤有机结合起来,在这个过程中可以选择不同的岔路、找到一个最好的方案。

胡俊:郭总,您认为这次AI的变革在整体发展上会有什么不同?

郭林:AI和机器人的结合为行业带来了颠覆性的机会。但实际应用中,企业最头疼的是无尽的CornerCase,这是所有创业公司都面对的最大、最头疼的问题。行业里有一个笑话买机器人送工程师,基本上指的就是这样的状态。

很多数据的结合,将有机会解决各种各样的CornerCase成本结构,真正走到场景落地的时候,我们不寄希望于AI解决所有问题,但我们希望AI能解决关键节点的问题,我们承担得起相应的成本提升。这些关键问题外的其它问题,可以通过工程化和数学手段解决。这种思路将为企业带来新的落地策略。

胡俊:卡兹克,你尝试过多少种AI应用?有没有让你特别惊艳的?

张仁杰:很难具体统计,但我基本上用过市面上所有火热的AI相关应用。去年10月到现在,我的阈值变高了。ChatGPT不用多说,国内外的类似产品我都试过。但难以重现ChatGPT初次给我的震撼。最近有个KimiChat让我重新惊艳,它处理20万字文档不衰减,GPT-4和Claude虽然支持几十万Token,但用户扔进去的文档的后半部分常常“消失”,而KimiChat却能精确处理文档后半部分的内容。

在AI绘图板块,如StableDiffusion和MidJourney,也让我非常惊艳。

其它AI产品是偏功能性的,包括AI扩图或实时会画。此外,今年5月我还尝试了AI声音技术,像11Labs用5分钟不到的时间就能将短音频扩展成29国语言。还有AI视频,像Runway和《流浪地球III》的预告片,都让我印象深刻。

胡俊:AI应用是否提高了你们的创作效率?

张仁杰:不仅仅是提高效率,它已经颠覆了创作方式。以前不可能的事,现在能做到,以前能做的事,现在效率提高了10倍。比如我制作的《三体》AI预告片,包含了各种AI生成的视频和李雪健老师的声音模型,以前需要半年以上的时间,现在我只用了五个晚上。

胡俊:创作视频时的挑战很大。你们发现了什么杀手级的应用吗?在ToB和ToC领域,哪个更可能出现杀手级应用?

陈希:对于AIGC产品,ToB和ToC之间的界限并不清晰。像ChatGPT和StableDiffusion这样的产品既吸引C端用户,也在B端产生价值。但从投资角度看,KillerAPP需要解决真正重要的需求,具有可扩展性,并产生商业价值。即使C端产品可以带来爆发式增长,但从长远来看,这些产品最终需要找到B端的应用场景。在中国,C端用户不太愿意付费,所以AIGC时代的KillerAPP应该是能够吸引C端用户同时在B端场景中商业化的产品。

胡俊:不论是ToC还是其他形式,核心商业模式必须成立。袁老师,从基础科研的角度来看,您认为解决什么样的问题可能会产生杀手级应用?

袁洋:我对杀手级应用的了解不多,但在使用大模型的过程中,我发现它们在System1和System2方面仍存在缺陷。不论是绘画、写作还是编程,经常会出现错误。例如,我想在画中修改兔子的尾巴,但这并不容易。这背后的原因是模型主要依赖直觉反应。如果模型能像真人一样与用户交互并多次反馈,就能更好地调整到用户满意的程度。比如在数学竞赛中,模型的表现还远未达到极限,

如果能进行多次交互,我相信它们能做得更好。如此一来,这些模型就可以广泛应用于教育和医疗行业,如教育中辅助学生解决问题,医疗中考虑更多因素进行诊断。

胡俊:AI是否有能力解决人类无法解决的数学问题?是否有可能让AI获得未来的大奖?

袁洋:许多人正在尝试这方面的工作,但目前我们还未达到那个水平。例如,早期GPT-3在数学方面的表现只能获得5分,但现在已经可以达到70到80分,未来可能达到90到100分,即国际金牌的水平。我预计未来数学家至少需要与AI合作。我个人在学习新数学领域时,经常依赖GPT来了解核心概念和关系,这使我的学习速度比自己阅读快得多。

郭林:我们所在的行业与硬件紧密相关,很难在短期内产生颠覆性应用。一个重要的因素是数据质量和数据量。许多人关注模型本身,但实际上模型对大多数人而言是公共资源。真正重要的是我们向模型提供什么样的输入。在硬件交互和真实物理反馈方面,技术还有很长的路要走。从应用的角度来看,要考虑我们希望AI实现的是确定性结果还是开放性结果,开放性结果更容易产生产品。但从产品视角来看,技术进步并不总是导致爆发式增长,更多的是新供给方式解决了困难的问题。例如,作为一个创业者,我每天都忙于处理各种事务,如写PPT、审阅合同等。如果有模型能高效处理这些任务,那就可能成为爆款应用。此外,我们还要考虑人类学习的关键要素如何变化,如何将AI的变化趋势与孩子的教育结合起来,这可能会产生新的需求和供给形式。

胡俊:卡兹克,你发现了什么杀手级的应用吗?哪个领域可能出现这样的应用?

张仁杰:杀手级应用应该是用户使用后留存度高的,不仅仅是昙花一现。根据我朋友在Twitter上统计的全球AI应用流量,ChatGPT是首屈一指的,其月PV达到14亿。Character.AI也不错,但流量下滑到2亿。全球产品PV分析显示,大多数前排的是对话式应用,如Claude和ChatGPT。国内情况则较为惨淡,HeyGen和PIKA1.0等曾短暂热门,但迅速坠落。目前国内没有真正的杀手级应用,可能跟国内的文化调性有关。国内AI定义还是以提高效率为主,而C端用户更多需要生活娱乐类应用。最近图片处理类应用流量暴增,如MasterGo、及时设计,美图秀秀也有所增长。图像处理可能是C端用户需求的方向,未来可能出现第一个爆款应用。

胡俊:郭总,您认为AI的发展是否可能导致产品、行业甚至您所在行业的颠覆?哪怕是小进步也可能有大影响吗?

郭林:非常有可能。关键是跨越“恐怖谷”,虽然还遥远,但在有基础的产业中是可行的。比如AI视频制作的新兴技术,可能会大幅颠覆影视行业。自动驾驶技术的发展,如特斯拉的案例,表明这不是遥不可及。干线物流的自动驾驶一旦实现,将影响大量货车司机。按我们的看法,重复性、没有异常处理逻辑的工作将被快速替代,而创造性、有认知层面的工作则难以被AI取代。

胡俊:近期中国发布了一系列大模型,但似乎没有实现爆发性增长。中国如何利用大模型创造更大的商业价值?

陈希:需要耐心。AI的发展速度已经非常快,但像苹果的APPStore也花了几年时间才产生商业价值。AI行业正在寻找应用,不仅是技术上的挑战,也需要人们对新技术的认可和信任。长期来看,我们预期会有更多创新和突破。

胡俊:时间会证明一切,只要有价值。

袁洋:大模型只是AI的一面。商业不仅仅是技术,还有外包装的重要性。比如汽车,不仅卖发动机,还有品牌和设计。同样,AI模型如果仅作为API,价值有限。但如果应用到特定场景,如医疗服务,价值就能极大提升。

郭林:从企业角度来看,我们更重视确定性,避免冒险。大模型的本质是解决复杂问题的新方法。对企业而言,关键在于算力、算法和数据。我们专注于数据的收集和应用,为未来技术成熟时做准备。

胡俊:郭总,您的见解总是很深刻。物流领域的数据收集,如重载叉车、轮胎磨损等,预示着物流行业的光明未来。卡兹克,您对这些问题有何看法?

张仁杰:我认为关键在于资源和需求。无论是国内外的Meta或微软,还是国内巨头,算力和资源都是瓶颈,导致C端用户体验差和价格高,所以AI领域要想实现未来大面积商业化或诞生爆款应用,至少要解决资源部分的问题。

我也非常看好边缘计算,边缘计算的发展可能降低AI应用的算力需求,我相信Google和小米所做的东西会让未来的算力需求大幅度下降。未来在资源端,人们根本不需要大模型,需要的是基于大模型的、真正能让用户傻瓜式使用的应用,而不仅仅是大模型本身。我们可能更需要把底层视频大模型包装成很强的应用,包括一些文本大模型、声音大模型,需要被包装出来变成大家用得上的,加上用户对算力需求的降低、成本的降低,综合运转起来才有助于AI进入真正的下一个时代。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...