【文/观察者网 陈思佳】近年来,ChatGPT掀起了一股人工智能(AI)浪潮,生成式人工智能和人工智能生成内容(AIGC)的概念迅速进入社会各界的视野。在AI技术高速发展的当下,AIGC似乎已在不知不觉间渗透进人们的日常生活的方方面面。
7月6日至8日,以“智联世界 生成未来”为主题的第六届世界人工智能大会(WAIC)在上海举行,展览涵盖核心技术、智能终端、应用赋能、前沿技术四大板块,包括大模型、芯片、机器人、智能驾驶等领域,参展企业超400家,优秀初创企业超50家,首发首展新品达30余款。
大模型和AIGC无疑是本次大会的焦点,华为、阿里、百度、科大讯飞等多家厂商的30余款大模型亮相世博展览馆,涵盖图片生成、视频生成、数字人等诸多AIGC项目的展台更是吸引大批观众。
但AI技术的迅猛发展也促使人们开始思考,大模型和AIGC具有什么样的前景?它们会给日常生活带来怎样的变革?生成式AI技术又有什么样的潜在发展门槛和风险?对此,在7月7日举行的“聚焦大模型时代AIGC新浪潮论坛”上,来自多家机构、企业和高校的专家分享了他们的看法。
2023世界人工智能大会
30余款大模型同台竞技
本届WAIC聚焦大模型和AIGC,华为云盘古大模型、科大讯飞星火认知大模型、商汤商量中文语言大模型、阿里云通义千问、百度文心一言等30余款大模型亮相现场,各大厂商推出的产品涵盖算力底座、模型即服务(MaaS)、通用大模型、垂直应用大模型等方方面面。
作为本次大会的“镇馆之宝”之一,华为带来的腾AI“大模型超级工厂”覆盖大模型的数据&模型准备、算力准备&模型训练、模型部署上线&集成等阶段全流程。
目前基于腾AI原生孵化了业界首个两千亿参数的中文NLP大模型鹏城.盘古、业界首个多模态大模型紫东.太初以及华为云盘古系列在内的20多个国产大模型。同时,腾AI也已适配支持了ChatGLM、LLaMA、GPT-3、BLOOM等数十个业界主流开源开放的大模型。
7月7日,华为云CEO张平安还在华为开发者大会2023上宣布,盘古大模型3.0正式发布。据他介绍,该模型是一个完全面向行业的大模型系列,“盘古大模型不作诗,也没有时间作诗,因为它要深入到各行各业中去,让AI赋予各行各业价值。”
商汤科技“日日新SenseNova”大模型体系则覆盖文本生成、图像生成、数字人等多个领域。其中“商量SenseChat”是该体系下的千亿级参数语言大模型,具备领先的语义理解、多轮对话、知识掌握、逻辑推理的综合能力。目前,“商量SenseChat 2.0”已在医疗、金融、移动终端、代码开发等领域为客户提供服务。
作为“模型即服务”的倡导者,阿里云展出的通义大模型允许企业微调、训练模型,打造模型开放平台,提供一站式模型服务。阿里云还展示了其云计算技术体系的三层架构,从下到上分别包括基础设施即服务(IaaS)、平台即服务(PaaS)和模型即服务(MaaS)。
此外,多款应用于垂直领域的大模型也亮相本届WAIC。例如,达观数据发布的“曹植”大模型主要面向金融、政务等行业,具备长文本、垂直化和多语言等特点。蜜度发布的“蜜度文修”大模型则专为校对这一垂直领域打造,在中文拼写勘误、语法纠正等方面的表现优于通用大模型ChatGPT。
图片生成、音乐创作、数字人……AIGC触及生活方方面面
在迅猛发展的大模型的支持下,AIGC技术成为本届WAIC的一大亮点,图像生成、数字人直播、文本生成PPT、自动剪辑等多种生成式AI应用与大模型同步推出,相关展台可谓人山人海。
商汤科技展台展示了“秒画SenseMirage”生成的图像,这是一个包含商汤自研AIGC大模型和便捷的LoRA训练能力,并提供第三方社区开源模型加速推理的创作平台。据介绍,秒画SenseMirage 3.0的自研生成大模型参数提升至70亿量级,具有更强的中文理解能力、更多样化的风格选择。
燧原科技也展示了文生图MaaS平台服务产品“燧原曜图”,基于燧原科技“邃思”系列芯片的算力支持,为用户提供面向AIGC时代的高效易用、安全可靠的文生图服务。通过软硬件一体方案,该产品可以降低大规模AIGC应用的工程难度和算力成本。
网易伏羲推出了自研图片生成模型“丹青”和创意辅助产品“丹青约”,推动将AI技术应用于企业美术资产的生产创作流程中,将上线有灵美术平台。据介绍,“丹青”是基于原生中文语料数据及网易自有高质量图片数据训练,为100%的国产大模型。
金山办公的具备大语言模型能力的人工智能应用WPS AI则已经接入金山办公旗下WPS文字、演示、表格、PDF、智能文档和智能表格等组件。金山办公表示,这是国内协同办公赛道的首个类ChatGPT式应用,未来锚定AIGC、人机交互、知识再利用三个战略方向发展。
在音乐创作方面,腾讯多媒体实验室基于AIGC技术推出XMusic生成式通用作曲框架,支持视频、图片、文字、标签、哼唱等多模态内容作为输入提示词,生成情绪、曲风、节奏可控的音乐。在视频配乐、互动娱乐、辅助创作、音乐教育等众多领域都具有广阔的应用前景。
腾讯还展出了将生成式AI应用于电子游戏、科研、实时翻译等领域的探索。例如,腾讯优图展示的AI探星计划,利用AI技术和腾讯云的算力助力“中国天眼”(FAST),已在较短时间内快速发现数十颗脉冲星。
在智能手机的时代,AI技术也在与移动终端结合。美国高通公司展出了终端侧生成式AI用例演示,在搭载第二代骁龙8移动平台的安卓手机运行超10亿参数的Stable Diffusion模型,实现15秒内20步推理。
“大模型的产生并非一蹴而就”
AI热潮席卷全球,也促使人们开始思考,生成式AI技术会给社会生产带来怎样的变化?AIGC又具备怎样的发展前景?对此,7月7日上午举行的“聚焦大模型时代AIGC新浪潮论坛”上,来自多家机构、企业和高校的专家分享了他们的观点。
京东探索研究院院长、京东科技智能服务与产品部总裁何晓东表示,生成式AI在今年取得了巨大的进展,可以做到文本生成、代码生成、图片生成、视频生成等,产生了生产力的变革。他认为,大模型带来了AI流行的机遇,从传统的基于某一个场景、某一个应用定制AI模型,进入到一个大的通用的模型可以服务于多个场景。
“一方面模型本身的成本是提高了,因为我们都知道,大模型本身需要大量的算力,需要大量的数据,需要一个很大、很强的综合性团队。在另一方面它的部署成本其实极大地降低了,因为一个模型可以部署到更多的地方。”何晓东说,“这就像我们进入工业时代,虽然工具更昂贵了,但它生产产品的效率反而提升了。”
何晓东表示,希望AIGC能加入更有创作力的领域,比如图像绘画生成等,“京东通过打造一站式的人工智能应用平台言犀平台,集成大量AI从感知到认知到生成的技术,使得我们可以在各个层次组合出各种各样丰富的应用式产品,服务各行各业。各行各业都能从这一次的人工智能技术进展中得到真正的提升。”
京东探索研究院院长、京东科技智能服务与产品部总裁何晓东发表讲话
HiDream.ai创始人、加拿大工程院外籍院士梅涛认为,多模态AIGC主要面临三大挑战:第一是标记化(Tokenization),有没有一种比较好的集合,能够把文本、视觉、语音等信息包含在一起。第二是解码(Decoder),大语言模型中常用的Transformer架构并没有在图像、视频中得到很好的应用。第三是对齐(Alignment),我们能不能做到不同模态之间交叉相关性的对齐。
梅涛指出,目前主流的视觉模型的能力边界基本都在几十亿参数的区间,在图像生成方面,人脸细节、手指细节、物体细节等问题都还没有解决,还有很多工作要做。
“我们想做的一件事就是问问自己,到底我们有没有可能把现在视觉多模态的基础模型,从它现在能力对标GPT-2.0的时代,走向GPT-3.0的时代。当然这也是我们HiDream的一个初心。”梅涛说。
HiDream.ai创始人、加拿大工程院外籍院士梅涛发表讲话
九章云极联合创始人尚明栋则谈及人工智能基础设施的变革。他表示,大模型的产生并非一蹴而就,而是需要完整的基础设施升级,无法依靠单独一个大模型解决更多的问题。他指出,基础设施的构成包括算力、数据和软件等方面。
尚明栋提到,美国初创公司CoreWeave在最近使用3584张H100芯片,仅用时11分钟就完成GPT-3模型的训练,整体开销约2万美元。但在2020年训练GPT-3模型需要450万美元,在2022年依然需要45万美元。“我们看到,随着算力和并行的一些基础软件的演进,我们算力的成本在持续下降。而算力成本下降的速度,我们判断也会快于模型大小增长。所以,以后算力将不会构成大模型计算的一个鸿沟。”
他指出,训练更高质量、更高效的模型,就需要质量更好的数据,“我们也知道,受限于数据的边界,考虑到数据隐私、数据安全等多方面因素,我们很难让它直接在通用的数据中流通。所以我们需要构建垂直领域大模型,结合从算力、数据到基础软件去赋能于千行百业。”
九章云极联合创始人尚明栋发表讲话
在基础软件方面,尚明栋认为,基础软件的核心价值在两点,一是高效地调度、管理数据和算力,将原先复杂的大模型构建变得更加容易。二是通过对基础软件高效的工程化、模块化和自动化,提高训练的效率。基础软件效率的提升意味着算力的节省和成本的降低。
“所以,大模型未来的挑战在于,我们希望大模型能够落地各行各业,那么落地于千行百业就需要和各个行业的业务结合在一起,并结合行业的业务知识。”尚明栋说。
“AI存在风险,但我们不应该因噎废食”
然而,AIGC的发展也面临诸多争议,从发展的门槛和壁垒到AI的风险和安全性都受到颇多质疑。对此,在“聚焦大模型时代AIGC新浪潮论坛”的圆桌讨论环节中,多位专家指出,生成式AI发展可能面临诸多挑战和风险,但我们不能“因噎废食”,需要在长期的发展中寻找应对的方案。
上海人工智能实验室主任助理乔宇认为,大模型还存在很多问题,例如人们常说的“幻觉”、价值对齐、效率等,但社会各界需要用发展的目光看待AI,安全和发展是“一体两翼”的关系,特别是中国的大模型还处于追赶阶段,需要从发展的角度去看待安全问题。
谈及大模型可能存在的价值观方面的问题,乔宇表示,大模型的价值观是由训练数据得来的,“我们是不是能从训练数据端去解决?有些模型用在专业领域的时候,围绕这个专业领域,我们对它有一些安全要求,有可能从中继承一些。所以要从大模型技术研发的不同环节来思考安全问题。”
乔宇强调,大模型的安全不单单是某一个科研团体、某一个产业领域或是中国单独面临的问题,它是全世界乃至全人类面临的问题,“所以我认为在安全领域,我们应该展开更多的国际交流和合作,来共同面对和解决。”
“聚焦大模型时代AIGC新浪潮论坛”圆桌讨论环节
香港中文大学助理教授王历伟从人才和研究的角度切入,他认为,从人才培养的速度来看,很大的优秀科研人员基础可以降低未来研发的门槛,训练大模型的算力需求成本看起来也比较乐观。“我觉得从短期或中长期来看,无论是人才储备还是算力,大模型的研发门槛可能在慢慢降低。”
王历伟表示,科研人员需要关注如何理解和评价大模型的能力,“如果我们持续从一种评价方式去衡量大模型的能力,可能多多少少还是比较片面。”他认为,学术领域人士很适合去更多地探索安全性和AI治理等方向的内容。
蚂蚁集团机器智能部副总经理、蚂蚁安全天实验室主任张天翼表示,大模型带来的风险问题不一定是新的问题,但更加深度的应用可能造成更全面的影响,包括生成内容安全问题、技术安全、隐私问题、合规问题以及伦理问题等。
张天翼认为,当前大模型存在三方面的风险,一是技术相关问题,模型本身可能被攻击、被突破、被劫持。二是产业类风险,AI是否会带来垄断、劳动替代等问题。三是内容类的问题,是否会向用户提供不安全的内容。
他表示,大模型的风险问题没有“灵丹妙药”,必然是一个长期对抗和博弈发展的过程,“比如说现在安全行业内的一个很直接的应用,我们也会用大模型来对抗更多大模型中的风险,这也会是一个‘用魔法打败魔法’的方向。”
云天励飞副总裁、AI技术平台总经理肖嵘则为生成式AI的发展总结了四个问题,分别是生成内容存在“幻觉”的问题、工具使用和外部知识整合能力、逻辑推理能力和不具备持续学习能力的问题。
在安全问题上,肖嵘认为,大模型其实具备“价值观”,它所认定的知识不一定就是事实,“解决这个问题其实有两个路径,第一个是它为什么会产生有错的东西?可能它学的东西都是不对的……所以我们需要对语料有体系地治理,保证其安全、可控。第二个也是我们正在大力推动的,比如对模型输出的治理。”
但他也强调,AI是一种工具。“越强大的工具被用来作恶,可能影响也越大。”肖嵘说,“我认为,工具用得好不好,更多是人的问题。我们不应该因噎废食,不是看到强大的工具就不去使用,而是更多地想想怎么把它有序化。”
本文系观察者网独家稿件,未经授权,不得转载。