“生成式AI带来了安全风险，但我们不应该因噎废食”

加密与安全1年前 (2023)发布 aixure

41 0 0

导读：【文/观察者网陈思佳】近年来，ChatGPT掀起了一股人工智能（AI）浪潮，生成式人工智能和人工智能生成内容（AIGC）的概念迅速进入社会各界的视野。在AI技术高速发展的当下，AIGC似乎已在不知不觉间渗透进人们的日常生活的方方面面。 7月6日至8日，以智联世界…

【文/观察者网陈思佳】近年来，ChatGPT掀起了一股人工智能（AI）浪潮，生成式人工智能和人工智能生成内容（AIGC）的概念迅速进入社会各界的视野。在AI技术高速发展的当下，AIGC似乎已在不知不觉间渗透进人们的日常生活的方方面面。

7月6日至8日，以“智联世界生成未来”为主题的第六届世界人工智能大会（WAIC）在上海举行，展览涵盖核心技术、智能终端、应用赋能、前沿技术四大板块，包括大模型、芯片、机器人、智能驾驶等领域，参展企业超400家，优秀初创企业超50家，首发首展新品达30余款。

大模型和AIGC无疑是本次大会的焦点，华为、阿里、百度、科大讯飞等多家厂商的30余款大模型亮相世博展览馆，涵盖图片生成、视频生成、数字人等诸多AIGC项目的展台更是吸引大批观众。

但AI技术的迅猛发展也促使人们开始思考，大模型和AIGC具有什么样的前景？它们会给日常生活带来怎样的变革？生成式AI技术又有什么样的潜在发展门槛和风险？对此，在7月7日举行的“聚焦大模型时代AIGC新浪潮论坛”上，来自多家机构、企业和高校的专家分享了他们的看法。

2023世界人工智能大会

30余款大模型同台竞技

本届WAIC聚焦大模型和AIGC，华为云盘古大模型、科大讯飞星火认知大模型、商汤商量中文语言大模型、阿里云通义千问、百度文心一言等30余款大模型亮相现场，各大厂商推出的产品涵盖算力底座、模型即服务（MaaS）、通用大模型、垂直应用大模型等方方面面。

作为本次大会的“镇馆之宝”之一，华为带来的腾AI“大模型超级工厂”覆盖大模型的数据&模型准备、算力准备&模型训练、模型部署上线&集成等阶段全流程。

目前基于腾AI原生孵化了业界首个两千亿参数的中文NLP大模型鹏城.盘古、业界首个多模态大模型紫东.太初以及华为云盘古系列在内的20多个国产大模型。同时，腾AI也已适配支持了ChatGLM、LLaMA、GPT-3、BLOOM等数十个业界主流开源开放的大模型。

7月7日，华为云CEO张平安还在华为开发者大会2023上宣布，盘古大模型3.0正式发布。据他介绍，该模型是一个完全面向行业的大模型系列，“盘古大模型不作诗，也没有时间作诗，因为它要深入到各行各业中去，让AI赋予各行各业价值。”

商汤科技“日日新SenseNova”大模型体系则覆盖文本生成、图像生成、数字人等多个领域。其中“商量SenseChat”是该体系下的千亿级参数语言大模型，具备领先的语义理解、多轮对话、知识掌握、逻辑推理的综合能力。目前，“商量SenseChat 2.0”已在医疗、金融、移动终端、代码开发等领域为客户提供服务。

作为“模型即服务”的倡导者，阿里云展出的通义大模型允许企业微调、训练模型，打造模型开放平台，提供一站式模型服务。阿里云还展示了其云计算技术体系的三层架构，从下到上分别包括基础设施即服务（IaaS）、平台即服务（PaaS）和模型即服务（MaaS）。

此外，多款应用于垂直领域的大模型也亮相本届WAIC。例如，达观数据发布的“曹植”大模型主要面向金融、政务等行业，具备长文本、垂直化和多语言等特点。蜜度发布的“蜜度文修”大模型则专为校对这一垂直领域打造，在中文拼写勘误、语法纠正等方面的表现优于通用大模型ChatGPT。

图片生成、音乐创作、数字人……AIGC触及生活方方面面

在迅猛发展的大模型的支持下，AIGC技术成为本届WAIC的一大亮点，图像生成、数字人直播、文本生成PPT、自动剪辑等多种生成式AI应用与大模型同步推出，相关展台可谓人山人海。

商汤科技展台展示了“秒画SenseMirage”生成的图像，这是一个包含商汤自研AIGC大模型和便捷的LoRA训练能力，并提供第三方社区开源模型加速推理的创作平台。据介绍，秒画SenseMirage 3.0的自研生成大模型参数提升至70亿量级，具有更强的中文理解能力、更多样化的风格选择。

燧原科技也展示了文生图MaaS平台服务产品“燧原曜图”，基于燧原科技“邃思”系列芯片的算力支持，为用户提供面向AIGC时代的高效易用、安全可靠的文生图服务。通过软硬件一体方案，该产品可以降低大规模AIGC应用的工程难度和算力成本。

网易伏羲推出了自研图片生成模型“丹青”和创意辅助产品“丹青约”，推动将AI技术应用于企业美术资产的生产创作流程中，将上线有灵美术平台。据介绍，“丹青”是基于原生中文语料数据及网易自有高质量图片数据训练，为100%的国产大模型。

金山办公的具备大语言模型能力的人工智能应用WPS AI则已经接入金山办公旗下WPS文字、演示、表格、PDF、智能文档和智能表格等组件。金山办公表示，这是国内协同办公赛道的首个类ChatGPT式应用，未来锚定AIGC、人机交互、知识再利用三个战略方向发展。

在音乐创作方面，腾讯多媒体实验室基于AIGC技术推出XMusic生成式通用作曲框架，支持视频、图片、文字、标签、哼唱等多模态内容作为输入提示词，生成情绪、曲风、节奏可控的音乐。在视频配乐、互动娱乐、辅助创作、音乐教育等众多领域都具有广阔的应用前景。

腾讯还展出了将生成式AI应用于电子游戏、科研、实时翻译等领域的探索。例如，腾讯优图展示的AI探星计划，利用AI技术和腾讯云的算力助力“中国天眼”（FAST），已在较短时间内快速发现数十颗脉冲星。

在智能手机的时代，AI技术也在与移动终端结合。美国高通公司展出了终端侧生成式AI用例演示，在搭载第二代骁龙8移动平台的安卓手机运行超10亿参数的Stable Diffusion模型，实现15秒内20步推理。

“大模型的产生并非一蹴而就”

AI热潮席卷全球，也促使人们开始思考，生成式AI技术会给社会生产带来怎样的变化？AIGC又具备怎样的发展前景？对此，7月7日上午举行的“聚焦大模型时代AIGC新浪潮论坛”上，来自多家机构、企业和高校的专家分享了他们的观点。

京东探索研究院院长、京东科技智能服务与产品部总裁何晓东表示，生成式AI在今年取得了巨大的进展，可以做到文本生成、代码生成、图片生成、视频生成等，产生了生产力的变革。他认为，大模型带来了AI流行的机遇，从传统的基于某一个场景、某一个应用定制AI模型，进入到一个大的通用的模型可以服务于多个场景。

“一方面模型本身的成本是提高了，因为我们都知道，大模型本身需要大量的算力，需要大量的数据，需要一个很大、很强的综合性团队。在另一方面它的部署成本其实极大地降低了，因为一个模型可以部署到更多的地方。”何晓东说，“这就像我们进入工业时代，虽然工具更昂贵了，但它生产产品的效率反而提升了。”

何晓东表示，希望AIGC能加入更有创作力的领域，比如图像绘画生成等，“京东通过打造一站式的人工智能应用平台言犀平台，集成大量AI从感知到认知到生成的技术，使得我们可以在各个层次组合出各种各样丰富的应用式产品，服务各行各业。各行各业都能从这一次的人工智能技术进展中得到真正的提升。”

京东探索研究院院长、京东科技智能服务与产品部总裁何晓东发表讲话

HiDream.ai创始人、加拿大工程院外籍院士梅涛认为，多模态AIGC主要面临三大挑战：第一是标记化（Tokenization），有没有一种比较好的集合，能够把文本、视觉、语音等信息包含在一起。第二是解码（Decoder），大语言模型中常用的Transformer架构并没有在图像、视频中得到很好的应用。第三是对齐（Alignment），我们能不能做到不同模态之间交叉相关性的对齐。

梅涛指出，目前主流的视觉模型的能力边界基本都在几十亿参数的区间，在图像生成方面，人脸细节、手指细节、物体细节等问题都还没有解决，还有很多工作要做。

“我们想做的一件事就是问问自己，到底我们有没有可能把现在视觉多模态的基础模型，从它现在能力对标GPT-2.0的时代，走向GPT-3.0的时代。当然这也是我们HiDream的一个初心。”梅涛说。

HiDream.ai创始人、加拿大工程院外籍院士梅涛发表讲话

九章云极联合创始人尚明栋则谈及人工智能基础设施的变革。他表示，大模型的产生并非一蹴而就，而是需要完整的基础设施升级，无法依靠单独一个大模型解决更多的问题。他指出，基础设施的构成包括算力、数据和软件等方面。

尚明栋提到，美国初创公司CoreWeave在最近使用3584张H100芯片，仅用时11分钟就完成GPT-3模型的训练，整体开销约2万美元。但在2020年训练GPT-3模型需要450万美元，在2022年依然需要45万美元。“我们看到，随着算力和并行的一些基础软件的演进，我们算力的成本在持续下降。而算力成本下降的速度，我们判断也会快于模型大小增长。所以，以后算力将不会构成大模型计算的一个鸿沟。”

他指出，训练更高质量、更高效的模型，就需要质量更好的数据，“我们也知道，受限于数据的边界，考虑到数据隐私、数据安全等多方面因素，我们很难让它直接在通用的数据中流通。所以我们需要构建垂直领域大模型，结合从算力、数据到基础软件去赋能于千行百业。”

九章云极联合创始人尚明栋发表讲话

在基础软件方面，尚明栋认为，基础软件的核心价值在两点，一是高效地调度、管理数据和算力，将原先复杂的大模型构建变得更加容易。二是通过对基础软件高效的工程化、模块化和自动化，提高训练的效率。基础软件效率的提升意味着算力的节省和成本的降低。

“所以，大模型未来的挑战在于，我们希望大模型能够落地各行各业，那么落地于千行百业就需要和各个行业的业务结合在一起，并结合行业的业务知识。”尚明栋说。

“AI存在风险，但我们不应该因噎废食”

然而，AIGC的发展也面临诸多争议，从发展的门槛和壁垒到AI的风险和安全性都受到颇多质疑。对此，在“聚焦大模型时代AIGC新浪潮论坛”的圆桌讨论环节中，多位专家指出，生成式AI发展可能面临诸多挑战和风险，但我们不能“因噎废食”，需要在长期的发展中寻找应对的方案。

上海人工智能实验室主任助理乔宇认为，大模型还存在很多问题，例如人们常说的“幻觉”、价值对齐、效率等，但社会各界需要用发展的目光看待AI，安全和发展是“一体两翼”的关系，特别是中国的大模型还处于追赶阶段，需要从发展的角度去看待安全问题。

谈及大模型可能存在的价值观方面的问题，乔宇表示，大模型的价值观是由训练数据得来的，“我们是不是能从训练数据端去解决？有些模型用在专业领域的时候，围绕这个专业领域，我们对它有一些安全要求，有可能从中继承一些。所以要从大模型技术研发的不同环节来思考安全问题。”

乔宇强调，大模型的安全不单单是某一个科研团体、某一个产业领域或是中国单独面临的问题，它是全世界乃至全人类面临的问题，“所以我认为在安全领域，我们应该展开更多的国际交流和合作，来共同面对和解决。”

“聚焦大模型时代AIGC新浪潮论坛”圆桌讨论环节

香港中文大学助理教授王历伟从人才和研究的角度切入，他认为，从人才培养的速度来看，很大的优秀科研人员基础可以降低未来研发的门槛，训练大模型的算力需求成本看起来也比较乐观。“我觉得从短期或中长期来看，无论是人才储备还是算力，大模型的研发门槛可能在慢慢降低。”

王历伟表示，科研人员需要关注如何理解和评价大模型的能力，“如果我们持续从一种评价方式去衡量大模型的能力，可能多多少少还是比较片面。”他认为，学术领域人士很适合去更多地探索安全性和AI治理等方向的内容。

蚂蚁集团机器智能部副总经理、蚂蚁安全天实验室主任张天翼表示，大模型带来的风险问题不一定是新的问题，但更加深度的应用可能造成更全面的影响，包括生成内容安全问题、技术安全、隐私问题、合规问题以及伦理问题等。

张天翼认为，当前大模型存在三方面的风险，一是技术相关问题，模型本身可能被攻击、被突破、被劫持。二是产业类风险，AI是否会带来垄断、劳动替代等问题。三是内容类的问题，是否会向用户提供不安全的内容。

他表示，大模型的风险问题没有“灵丹妙药”，必然是一个长期对抗和博弈发展的过程，“比如说现在安全行业内的一个很直接的应用，我们也会用大模型来对抗更多大模型中的风险，这也会是一个‘用魔法打败魔法’的方向。”

云天励飞副总裁、AI技术平台总经理肖嵘则为生成式AI的发展总结了四个问题，分别是生成内容存在“幻觉”的问题、工具使用和外部知识整合能力、逻辑推理能力和不具备持续学习能力的问题。

在安全问题上，肖嵘认为，大模型其实具备“价值观”，它所认定的知识不一定就是事实，“解决这个问题其实有两个路径，第一个是它为什么会产生有错的东西？可能它学的东西都是不对的……所以我们需要对语料有体系地治理，保证其安全、可控。第二个也是我们正在大力推动的，比如对模型输出的治理。”

但他也强调，AI是一种工具。“越强大的工具被用来作恶，可能影响也越大。”肖嵘说，“我认为，工具用得好不好，更多是人的问题。我们不应该因噎废食，不是看到强大的工具就不去使用，而是更多地想想怎么把它有序化。”

本文系观察者网独家稿件，未经授权，不得转载。

# 加密与安全

文章版权归作者所有，未经允许请勿转载。

加密市场：未来的发展呈现的一定是好趋势吗？

aixure

微软暗示下一代 Windows 11 将带来更多类似 TPM 的安全功能

aixure

揭秘：黑客如何黑掉你的手机？

aixure

Reddit组建加密团队以建立基于区块链的互联网

aixure

超九成政府网站存在各级安全漏洞

aixure

亚马逊将允许用户禁止人工审听其Alexa录音

aixure

暂无评论

暂无评论...

“生成式AI带来了安全风险，但我们不应该因噎废食”

“监听”、“抢跑”和“数据偷窃”：智能语音技术的猜疑链

人工智能立法迫在眉睫数据安全备受关注

相关文章

暂无评论

相关文章

“生成式AI带来了安全风险，但我们不应该因噎废食”

“监听”、“抢跑”和“数据偷窃”：智能语音技术的猜疑链

人工智能立法迫在眉睫 数据安全备受关注

相关文章

暂无评论

相关文章

人工智能立法迫在眉睫数据安全备受关注