7月8日下午,以“智联世界,生成未来”为主题2023世界人工智能大会在上海世博中心闭幕。今年的大会上,“大模型”是当仁不让的C位。
在今年的闭幕式上,《上海市推动人工智能大模型创新发展的若干措施》公布,并发布了“模”都倡议,签约了三批人工智能项目,成立上海人工智能开源生态产业集群。
上海市经信委副主任张英介绍,措施围绕创新能力、创新要素、创新应用、创新环境四大方向,重点打造三项计划以及五大平台。破解发展瓶颈的三项计划,一是大模型创新扶持计划,重点支持上海市创新主体研发具有国际竞争力的大模型,实施专项奖励,加速模型迭代;二是智能算力加速计划,强化大模型智能算力建设力度,建立绿色通道;三是示范应用推进计划,加强大模型在智能制造、教育教学、科技金融、设计创意、科学智能等垂直领域的深度应用和标杆场景打造。
今年的人工智能大会上,30余款大模型集体亮相,包括商汤日日新、百度文心一言、科大讯飞星火认知大模型、华为云盘古大模型、阿里云通义千问、京东云言犀大模型等汇聚一堂,群“模”璀璨。
这些大模型技术水平到底如何?我们该如何认识这些大模型?下面是澎湃新闻记者梳理的了解这些大模型的5个维度。
进度:大模型厂商纷纷“抢跑”
众人口中的“大模型”究竟是什么?公开资料显示,大模型是指一种参数规模非常大的人工神经网络。因为参数足够大之后它能力非常强,所以在很多任务上都表现出非常好的能力。在大模型学习了非常多的知识,经过了非常多的数据训练后,这样就具有了非常好的通用性。
从各大厂商的动作来看,其中一大共同趋势是,大模型发布的更新迭代速度极快。科大讯飞高级副总裁、认知智能全国重点实验室主任胡国平在腾人工智能产业高峰论坛上透露,10月24日科大讯飞将发布通用大模型,全面对标ChatGPT,并且中文上全面超越。
此前6月9日,科大讯飞董事长刘庆峰曾宣布,将讯飞星火大模型升级到V1.5;8月25日,讯飞星火认知大模型将突破代码能力和多模态交互;10月24日,讯飞星火认知大模型的通用模型要整体对标ChatGPT(GPT3.5阶段),中文能力实现超越GPT3.5,英文能力与GPT3.5相当。
百度CTO王海峰则在现场介绍了文心大模型3.5的核心技术创新,今年3月,百度发布大模型产品“文心一言”。6月,百度CEO李彦宏表示,百度文心大模型已经迭代到3.5版本。王海峰表示,文心大模型3.5效果、功能、性能全面提升,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
另外,文心大模型3.5还新增了插件机制,文心一言已经于6月17日对外发布官方插件百度搜索和ChatFile。百度搜索是默认的内置插件,使得文心一言具备生成实时准确信息的能力。ChatFile是长文本摘要和问答插件,支持超长文本输入。
阿里云CTO周靖人则宣布,阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务。据透露,阿里云魔搭社区现已聚集180万AI开发者和由20多家顶尖人工智能机构贡献的900多个优质AI模型,将努力把魔搭社区培育成中国最大的‘大模型自由市场'。”
此前4月份,阿里云发布“通义千问”大模型,并宣布阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。
落地:从“通用”到“垂直”
值得注意的是,相比在大模型刚推出时,对于算力和技术的关注更多,如今舆论热议的焦点从大模型的技术转移到了实际的商业前景。
7月6日,华为发布盘古大模型3.0,包括“5+N+X”三层架构。华为常务董事、华为云CEO张平安张平安表示,盘古大模型不会作诗只做事,将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提供更好的服务。
华为云盘古大模型3.0明确定位“为行业而生”,张平安表示,盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松,“我坚信大模型将重塑千行百业,而每一个开发者都将是改变世界的英雄。”
此前,华为云人工智能领域首席科学家田奇表示,目前全球基于大模型开发To B应用的企业不到三分之一,行业中的海量业务场景迫切需要更多专业的大模型和专业的AI应用来解决,弥补通用大模型落地行业的不足。
对此,腾讯高级执行副总裁、云与智慧产业事业群CEO汤道生也提到,通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。相比盲目使用通用大模型,企业基于行业大模型构建自己的专属模型,也许是更优的选项。模型参数比通用大模型少,训练和推理的成本更低,优化也更容易。
“通用大模型和行业大模型并不是对立的。”腾讯云副总裁吴运声告诉澎湃新闻记者,训练和部署专属行业大模型,让“通才”变“专才”,对企业来说或许是一个可行路径,但又普遍存在计算资源少、数据质量差、投入成本高、专业经验少等现实挑战。此外,安全、合规,也是企业需要考虑的关键因素。
算力:本土算力如何满足需求?
在世界人工智能大会现场,中国工程院院士、清华大学讲席教授张亚勤表示,大模型目前在时效性、准确性、算力效率、隐私保护方面还面临着一些挑战和局限性。其中,算法本身没有办法解决错误和不实的信息,因为用户本身就具备创意。而在算力效率方面,人脑有860亿个神经元,每个神经元差不多有将近1万个突触。GPT4有着万亿参数模型,但需要巨大的算力和能源。
他提到,如何能降低计算耗能,增加效率是一个大的问题。在此背景下,目前的大模型很难大规模商用,可能至少要提高10倍效率才可以。
华为轮值董事长胡厚则表示,伴随大模型带来的生成式AI突破,人工智能正在进入一个新的时代。算力是人工智能产业创新的基础,大模型的持续创新,驱动算力需求的爆炸式增长。可以说,大模型训练的效率或者是创新的速度,根本上取决于算力的大校中国的算力已经成为一个越来越稀缺的资源了。
值得注意的是,由于美国对半导体出口限制,英伟达最先进的A100、H100芯片无法在国内销售。而英伟达专门针对中国市场推出的A800和H800又缺货严重。中国本土算力究竟何时能够满足大模型的需求,成为业界关注的焦点。
上海天数智芯半导体有限公司(天数智芯)是一家做通用GPU的芯片公司,天数智芯董事长兼CEO盖鲁江接受澎湃新闻记者采访时表示:“目前我们已经证明可以用了,不管他们的能不能买,或者卖不卖给中国,我们的产品现在已经在用起来了。”
燧原科技展台一位产品经理接受澎湃新闻记者采访时表示,燧原科技产品主要供给各地的人工智能算力中心、科研院所用的算力中心。“至于国产算力能否替代英伟达的芯片,这个有个灰度问题,今天所有的产品放在三五年前都是非常领先的产品,但你有一个英伟达在那里作为标杆,那你性能上就会去对标。”他表示,有些领域还是会用英伟达的产品,而信创等国家非常重要的领域会更多采用本土算力。
据中国信通院报告指出,我国基础算力呈现过饱和现象,而智能算力存在一定的缺口。报告同时指出,在算力发展过程中,应当维持合适的超前发展,但需要避免算力基础设施的浪费。
对标:和“世界一流”差多远?
“中国一旦下定决心要做一件事情,就一定能做好,各个产业都是这样,包括人工智能,中国会有很强的人工智能能力。”在今年的世界人工智能大会开幕式上,特斯拉CEO埃隆马斯克在视频演讲中提到。
国产大模型如何超越ChatGPT,一直广受舆论关注。对此,周鸿曾调侃,不少同行都声称将在某年某月某一天超过GPT-4,给自己的版本号安上了3.5、4.0各种名头,暗示自己的产品和国际没有差距,甚至反超了。今年年初,在ChatGPT发布后,中国已经进入百模大战,各家企业都发布了自己的大模型产品,这三个月相当于人工智能行业过去的三十年。
“原先我曾说国内大模型和国际差距有一两年,现在我收回这句话,中国大模型的发展速度已经基本赶上国际先进水平,整体的基本水平已经赶上GPT-3.5,追赶GPT-4的速度也超过自己的想象。”对于国内大模型和国际上的差距,周鸿表达了信心。
“在大模型上,中国和美国有不同的优势。我不同意说中国从今年才开始发力AI的说法,包括腾讯在内,中国很多企业在AI领域有多年发展。尽管国外在今年有突破性技术进展,也超越了国内,但我相信这方面的差距一定会不断缩小,但具体要多久才能追上,恐怕很难给出一个定论。”腾讯副总裁、华东区总经理张立军在接受澎湃新闻记者采访时表示。
京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬则向记者坦言,中国和海外差距没有想象中那么大,在算法的研究中中国也有很大贡献,需要关注的反而是细节上的差距,需要对数据、对落地、和组织团队等一系列细节进行深入的反思,要有足够的冒险精神,才能在AI领域实现革命性的突破。
据大会发布的《2022全球人工智能创新指数报告》显示,在人工智能发展上,中美两国引领、呈梯次分布。中国人工智能发展成效显著,人工智能创新指数近三年一直保持全球第二水平,在人才、教育、专利产出等方面均有所进步,但基础资源建设水平仍有待提高。
值得注意的是,在世界人工智能大会现场,国家标准委指导的国家人工智能标准化总体组宣布中国首个大模型标准化专题组组长,由上海人工智能实验室与百度、华为、阿里、360等企业联合担任,现场进行了证书颁发并正式启动大模型测试国家标准制订。
安全:大模型狂飙,谁来系“安全带”
随着人工智能技术的快速发展,大模型的安全问题也成为热议的话题,业内担心快速发展的大模型会发展出一定智能,从而影响人类的正常生活。对此,360创始人周鸿曾表示,要保持大模型只是辅助角色,未来要把大模型关到“笼子”里,并呼吁大家在企业级上步子要迈得小点。
在世界人工智能大会上,中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起《AIGC可信倡议》。该倡议得到数十家单位参与,围绕人工智能可能引发的经济、安全、隐私和数据治理等问题,提出构建AIGC可信发展的全球治理合作框架,采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升AIGC可信工程化能力,最大限度确保生成式AI安全、透明、可释。
此外,清华大学与蚂蚁集团联合发布AI安全检测平台“蚁鉴2.0”,可识别数据安全、内容安全、科技伦理3个类别的数百种风险。蚂蚁集团大安全事业群技术部总裁李俊奎表示,生成式大模型是一种“深黑盒”技术,作为“红队测试”方,“蚁鉴2.0”扮演了“坏人”角色,通过智能博弈对抗技术,模拟黑产以及自动化生成海量测试集,实现生成式机器人对AIGC生成式模型的诱导式检测计算,从而给大模型找茬,反馈安全问题所在。