东欧土地上骤然开启的冲突,掀起了一场声势浩大的制裁潮。有一些如同玩笑,比如连西伯利亚的猫都不放过;而有一些则意味深长,比如开源软件限制开发者访问。
2月28日,有消息称世界第一开源软件平台GitHub正在考虑限制俄罗斯软件开发者访问开源软件源代码储存库。
很多国家、企业使用的软件平台几乎都是完全基于开源代码搭建的,而全世界能够提供开源软件许可证的科技企业,大多是欧美巨头。Github风波,再一次让开源软件的自主可控成为业界关心的焦点,这不禁让我们想到至关重要的AI开发底座深度学习开源框架的国产化情况,究竟如何。
如今,AI技术已经在我们的生产生活、公共管理等方方面面得到深入应用,开发AI应用的深度学习框架作为基础设施,如果也说停就停,会给以数字经济引领高质量发展的中国产业,带来一系列不确定因素。
那么,加强中国AI基础技术的安全系数,究竟是杞人忧天,还是确实应该未雨绸缪、防患于未然呢?我们不妨先从逻辑和全面的视角,来梳理一下中国AI基础技术的真实面貌。
人工智能的“函谷关”
地处桃林塞之中枢,崤函古道之咽喉的函谷关,自古以来都是兵家必争的战略要地。深度学习框架就如同AI的“函谷关”,能够对AI技术和产业的发展形成底层制约,所以必须要牢牢掌握在自己手中才行。
首先,突如其来的直接封锁,并非完全不可能。海外科技企业也会随着局势变化而调整平台开放策略,比如GitHub此前就曾突然限制过古巴、朝鲜、伊朗和叙利亚等国家用户访问。
而AI基础技术平台上,承载着大量AI数据集、文档、代码、模型和核心应用,涉及到民生、安防、城市交通、公共服务等核心事务,一旦海外开源断供,带来的商业损失和安全风险,会直接影响国计民生。从这个层面来说,AI基础技术即深度学习框架的国产化是势在必行、不容有失。
当然,或许你会觉得没有极其重大的冲突,就不会导致封锁。但中国有句话叫君子无罪,怀璧其罪。有才能难免会引人猜忌,而众所周知,中国对人工智能等前沿科技的重视,人工智能产业规模逐年上升,随着中国AI越来越发达,必然会引发海外一些国家的猜忌。
比如过去5年来,美国就一直致力于加强自身在人工智能领域的领导地位,美国议员汤姆科顿曾公开声明,中国留学生来美国学莎士比亚就够了,不需要学习量子计算和人工智能。海外政治家对中国AI发展过快的焦虑,可能成为封锁开源AI的“欲加之罪”。
这样的制裁虽然可能遭遇全球技术人士的谴责,但其实遏制方式并非只有直接封锁这一条路。通过停止更新、高额收费、搞差异化对待、排斥中国AI企业等,都会拖慢中国智能化发展步伐。
这并不是不可能。有媒体就提到,即使正式的开源软件可以自由使用,但有代码的作者有理由拒绝特定人群使用,而已经有作者在社交网站上发帖讨论是否禁止俄国程序员使用他们的代码。
守住AI的“函谷关”,不过度依赖国外技术,是中国产业能在数智化浪潮中顺利前行最重要的基矗
中国AI的“安全锁”
说到这里,你可能会好奇,中国AI基础技术现在有一较高下的能力吗?毕竟不能因为一些未雨绸缪的猜想,而牺牲真材实料的技术能力与开发效率。
幸运的是,中国AI领域在深度学习框架这件事上吸取了历史教训。很多中国AI科技企业都相继研发并开源了深度学习框架,百度飞桨(PaddlePaddle)就是国内首个自主研发并开源开放的深度学习框架,此外还有华为的Mindspore、腾讯的PocketFlow,阿里巴巴的X-Deep Learning,旷视科技的天元(MegEngine)等。
目前,确实是无需担心深度学习框架被“卡脖子”了。
不过,故事还只是刚刚开始。在人工智能的科技竞赛中,对国产开源框架的要求,不能停留在“人有我有”,当个临时“备胎”。还需要“人有我精”,表现出比海外开源框架更优秀的能力。
提升中国AI的安全指数,国产开源框架还应主动锻造三把“安全锁”:
第一道锁,锁住底层技术自主权。
开源框架的国产化,首要要求就是完全自主可控,掌握核心技术的自主权。尤其是一些前沿探索类的技术上,满足深度AI应用的开发需求,才能吸引更多开发者加入。
相比一些针对垂直场景、个人开发者搭建的开源框架,具备技术积累的企业开源框架平台在底层突破、技术迭代和领先性上更有优势,TensorFlow就凭借谷歌大量突破性的新技术成为开源框架的“扛把子”。
幸好,目前中国AI企业的技术能力也并不逊色。比如近期流行的超大规模的多模态大模型,就依赖于强大的算力、技术、开发能力来实现,目前,知识增强“文心”大模型加入到飞桨产业级模型库中、向各行各业开放,华为云开源了盘古大模型……
第二道锁,锁住全面的能力范畴。
因为更懂中国AI市尝中国开发者,国产开源框架也能够提供更具针对性的服务能力。试想一下,一个不认识英文的农村养猪场员工,想要开发一个猪脸识别应用,跑到TensorFlow、caffe、PyTorch这样的框架上只能抓瞎,从这个角度,国产框架更符合中国AI与千行百业相结合的真实情况。
第三道锁,锁住人才和产业生态。
很多技术国产化的失败都源于生态匮乏,没有足够多的开发人才和产业应用支持。众所周知,针对AI人才的争夺战在海内外都十分激烈。因此,人才和产业的生态圈建设,关乎国产框架能否长期可持续发展。
AI人才培养体系既要能缓解短期产业人才缺口,也要为长期发展储备战略人才。以百度飞桨为例,其人才生态就涵盖了面向青少年AI科普教育的“晨曦计划”、面向高校学子全年无休的AI赛事、培养师资力量的高校深度学习师资培训班、面向产业人才的AICA首席架构师培训计划等等。
汇聚了更多人才的创新智慧,国产开源框架的社区资源和商业价值也必将持续增长。
综上所述,可以发现国产框架并不是“为情怀而生”,通过三把“安全锁”,锁定的不仅是中国AI的安全,还有AI产业规模化落地增长的无限可能。
技术国产化的“钟摆效应”
在技术国产化的路上,很容易出现一种“钟摆效应”。在过度悲观和过度乐观中来回摆动,感到威胁时,一股脑儿盲目扎堆,像是2020年开始,芯片半导体行业就出现了一股周期性狂奔的热潮。而一旦国产化受阻,又开始强调国际合作,昔日的国产EDA软件熊猫,就因为“物美价廉”的外国产品和技术而宣告折戟,直到目前我国依然在EDA软件上“受制于人”。
今天,人工智能为代表的新一代信息技术,已经成为我国“十四五”期间推动经济高质量发展的技术保障和核心驱动力之一,对于最关键的开发底座深度学习框架,尤其需要避免出现“钟摆效应”,而要建立起“底线思维”。
首先,积极推动国产化、自主可控的深度学习框架发展,有重点、有规划地发展一些能够“卡别人脖子”的头部框架,将国产框架的生态化基础打牢固。知道制裁深度学习框架也没啥大用,自然就会少打歪主意。
另外,AI的前景在于与经济体的结合,要进一步推动AI全面赋能产业,降低开发门槛,这一点上我们的国产框架也是十分积极的。国内企业也要有危机意识,随着智能经济不断与千行百业深度融合,还是要尽快切换到国产框架上来。
同时,AI技术本身决定了必须要通过开放开源共享,来不断迭代升级,在自立自强的基础上,国产框架也应该以开放的心态鼓励更多开发者加入生态体系内,形成更具生命力、更健壮的AI开发群落。当全球顶尖AI人才都汇聚在此,制裁自然也就成为空谈,因为人的智慧是无法被封锁的。
人工智能,是新一轮科技革命中的“中国支点”,必须在AI开发框架上站稳脚跟,坚定地走在中国自主可控的路上。
为了有一天,我们的头上再也没有技术的达摩克利斯之剑,不妨用胡适在《独立评论》中的话来结尾吧:
朋友们,在你悲观失望的时候,正是你必须鼓起坚强的信心的时候。你要深信:天下没有白费的努力。成功不必在我,而功力必不唐捐。