随着国家数据战略的深化推进,数据成为影响社会经济发展的要素。同时随着《数据安全法》、《个人信息保护法》等治理新规的加速落地,平衡数据利用与安全合规成为数据资源建设的重要方向。在数据融合应用和隐私保护的双重驱动下,隐私计算热潮迅速兴起。
隐私计算开辟了一种全新的数据协作模式,在不泄露数据原始信息的前提下,对数据进行分析计算,实现数据所有权和使用权的分离,避免流通过程中的数据资产损失和隐私信息泄漏。从明文直接传输的数据流通1.0阶段,隐私计算模式是数据流通3.0阶段。
瑞莱智慧RealAI首席架构师徐世真在日前召开的数据安全与隐私计算论坛上,从AI发展的视角出发,为研判隐私计算的未来趋势提供参考思路。
隐私计算通常与AI紧密结合,徐世真表示,从技术角度看,隐私计算是AI能力的重要补充。AI高度依赖数据基础,规模化且多样化的高质量数据,能够训练出效果更好的模型,隐私计算通过解决数据的“链接”问题,为算法的持续进化提供数据补充。
产品层面来看,复制性低和通用性差是当前隐私计算产品化面临的一大局限。徐世真提供了两方面的解决思路,一是尽量从规范成熟、少定制化的需求场景切入,二是将隐私计算嵌入现有的成熟产品,比如隐私保护数据库、隐私保护大数据分析引擎。后者思路下,在与AI技术能力的结合中,隐私计算可看成AI中台2.0,即在原有机器学习平台中添加隐私计算功能模块。
“这也是用户理想的隐私计算产品形式,对外依旧输出AI建模能力,用户操作层面几乎无感,在使用原有机器学习建模技术的同时,底层已经通过密码学、MPC技术实现了隐私保护功能。”徐世真表示。
徐世真看来,现阶段隐私计算的商业化落地仍面临四大挑战。
第一,生态壁垒。目前各厂商隐私计算技术互不相通,也无法互相连接,解决数据孤岛问题的过程中反而带来技术孤岛的问题,这意味着需要上层进行大量集成。
第二,计算性能。密码学操作的引入、分布式通信问题,以及同态加密导致计算性能慢,难以支撑大规模数据训练。
第三,安全性。从知识产权保护的角度,各家厂商不会公开底层协议,导致协议不透明的问题,难以审计。
第四,可用性。目前的隐私计算技术服务商不具备数据生态、数据链接的能力,无法提供开箱即用的数据和解决方案,用户的应用成本和难度增加。
徐世真表示,结合AI发展历程,隐私计算的未来发展可借鉴两大经验。首先技术路径方面,基于底层数据流图的编译器路线将推动技术的兼容互通;性能优化当前可通过优化底层密码库来实现,未来仍需借助新硬件;提升安全性需要抵御密码协议层和应用层的恶意攻击。
其次在产业路径方面,隐私计算需要逐场景落地,根据不同的场景需求采用合适的技术路线,比如多方安全计算效率高、安全可证明,但通信量大、仅支持简单计算逻辑;联邦学习支持复杂机器学习,但主要面向建模场景;TEE路线具备较好的性能和算法生态,但依赖硬件厂商硬件可信性和用户接受数据集中式处理。
立足于AI视角,瑞莱智慧推出了业内首个编译级隐私保护计算平台RealSecure,底层以编译器架构与全同态加密为核心突破,实现与传统算法的自动编译和一键适配,性能领先业内平均水平数十倍,同时基于底层数据流图,与构建事前、事中、事后的全方位安全评估体系,实现可追溯、可验证的高安全级别。
面向场景需求,瑞莱智慧打造了“平台+数据+服务+场景”的一体化隐私计算解决方案,引入运营商、支付等数十种外部数据源,推动隐私计算从功能论证阶段迈向业务落地闭环,实现对金融、政务等不同业务场景的快速赋能。
文/北京青年报记者 温婧
编辑/樊宏伟