随着5G时代的到来,运营商将遇到比前几代移动网络更为繁琐的工作。5G网络在规划、部署和管理方面都更加复杂,并且这种复杂性将贯穿网络和服务领域。
由于5G网络与前几代网络共存,并且引入了网络切片、大规模多输入多输出天线、软件定义网络和网络功能虚拟化等技术,网络管理将变得更加复杂。
同时,运营商还需要管理越来越多的终端设备,来保障越来越多的服务,处理5G网络流量产生的大量数据。为满足客户要求并实现运营目标,对于这些海量数据,仅依靠传统分析流程远远不够。
要应对这些挑战,运营商需要实现AI技术的实时智能、预测和决策功能,网络需要更加智能化。
网络AI化已成行业共识
事实上,网络AI化已经是一个长期的话题,运营商一直在利用SDN、NFV和云技术,来提升业务和网络敏捷性,降低运维复杂性和成本。应用多种智能技术帮助运营商从自动化迈向智能化是大势所趋。
我们知道,5G网络是一个全云化的网络,比传统网络有更大优势实现更高级别的智能化,所以网络AI化亦是5G网络发展的必然。例如5G智能化的网络切片,基于AI可以根据用户不同的业务需求,选择最适合的切片部署一个模型;再有在业务预测方面,可以利用AI来实现根据业务需求变化的资源实时调整等等。
的确,AI技术可以应用于电信网络的多个层级,并改变加速网络运行的效率。
首先,AI在基础设施层可以为硬件设施提供AI加速器,可实现不同层级的训练和推理能力,例如加速核心数据中心全局性的策略或算法模型的集中训练及推理需求,或者在基站内嵌AI加速器以支撑设备级的AI策略及应用。
其次,AI在网络和业务控制层,可以对网络和业务实现智能网络优化、运维、管控和安全;可实现网络各层级KPI优化、网络策略优化,例如在无线的覆盖优化、容量优化、负荷优化等。
第三,AI在运维和编排层的应用,可优先在大数据平台上引入AI引擎,对OSS和BSS数据做更深度的智能化挖掘。
而从场景的角度,AI技术可以在三大场景中赋予网络“智慧”的能力。一是高效智慧运维场景,利用AI技术针对网络进行预防性/主动性维护,改善网络质量、提升MTTR;二是个性化业务服务场景,利用AI和大数据,给客户提供个性化服务的分析和建议,例如设计个性化业务和灵活的资费模式;三是网络安全场景,利用AI能力,在恶意流量攻击的早期就能正确识别,对于潜在的、前期未有训练数据的恶意报文也能进行预警。
不难发现,AI能力有效的解决传统电信网络在运维、业务创新和网络安全等方面面临的挑战,这让网络AI化成为了电信网络升级的必由之路。
云地协同
对网络AI化的价值和意义
当网络AI化成为了电信运营商的一种共识,AI技术与场景结合在走向落地的阶段,也遭遇到一些AI规模化应用的新问题。
很多运营商在网络AI化的实践中发现:网络AI在走向规模化工程应用的过程中存在很多挑战,如模型泛化能力差、模型易老化、本地样本少等问题。
这些问题也的确存在很多共性,比如模型泛化能力差会因为本地资源受限,导致AI模型规模应用难,如果三个月不更新AI模型,应用的精度就下降到70%以下,同时部分场景单局点样本量少,又不足以支撑模型训练。
正是看到了这些共性的难题,华为提出云地协同创新方案,希望通过云地协同,来加速AI特性的规模部署。
那么,什么是云地协同?
按照官方的定义,云地协同是指:云端和地端一起协作完成数据样本上云,模型状态管理,模型重训练,模型/ 知识下发、择优更新等一系列的闭环任务,同时把云端汇集的全局网络知识经验、全量数据训练得到的高精度模型,持续注入地端,让电信网络能够进行智能的迭代升级,变得越来越聪明。
简单的理解,这种模式其实就是把数据服务和模型训练这些较“重”的工作放在云上去做处理,然通过将一些较“轻”的本地模型推理放在边缘设备上,一重一轻,兼顾了高质量的同时做到了及时性。
也许很多人会有这样的疑问,云地协同将AI的训练与推理进行了拆分,这是不是本身对网络传输的要求就会更高。没错,云地协同最关键的一点就是要保证云端和地端要有快速的通道。同时,从地端到云端,信息可以从运营商上传到云端,而从云端到地端,可以下发新的模型。
在这个过程当中,地端会对模型进行监控和评估,而云端会存储超过3个月以上周期的样本生成相比本地更高质量的模型。同时,云端通过汇集和沉淀专家经验和产品知识,运用知识图谱等技术,形成 “网络知识库”,这些知识又可以持续注入地端,通过云与地之间的相互印证不断优化,达到提升网络智能水平的目的。
从场景化与用户视角
解决网络AI规模复制难题
我们知道,任何技术只有在场景中发挥价值,才是商业化成功的基础,网络AI化如此,云地协同亦如此。
所以,针对电信网络的不同应用场景,华为云地协同在实际应用部署时也提供了不同的模式。
比如,核心网变更在线机器值守这种模型简单,算法结构稳定的场景。华为采取了云端进行初始模型的训练,运行态由地端根据新增的样本进行在线学习,持续保持模型的精度;
再比如,无线KPI异常检测这一类模型相对复杂的场景,华为则在云端进行模型的分发,然后在地端根据新增样本进行在线学习;而如IP RAN/PTN智能告警,DC PUE优化等模型复杂、需要用到华为云端高质量标注数据,知识图谱以及仿真等知识能力进行模型优化的场景,华为则利用云地实时协同,让模型可以自动化演进。
从效率的角度,云地协同可以提升模型泛化能力和训练效率,同时通过构建网络知识库,会提升故障运维辅助效率。而从安全的角度,因为建立了云端仿真,所以模型及业务验证安全高效,同时也会提升模型版本管理效率,加速AI特性更新。
不难总结,云地协同可以实现一点生效,全网复制,AI的特性在一个局点成功实施后,快速 的形成知识和经验,在其他局点进行复制,实现在全网规模应用。
客观地说,云地协同模式,是华为在网络AI化的趋势中,通过具体应用场景的需求,逆推出来的成果,其对电信网络智能化升级的意义深远。