业内迫切需要新型的电信服务保障:自适应的服务保障可提供端到端的网络洞察力
自适应服务保障需求
在网络向5G迁移的过程中,运营商面临着三个紧迫的挑战:(1)网络的复杂程度呈数量级增加;(2)随着网络虚拟化和云原生化,对网络的洞察力会降低;(3)用户对体验质量的期望越来越高。造成网络越来越复杂的原因有很多,如控制面和用户面分离(CUPS)、5G独立组网的云原生网络功能、基于服务的架构(5G)、网络致密化等。因此,更多的电信堆栈部分开始生成更多的性能、故障和遥测数据。这让大多数运营商不堪重负,无法及时地响应并解决服务质量劣化问题。
但业内更加迫切地需要及时发现并解决网络性能劣化问题。推动5G投资的商业案例所要求的吞吐量、响应能力和可用性远远超出运营商通常承诺的水平。然而,这一次服务等级协议可提供保证,所以如果网络无法达到要求的标准,就会造成相应的显性成本。
虽然向基于软件的5G核心网迁移的前提是要简化电信堆栈,但现有的部署方案只会使事情变得复杂起来。最终会向Open RAN(开放式无线接入网)迁移,将先前专门构建的硬件分解成一个多厂商、以IT为中心的技术栈,这会使情况进一步复杂化。运营商迫切需要了解基于Kubernetes的编排环境的性能,以及各个节点/pod和容器指标,才能将它们与客户体验关联起来。
简而言之,原有发现并解决性能劣化问题的旧方法已不再适用。今天的服务保障工具已无法确保运营商能够履行对客户的承诺和服务等级协议。针对4G和更早网络设计的工具既不能应对网络生成的海量数据,也不能应对数据源成倍增加的情况。5G服务性能劣化问题跨越各个网络域、层和服务,使我们很难获得端到端的网络洞察力或让相应的团队难以解决问题。
因此,需要一种新的5G服务保障方法。我们称之为自适应的服务保障。其中的关键词为“自适应”。但为什么“自适应”非常重要?现在之所以需要自适应的服务保障方法,有多个原因:
- 它是能够在各种数据源之间实现端到端网络可视性的唯一方法
- 它是能够应对所生成的海量数据的唯一方法
- 它是能够应对复杂的物理、虚拟和云原生网络的唯一方法
- 它是能够进行扩展,以解决网络功能实例倍增以及网络致密化问题的唯一方法
- 它是能够将网络和IT基础设施性能与客户体验质量关联起来的唯一方法
- 它可提供更加经济高效的部署模型,特别是针对基于消费的云原生解决方案
实现自适应的服务保障
我们已经确定了需要一种新的服务保障方法,该方法能够适应运营商的特定电信和IT栈及其生成的性能、故障和遥测数据。接下来,我们考虑一下运营商如何才能实现自适应的服务保障。
充分利用现有的数据源,在可能的情况下对其进行补充。
首先,充分利用当前可用的数据。这些数据可能来自现有的EXFO或第三方探针,如被动探针或综合测试解决方案。它们也可能来自OSS或BSS系统,这些系统提供北向数据传输或API访问功能。
其次,应该用来自服务路径和技术/基础设施堆栈内的新数据源的数据(包括虚拟工作负载数据)补充当前的数据。由于客户体验对5G的成功至关重要,因此在从网络核心到RAN以及IT堆栈各处获得洞察力非常关键。
最后,运营商应该考虑使用来自全新数据源的数据,如社交媒体情绪数据、车辆交通数据或街道人群数据,以了解网络特定时间和特点地点的情况。
自适应地采样数据
将所有数据收集和保存起来以备以后分析时使用的老方法已经行不通了。在云原生世界里,电信运营商将一些(或全部)网络功能托管在超大规模平台上,且根据消费来付费成为常态,所以将所有数据都保存起来在经济上已不再可行。因此,就需要能够自适应地采样数据。这意味着只收集将网络性能同客户体验关联起来所需要的数据。
自适应地传输和保存数据
由于数据量非常庞大,更不用说云原生环境的经济因素,所以对需要通过网络传输的数据量进行限制就变得非常重要。不是将原始数据从RAN传输到网络核心进行分析,而是在本地分析数据,然后通过网络传输通过分析获得的KPI和KQI。如果所得好,可将传输的数据量减少90%甚至更多。这种方法将原始的性能数据保存在本地,而这些数据随时可用于深入地排除网络故障。
自适应地采集数据
采集数据的地点和时间也是一个重要的考虑因素。能够在网络条件出现变化时将监测点和测试探针实例化非常关键。除了沿着服务路径部署探针外,在发生服务间通信的服务网格(service mesh)以及在整个计算堆栈内部署仪表进行测试也很重要。在计算堆栈内部署仪表时,能够将资源(即CPU、网卡、内存)的使用情况与网络性能和客户体验联系起来会大有帮助。
自适应基础设施
自适应服务保障平台是可以与现有的网络和IT基础设施协同工作的平台。它应具备云原生的组件——基本上使平台能够面向未来——便于在超大规模云计算巨头的云环境,以及离散平台(如Oracle Cloud和Red Hat OpenShift)上部署与采用Kubernetes进行编排。它也可以部署在混合的网络环境中,也可以通过本地托管的虚拟机部署。对于RAN,它应该能够支持单厂商设备或多厂商的设备网络环境,对爱立信、诺基亚、三星、华为、中兴和康宁等厂商设备生成的数据进行本地解析。
自适应工作情景和用例
最后,自适应服务保障平台需要满足各个运营商团队和用例的要求。在理想情况下,它将提供共同的用户体验,以及常见的监测、报告和排障工具。这些已被证明可以提高人员的生产效率,并减少解决问题所需要的时间。这种跨网络域、层和服务的方法支持的用例包括:
- QoE得到优化的5G传输
- 5G传输QoS保障
- Xhaul光纤监测
- 移动边缘计算(MEC)保障
- 5G基础设施保障
- 专网保障
EXFO的自适应服务保障平台
为满足自适应服务保障的要求,EXFO开发出一个具备以下特点的平台:
- 获取开源的数据,支持来自网络功能、基础设施、探针、解析器、EXFO服务保障解决方案、OSS和BSS系统以及第三方服务保障方案的数据。
- 进行自适应的数据采集,能够在网络边缘采集并保存数据,仅传输必要的数据以创建用于仪表盘、监测和告警的KPI/KQI,同时维持原始数据的可访问性,便于深入地排除故障。自适应地采集数据可以将探针抓取、传输和保存数据的成本降低90%甚至更多。
- 具有大数据处理层,能够关联、丰富并缝合数据记录,以提供对真实网络性能和实时客户体验的独特洞察力。
- 配备一套应用,这些应用可以协同工作,为多个服务保障用例提供统一、直观的排障与报告用户体验。
- 采用开源平台的部署方式,支持三大云计算巨头的云平台和Kubernetes环境、Oracle Cloud和Red Hat OpenShift,以及虚拟化和裸机应用场景。