可视化ip网络运维 技术白皮书 - huawei...5...

38
可视化IP网络运维 技术白皮书

Upload: others

Post on 31-Mar-2020

24 views

Category:

Documents


0 download

TRANSCRIPT

可视化IP网络运维技术白皮书

可视化IP网络运维技术白皮书

1 概述 ............................................................................................................................... 2

2 IP运维中的三个“不可视” ............................................................................................ 3

3 华为可视化IP网络运维解决方案 ..................................................................................... 5

4 业务质量监控 ................................................................................................................. 8

5 网络性能质量监控 ........................................................................................................ 11

6 部署方式 ...................................................................................................................... 14

6.1 U2520 系统探针的部署及基本组网形态 ......................................................................... 14

7 指标评估体系 ............................................................................................................... 19

7.1 SLA评估 ............................................................................................................................ 19

7.2 层次化度量 ...................................................................................................................... 21

8 相关标准 ...................................................................................................................... 26

8.1 MOS .................................................................................................................................. 26

8.2 RFC4445-MDI .................................................................................................................... 27

8.3 MOS-V ............................................................................................................................... 28

9 典型应用 ...................................................................................................................... 29

9.1 逐流MDI、VMOS视频监控方案 ....................................................................................... 29

10 互联互通 .................................................................................................................... 31

10.1 EANTC测试(视频监控测试) ............................................................................................. 31

1

摘 要: ALL IP化是未来网络和业务发展的趋势,同时终端用户对业务体

验要求越来越高。当网络承载IP化后,客户最大的感触就是看不

到承载的业务质量,运营商将会遇到两个困扰,第一,如何缩

短IP网络的业务配置和故障定位时间,实现大规模IP网络的高效

运维;第二,如何通过对网络质量的监控和管理满足用户对QoE

的要求。华为可视化IP网络运维解决方案使IP网络运维部门可以

看到和业务部门一致的QoE指标,故障定界一目了然。本文将逐

一介绍IP可视运维相关技术,以及它们在华为IP可视运维解决方

案上的典型应用。

关键词:U2520、VoIP、IPTV、HSI、O&M

2

目前,VoIP、IPTV、HSI(高速上网业务)、移动服务、VPN业务、游戏

以及越来越多的增值业务在IP/MPLS网络上运行。如何管理客户的各种质

量体验(QoE)、实时监控业务质量、业务出现故障时准确快速故障定位、

新业务开展前的能力评估、7*24小时的业务综合质量评估是电信运营商

面临的新挑战。

对于承载着各种业务的IP/MPLS网络,目前虽然有综合网管进行配

置、管理和维护,但如何判断承载的业务质量劣化、如何评估网络承载

业务的能力、如何监控网络健康状况,特别是当网络出现故障的时候,

如何通过测试手段快速而准确地定位故障点、区分是业务平台的问题还

是网络自身问题成了当前IP网络维护面临的新挑战。

1 概述

3

由于IP网络运维存在三个“不可视”,存在黑匣子现象,导致运维

效率低。

第一个不可视:承载的业务品质不可视,不能感知终端用户体验。

传统网管只能提供网络的性能,看不到内容的承载质量,网络性能与业

务品质是分离的,业务部门和网络部门认识故障的维度不统一,没有统

一的度量尺度,造成故障定位需要跨部门专家协同工作,人员技能要求

高,故障定位效率低,互相推诿责任的现象时有发生。

第二个不可视:路由不可视,看不到业务路径。IP网络引入动态路

由,三层网络是一片云,看不到业务的路径。路由不可视导致在IP网络

运维过程中,经常出现终端用户申报了故障,而当运维人员进行故障定

位时,故障又消失了,故障无法重现,又没有历史信息可以查询,无法

找到故障原因,无法彻底解决用户的问题,造成排除故障隐患困难,并

且需要高水平的数通专家参与故障定位。路由不可视还导致运维人员无

法预防路由振荡引起的全网故障,路由振荡对网络的影响是灾难性的,

最坏可以引起网络瘫痪。

第三个不可视:端到端管道不可视,创建过程复杂,且状态不可

视。端到端管道的创建过程需要跨域部署,并且配置内容复杂,传统

的单域网管不能实现可视化的高效下发,下发后也不能看到IP管道的状

态。在业务部署过程中,需要运维人员全盘考虑每个节点上业务部署的

参数和参数之间的相互关系,一旦发生参数配置错误,也很难检查和纠

正,对IP运维人员的专业技能要求高。

面对上述难题,运营商的网络运维部门往往很头疼。IP网络的可靠

性真的很低吗?

2 IP运维中的三个“不可视”

4

探索解决方法

其实,IP网络的可靠性并不是无法解决。在IP网络运维中,我们需要

一个很重要的思想转变,即从被动运维转为主动运维。

相比以前的接到终端用户投诉再进行网络故障检测的被动运维模

式,IP网络的运维要求更高,需要运营商根据网络的日常运行状况提前

预警网络的薄弱环节,提前预防。因此,运维模式的转变在All IP化道路

上显得非常重要,那么到底什么样的主动运维才符合IP网络呢?

主动运维要求实现对终端用户的业务体验监控,运维人员周期性地

收集网络性能和业务品质数据,并通过分析数据,将其中的趋势内容挖

掘出来,对潜在的故障点和薄弱环节进行预判断,使运营商可以提前感

知终端用户的业务体验程度,预先判断业务是否会发生劣化,并提前解

决由此带来的一系列问题,从而降低终端用户投诉,提高客户忠诚度,

并降低运维成本。

运营商在运维系统的投资驱动力的分布情况,验证了IP主动运维的

必要性。Gartner的调查结果表明,“主动预防网络性能问题”是当前运

营商首要的运维投资驱动力,占整个投资的27%,而“快速网络故障诊

断”、“业务质量保障SLA”分别排在第二、第三位,其投资驱动力分别

为15%、12%。

IP网络运维有以下三个要求:快速解决故障,即当网络和业务出现

故障时,需要快速解决问题,实现迅速的故障定界和定位;主动预防问

题,即对业务质量和网络性能实时监控,及时发现问题,IP承载网的故

障需要关联到被影响的业务上,并通过趋势分析,提前做出预警;网络

日常管理,即建立网络质量监控和健康评估系统,通过整套的KQI/KPI指

标体系来反映和管理用户体验,掌握网络的实际运行状态,不断提高终

端用户的忠诚度。

可度量,才可管理;可管理,才可改进。在网络IP化后,最先需要

解决的问题就是可度量,即IP运维要做到可视。

5

下图是华为全生命周期运维解决方案,其中IP网络和承载业务的可

视化运维主要以U2520承担。

IP网络的管理方法是多种多样的,但只有充分跟业务关联,关注QoE

指标,真正实现IP网络运维的可视化,才能保证网络的可靠性,才能更

好承载各种业务。华为开创IP网络可视化的业界先河,成功实现IP业务质

量、路径和部署的可视化,彻底解决IP运维的黑匣子问题。

U2520是华为公司最新推出的IP网络评估系统,是实现可视化IP网络

运维的关键部件,支持全宽带业务运营,由业务监控系统网络评估单元

两部分组成。

业务监控系统可以实现网络质量监控、业务质量监控、按需测试、

阈值告警管理、探针管理、系统管理和报表管理功能。

网络评估单元是盒式外置探针,可以部署在网络接入层和汇聚层,

实现对网络和业务性能数据的采集并上报给监控系统。

图1 华为全生命周期运维解决方案

3 华为可视化IP网络运维 解决方案

Services Mgmt.

(Customer QoE

Assurance)

N2510-

Fiber/Copper

Line Assurance

U2520-

IPTV/VOIP/HIS/VPN

Services Assurance

Service CentersNetwork(access/metro/backbone)

Metro Backbone

PE

PE

Access lineHome

Network Mgmt.

U2560-

Home Network

Unified Mgmt.

MDS 6600-

Network Planning

and Designing

U2000-

IP/Transport/Microwave/PON/

DSLAM unified Mgmt.

FTP Youtube

VoIP

Webgame

IPTV

6

图2 业务品质监控方案网络定位

U2520业务品质监控方案基于分布式分层架构,总体架构分为:探

针度量层,服务器数据分析采集层,用户Web页面呈现层。如图中度量

层所示,业务品质监控方案在VOIP、HSI、IPTV以及Multiplay应用场景中

可以得到能力的充分发挥。再如图U2520 Center的服务器数据分析采集

层用来管理NEU100探针网络,收集探针采集的KPI指标在接入层铜线探

测部分,可以结合华为N2510系统,从而得到真正意义上的网络业务端

到端质量监控。在用户Web页面呈现层U2520提供KPI数据的深度挖掘,

以及客户订制化的报表系统。

U2520就像IP网络的“仪表盘”。华为U2520被誉为IP网络的“仪表

盘”。华为U2520的技术优势体现在以下两个方面:

IP转发平面可视:感知IP承载业务品质,全面监控IPTV、VoIP、HSI、

VPN业务,真实反映终端用户的业务体验,通过业务承载质量的逐段对

比,实现基于业务的故障的定界和责任划分,便于维护人员对IP转发平

面的故障进行快速处理。IP网络运维部门和业务运营部门拥有相同的QoE

指标,业务故障的界定一目了然。

IP控制平面可视:IP业务有了路径,实现自动计算并显示业务路径,

动态监听和分析路由变化,可以预防路由振荡引起的全网故障,用于维

护人员对IP控制平面的故障进行快速分析、预警和定位。

Center

Inregraclon OSS Ord Party

Service Standus & SL A Roaporting

Access Metro Edge

BTS BSC MGW

Access Backhaul Backbone

GSM/Base Station

Center

Internet

IPTV

Softx

Visualize

Analyze

Measure

HSI VoIPIPTV

7

IP转发平面可视和IP控制平面可视相结合,转发平面主动模拟业务

报文测试过程,可以结合业务路径进行测试。一旦三层业务路径发生变

化,转发平面的测试也动态调正,转发平面的测试也就可以实现对业务

承载的自动化监控管理;一旦发现业务承载质量有劣化趋势,即可自动

触发智能专家诊断系统,在短时间内发现劣化的根因,并通过专家诊断

系统给出问题处理建议,将IP网络运维效率大幅提升,并有效提高终端

用户的满意度。

在全面监控IP转发平面和控制平面的基础上,华为U2520提供完善的

指标体系,提供网络建康评估系统,并提供运维工作的评判标准,提高

网络运维能力。通过指标体系的分析统计,基层运维人员能够在解决眼

前问题的同时,发现问题产生的根源,并针对性地加于改进,以规避人

为因素导致的一些故障,从而实现运维效率的持续改进提升。

U2520还能实现业务监控全网化,提供多厂商设备组网的业务品质

监控解决方案,满足运营商各种组网环境的监控要求。

与U2520共同使用的华为U2000网管系统,支持E2E业务参数的资源

池管理,通过点击源、宿节点即可完成E2E业务的自动创建,系统动态

分配业务参数,自动管理各网元上E2E业务参数之间的逻辑关系,自动

检查配置,自动校验通断,一次开通业务,并支持一站式多网元批量配

置,端到端业务发放VPN,端到端可视操作,管道质量可视化展现,易

学易用。

8

IP业务面临的挑战:业务覆盖面广、业务特性复杂,业务流量大,

在业务开展前如何进行业务评估、当业务质量出现劣化的时候如何提取

进行预警,当业务出现故障的时候如何定位是业务问题还是网络问题、

是业务的那一部分出了问题。这些都是运营商业务开展面临的新问题。

U2520IP业务质量监控包括对HSI业务、IPTV业务、VoIP业务、L3VPN

业务的监控,业务监控分为两种模式:主动监控和被动监控,主动监控

指通过探针模拟用户行为对业务进行质量评估、实时监控,这种方式的

优点是部署灵活、易于故障定位;被动监控指接收现网真实业务流,对

每条业务流,每一个业务会话进行质量评估和监控,这种方式的优点是

准确、覆盖全,缺点是探针成本高、需要镜像流、部署难等。

4 业务质量监控

图3 U2520业务结构

聚合 聚合

聚合

业务定义为

SAP被组织在SAP组以后,根据SAP组的拓扑类型,

业务下所有的SAP就可以形成任意想要的SAP拓扑关系。

分属不同的

SAP组管理

业务访问点(SAP)

业务访问点(SAP)

业务访问点(SAP)

业务访问点(SAP)

业务元素

业务元素

业务元素

业务元素

业务元素

CCTV1

CCTV2

BTV1

BTV2……

www.sina.com

www.sohu.com

www.google.com

……

SAP组1

星型

SAP组3

星型

SAP组4

星型

SAP组2

全连接

9

U2520定义的业务由业务元素(Service Element)、SAP、SAP组构成,

业务元素(Service Element)是业务的子业务或业务的一部分,它也可 •

以进行质量评估。比如从用户来看,有线电视提供商、网络提供商

是服务提供者,而CCTV、北京电视台、Sina、Sohu等具体业务就是

业务元素,它通过提供商的网络服务,可以被评估。

业务访问点SAP(Service Access Points)是指某业务“交付”给用户的地 •

方,业务访问点只是“概念”上的某个地点。业务访问点的概念主要

是用来区分客户域和服务提供商域的边界,服务提供商把符合SLA的

业务推送到所有的业务访问点上,因此,每个业务至少有一个业务访

问点,一个业务访问点只能属于一个业务每一个用户通过业务访问点

(SAP)访问业务。

实际上,对一个业务的管理就是对业务下所有业务访问点的管理。 •

另外,业务访问点最终要附着在物理网络上。在U2520的业务监控

中,所有测试例都是基于业务访问点生成,业务访问点需要同时关

联网元的某个接口,表示业务访问点的位置,还要关联探针接口,

表示要用来发起测试的设备。

图4 SAP定义示意图

业务访问点 业务访问点

接入设备 接入设备

网络边缘 网络边缘

运营商网络(多业务网络)

接入网络或租用线路接入网络或租用线路

运营商管理部分

DSLAM

交换机低端

路由器

……

DSLAM

交换机低端

路由器

……

10

IP业务可分为两类:单业务访问点业务和多业务访问点业务。

单SAP业务只需要一个业务访问点即可以完成业务的访问,比如 •

BTV、VoD、HSI等,这种业务的特点都是业务访问点去访问网络服

务器提供的业务。

多SAP业务需要两个或两个以上SAP才能完成一次业务的访问,比如 •

VoIP业务、P2P业务等,这类业务需要业务访问点进行交互才能完成。

SAP组:多个SAP可以被划成不同的业务访问点组,由于业务访问点 •

组具有星型和全连接拓扑结构,因此通过SAP分为不同的组,可以把

SAP组成任意的拓扑结构,支持各种业务拓扑测试。

U2520可以对IPTV/VoIP/HSI等终端用户的业做作各种关键指标的测

试,从而很好的评价终端用户业务的质量。下表为当前版本(V2R1)支持

内容:

网络类型 支持的测试类型 支持的测试指标

BTV业务VOD业务

Muliticast receive testRTSP test

BTV[频道切换时间/MOS/丢包率]KQI

组播接收[抖动/DF/MLR]KQI

RTSP[流控制时间/连接时间/丢包率/抖动/TCP重传] KQI

RTSP[DF/MLR/MOS/TCPRT15/TCPRT24/MLT24/MLT15]KQI

Video RTP Test 视频 RTP [MLR/丢包率/MOS/抖动/DF]KQI

HSI业务

FTP test FTP [下载速率/上传速率] KQI

DNS test DNS [解析] KQI

HTTP test HTTP [首包到达时间/页面下载时长] KQI

PPPoE test PPPoE [协议时长] KQI

VoIP业务DHCP testVoIP RTP test

DHCP [IP地址获取时间] KQI

VoIP RTP [丢包因子/R值/MOS/时延/抖动因子/抖动/丢包率] KQI

L3VPN业务UDP Jitter testTcp test

L3VPN[UDP抖动/丢包率/时延]KQIL3VPN(TCP时延)KQI

表1 业务测试类型

11

U2520可以用来对IP/MPLS网络质量进行实时、全面监控。网络监控

核心技术是华为内置探针NQA(Network Quality Analyse,网络品质分析),

它是一种能够实时对网络质量进行检测及诊断的技术,通过统计诸如抖

动(Jitter)、时延(Delay)、丢包(Packet Loss)这样的性能数据来对网络性能进

行度量。NQA以测试例为单位进行测试,配置方式灵活,既可通过命令

行手工配置也可使用U2520进行远程配置和采集数据。每一个测试例中

都包含了一系列的测试策略选项,可以对测试例发送的报文长度、发包

间隔以及协议类型等等参数进行配置;通过配置这些参数NQA可以根据

当前的网络情况灵活的进行测试。

5 网络性能质量监控

图5 U2520网络结构示意图

IP路程

IP Site MPLS Site

LSP

MPLS网络IP网络

IP连接

12

U2520监控的网络分为物理网络和逻辑网络,物理网络由网元和网

元之间的物理链接构成,物理网络主要管理物理网元的所有特性,比如

接口、单板、机框等,对物理网络的度量包括物理网元的CPU利用率、

内存利用率、接口丢包率、接口带宽利用率等。

逻辑网络由网络站点(Site)和逻辑连接构成,一个物理网络可以抽象

出多个不同的网络站点,如上图,中间连接两个逻辑网络的路由被抽象

成IP站点和MPLS站点两个逻辑网元,分属于IP网络和MPLS网络,不同的网

络站点包含不同的网络接口,比如,MPLS站点只包含MPLS接口。U2520

对逻辑网络的监控主要是对逻辑连路和逻辑路径的时延、抖动、丢包、

连同性、Trace等监控,同时具备对他们的故障定位和故障定界功能。

U2520 网络监控具有以下特点:

承载网能够提供具备业务感知能力的网络故障诊断、网络品质监控 •

能力,从而有效确保承载网能够满足对用户承诺的SLA要求。

U2520系统提供丰富的故障诊断工具包,能够根据网络、业务层次 •

关系智能关联,提供快速问题定位,从而大幅减少问题定位时间。

对于承载网上的典型业务,通过基于流特征的数据仿真,能够得到 •

仿真业务的承载情况报告,从而对承载网的承载能力有准确的了

解,便于根据情况动态调整策略,不断改善网络状况。

13

网络类型 支持的测试类型 支持的测试指标

L3VPN网络  

UDP Jitter test网络UDP抖动和丢包率的KQI

网络链路UDP时延KQI

Tcp jitter test 网络链路TCP时延KQI

ICMP Jitter test 网络链路ICMP时延、丢包率、抖动的KQI

MPLS网络 

LSP Jitter test 网络LSP时延、丢包率、抖动的KQI

LSP TE Jitter test 网络LSP TE 时延、丢包率、抖动的KQI

物理网络 

Card Statistics 网络 [负荷] KQI

Physical Port Statistics

网络接口 [丢包率] KQI

网络端口 [带宽利用率] KQI

IP 网络 UDP Jitter test 网络UDP抖动和丢包率的KQI

表2 网络测试类型

U2520可以对IP/MPLS以及物理网络做各种关键指标的测试,从而很

好的评价网络的质量,下表为当前版本(V2R1)支持内容:

14

6.1 U2520 系统探针的部署及基本组网形态

U2520系统所采用的探针按照不同的部署位置分为以下3种探针部署

方式:终端用户接入层部署,汇聚层部署,承载层部署。

终端用户接入层探针部署方式

U2520系统所采用的主动探针均配置FE接口,采用EF接入的部署方式

的优点在于最靠近真实用户侧,业务监测的效果最接近真实。但是由于

探针是部署在用户端,探针部署规模会比较大,这样部署在监测的业务

数量比较多、探针部署数量比较大的情况下,U2520系统会占用相对较

多的带宽资源,会对真实业务产生一定影响。所以建议以这种方式部署

探针的时候可以有选择性的选取有代表性的部署位置例如重点客户,或

者某个DSLAM下游Modem处挂接主动探针。

6 部署方式

Copper Line

Copper Line

DSLAM

IPTV

PC

Modem FE

Fiber FE/GETo Metro Ethernet

15

网络汇聚层探针部署方式

在汇聚层节点部署的探针我们可以提供FE和GE接口,当采用主动模

拟真实业务的方式进行业务品质监控时,只需要普通的GE或FE口。如果

采用被动监测的方式时这需要使用镜像端口,同时根据需要监控的端口

配置相应的镜像关系。

IP承载层核心或边缘路由器探针部署方式

IP承载层边缘/核心路由器处的探针部署方式类似于汇聚层节点探针的

部署模式。如果需要该位置部署主动探针可以采用Fiber/LAN/FE/GE接口直

接连接路由器,如果选择被动探针对网络中的音视频信号进行实时监控,

在不考虑增加路由器负荷的情况下可以选择端口镜像的方式连接设备。

Fiber FE/GE Fiber FE/GE

SwitchFiber/LAN FE/GE

Controller Responder

IP Network

16

U2520探针的基本组网形态

双设备配合回环

GPS

CDMA

NTP

DestinationSource

C/S模式

ServerIP Network

Service(DNS, Email, Web, etc.)

Client

Server

17

各级探针拓扑与U2520分布式层次化管理

各个地市之间、市内各个区之间的探针采用Full Mesh的拓扑连接方

式即所有部署探针的节点之间建立全连接关系。如下图所示:

被动监控视音频流

Receiver

Media

路径trace

Source

IP Network

18

各个地市到省干出口、各个区到市网络出口的探针采用Hub&Spoken

的拓扑连接方式即中心节点与边缘节点之间逐一建立连接关系,如下图

所示:

则在整体上可以得到一个清晰分层的U2520管理系统,如下图所

示:蓝色代表地级市(AR之间)的Full Mesh拓扑,橙色代表省干(BR)与地级

市之间的Hub&Spoken拓扑。

IP NetworkController

Responder

Responder

Responder

省干

A市

B市

C市

Web

U2520

19

7.1 SLA评估

SLA(Service Level Agreement)是两个团体间经过交流、协商签署的正

式合同,它被广泛应用于各个领域,对于电信运营而言,集团可以与分

公司签立质量SLA合同、运营商可以与SP签立质量SLA合同、运营商经常

与最终客户签立SLA合同。SLA可以包括方方面面的内容:服务性能、解

决问题时间、故障时间等等。

随着电信业务的飞速发展,市场价值链变得越来越复杂,越来越多

的SP为终端用户提供电信业务,只有在整个价值链都有SLA监控,终端用

户的质量才能得到保障,任何一个环节对SLA的理解出现偏差都可能导致

端到端业务质量。下图SLA评估关注内容。

7 指标评估体系

图6 SLA评估4重奏

Measurement测量

定义网络、业务的整体评价标准

对被评估对象(网络、业务)的抽象 建立指标体系

通过实测获取数据

SLA服务水平协议

Inventory存量

Metric度量

20

U2520专注于IP业务和网络的SLA评估,总结了运营商在IP业务开展

和IP网络运营过程中最为关注的指标体系,形成了一系列的SLA条款,用

户可以在不同场景选择自己关心的指标添加到SLA中,简要如下:

HSI业务指标:PPPoE拨号时长、DNS解析时间、HTTP下载时间等。 •

VoIP业务指标:R-Factor、MOS、时延、抖动、丢包等。 •

IPTV业务指标:v-MOS、MDI(DF、MLR、MR、MLT)时延、抖动、丢 •

包等。

网络指标:时延、抖动、丢包、带宽利用率、接口错误数等;LSP •

时延、抖动、丢包;LSP TE时延、抖动、丢包等。

U2520中SLA主要用于评估业务和网络。

评估业务的时候,可以用于评估整个业务、某个SAP、某个SAP组, •

当评估整个业务的时候,业务下的所有SAP点都会被评估、每个SAP

点的质量都会以权重形式影响业务质量;

评估网络的时候,网络下关联的所有存量都会被评估,比如网络的 •

LSP、连接、路径、接口等等。U2520根据客户在SLA中添加的质量

指标、业务或网络关联的存量自动批量产生测试例、存量变更时自

动修改测试例,减少客户配置测试例工作。

21

7.2 层次化度量

SLA(Service Level Agreement)是两个团体间经过交流、协商签署的正

式合同,它被广泛应用于各个领域,对于电信运营而言,集团可以与分

公司签立质量SLA合同、运营商可以与SP签立质量SLA合同、运营商经常

与最终客户签立SLA合同。SLA可以包括方方面面的内容:服务性能、解

决问题时间、故障时间等等。

随着电信业务的飞速发展,市场价值链变得越来越复杂,越来越多

的SP为终端用户提供电信业务,只有在整个价值链都有SLA监控,终端用

户的质量才能得到保障,任何一个环节对SLA的理解出现偏差都可能导致

端到端业务质量。下图SLA评估关注内容。

图7 层次化指标体系示意图

SLA KQI

中间 KQI

KPI

原始数据

业务和网络KQI

SPA LSP连接路径单板 接口等KQI

业务测试结果 业务统计数据 网络测试结果 网络统计数据

22

KPI

一般而言,运营商总是定期报告网络或业务的关键性能指标(KPI:

Key Performance Indicators),这些KPI都是运营商特别关心的数据,它们都

非常原始地反映了网络和业务某一时刻的性能状况。然而,这些指标无

法提供端到端性能状况、无法说明一段时间内质量状况到底如何、更无

法说明综合业务状况到底是好还是坏。虽然KPI有诸多缺点,但KPI的原始

性和KPI已被广泛应用的现状还会支持KPI在评估体系中占据重要角色。

KPI指标计算:

KPI表示某一时刻某对象的性能值,KPI可能由多级KPI汇聚而来;

KQI表示某对象在一段时间内多个KPI的越限率。KQI由下级KQI或KPI计算

而来。

大部份KPI都是从原始测试结果中直接借用过来, 也有KPI是通过多

个测试结果计算而来。

举例:

VOD业务测试,VideoRTP测试 KPI:VideoUpJitterKPI

KPI=[AboveThPkts/(AboveThPkts+BelowPkts+BetweeenThPkts)]*100%

需要直接采集的指标:

AboveThPkts、BelowThPkts、BetweenThPkts、MaxJitter、MinJitter

其他详细的KPI指标计算请参考《U2520监控指标整理.xls》

23

KQI

为了全面、准确、持续评估网络的状态和鉴于KPI的缺点,关键质量

指标KQI(Key Quality Indicators)应运而生,KQI用于评估产品、产品组件、业

务、业务元素、网络、等的某一个方面,反映了某一事物的健康状况。

KQI是一个聚合值,它通过KPI或原始数据聚合而来,聚合过程中用户可根

据重要性自由设置原始指标的权重,KQI本身组成一个层次化的体系。

KQI计算方式:

对于Service来说, 有SAP Kpi, SAP Kqi, SAP Kqi是SAP点所有KPI计算

而来,计算的原则是统计SAP Kpi越限百分比就是SAP KQI, Sla KQI(Service

KQI)由 SAP KQI计算而来,计算的原则是平均所有SAP的KQI,平均的时候

用计算SAP KQI用到的Kpi个数做权重。

对于网络KPI、KQI来说, 是通过Connection、Trail的KPI、KQI向上汇

聚成网络的KQI,或通过接口的KPI、KQI向上汇聚到单板的KQI、设备的

KQI、最后到网络的KQI, 计算的下级KQI向上级KQI汇聚的时候,计算原则

也是平均所有下级KQI得到上级KQI,平均的时候用计算下级KQI用到的Kpi

个数做权重。

说明: 实际上, 上级KQI可以至今通过KPI计算而来, 最终的结果与

通过权重的方式汇聚下层KQI的值应该是相等的。

有些KQI只能作为报表、趋势查看用,比如SAP KQI、Channel KQI。

举例:

VOD业务测试,VideoRtpUpJitterKQI测试,输出视频 RTP [异常抖动报

文率] KQI

KQI = [∑(A(KPI))]/n

依赖KPI:VideoUpJitterKPI

其他详细的KQI指标计算请参考《U2520监控指标整理.xls》

24

KQI采用三维聚合:时间维度、指标维度、存量维度。同一指标可以

按时间维度聚合成一个KQI,这是U2520比较常见的KQI聚合方式;不同指

标可以根据权重聚合成一个KQI;不同存量的指标可以根据权重聚合成一

个KQI; 这三个维度的指标也可以同时参与计算。

KQI作为SLA的基础组成部分,它最基本的功能就是用来计算SLA满足

度。一般情况下,一个SLA包括多个KQI,对U2520来说,包含两种SLA:

(或业务SLA)和内部SLA(或网络SLA),客户SLA只包含业务相关的KQI,表示

服务商为客户提供业务的质量;内部SLA只用来评估网络,表示网络运营

商用来评估自己内部网络的监控状况。

U2520通过存量模型以及SLA定义驱动出的Metric实例,构成了层次化

的网络结构。

图8 KQI的三重聚合

Time

Metric Type

Inventory Instance

25

在这个网状结构中,Metric实例间相互关联在一起,这种关联也表达

出指标间的计算规则,我们称其为“指标聚合计算规则”。U2520系统

中,主要支持三种类型(或维度)的指标计算:

存量维度指标聚合计算(简称为“I计算”) •

这种计算利用了存量对象间的聚合(或包含)关系,将下层存量对象的

指标,汇总为上层存量指标。根据存量权重是否参与计算,可细分为:

i. 存量权重不参与的I计算

例如:Protocol Interface Traffic、Protocol Site Traffic、Network Traffic

ii. 存量权重参与的I计算

例如:SAP KQI (结合SAP权重属性)向上聚合计算出 Service KQI

指标维度指标聚合计算(简称为“M计算”) •

时间维度指标聚合计算(简称为“T计算”) •

总之,U2520测试结果为原始数据,也叫测试结果,KPI是抽取重要

的原始数据计算而来,反映了某一个时刻产品的性能状况,KQI由一个或

多个KPI聚合计算而来,KQI本身还可以聚合成更上层的KQI,只有最上层

的KQI才能在SLA条款中出现,参与SLA满足度计算。

26

8.1 MOS

用户质量体验最应用最广泛的指标是MOS ,MOS也是VoIP信令监控

主要的输出指标之一,MOS(Mean Opinion Score)由ITU-T定义,由1~5分

确定质量好坏,如下图:

U2520 MOS以ITU-T G.107E-Model为基础,结合了欧盟(ETSI:European

Telecommunications Standards Institute)认可的语言质量标准(ETSI 101329-5)。

影响用户体验指标的另一个重要指标参数是Jitter Buffer。语音报文

在产生、发送、网络传输接收、处理过程中,总会出现不同程度的时

延、抖动、乱序等,为了平衡这些因素,解码器使用临时缓存的方式来

使语音报文被匀速地播放,这个临时的内存就是Jitter Buffer。用户的解

码器的Jitter Buffer的大小直接影响用户的体验,U2520可以模拟用户Jitter

buffer的大小,使测量出来的语音质量尽可能贴近真实用户的主观体验。

8 相关标准

图9 MoS对应用户体验

R-value(lower limit)

MOS COE(lower limit)

Usersatisfaction

90 4.34 Very satisfied

80 4.03 Satisfied

70 3.60 Some users dissatisfied

60 3.10 Many users dissatisfied

50 2.58 Nearly all users dissatisfied

27

8.2 RFC4445-MDI

RFC4445标准协议中定义了MDI(Media Delivery Index)算法,主要是

对IPTV视频流在IP网络传输质量进行评估的测量指标,包括了DF(Delay

Factor)和MLR(Media Loss Rate)两个参数:

MDI 是一个非常重要的Video Over IP 网络的评定指标,可以被用于

精确测量和监测影响视频传输质量的网络抖动和延迟;可以准确的反映

大量并发媒体流的质量,更可以提供比主观观测更加精确的测量结果。

通过评估可以知道网络到底能支持多少IPTV 用户,为网络设计,设备部

属提供依据, 并且可以帮助分析网络中可能存在的问题,使用户在网络

出现故障前有充足的时间采取正确的措施。

延迟因素(Delay Factor,简称DF):该数值表明被测试视频流的延迟

和抖动状况。DF的单位是毫秒(ms)。DF将视频流抖动的变化换算为对视

频传输和解码设备缓冲的需求。被测视频流抖动越大,DF值越大。当网

络设备和解码器的缓冲区容纳的视频内容时间不小于被测视频流DF读数

时,将不会出现视频播放质量的下降。

媒体丢包速率(Media Loss Rate,简称MLR):MLR的单位是每秒的媒

体封包丢失数量。该数值表明被测试视频流的传输丢包速率。由于封装

视频信息的报文丢失将直接影响视频播放质量,理想的IP视频流传输要

求MLR数值为零。

28

8.3 MOS-V

无参考QoE模型算法是华为自研的一种视频质量监控算法模型。侧

重于用户的QoE,即体验质量,本模型由包丢失和抖动估算出观看者对

视频劣化的体验,直接量化表征观看者的感受。

如果头端视频良好,则传输丢包和抖动是造成播放质量下降的主要

原因,丢包直接导致视频信息减少,抖动导致播放不连贯,直观上,丢

包越多,播放质量越差,抖动越大,播放质量越差,但是网络丢包和抖

动并不是线性影响用户体验,用户体验还与丢包和抖动表现的不同形态

及视频类型,基础压缩损伤有关。

与MDI算法比较,无参考QoE算法模型有其自身的特点:QoE计算

模型最后得到的是视频质量的MOS值,即从用户的角度对视频质量的直

观感受分值,分为5分—优,4分—良,3分—中,2分—差,1分—劣五

档。根据MOS分值,用户可以对视频质量的优劣做判断。

MOS = V0 + V1 * 原始体验值 *网络损伤因子* 应用损伤因子* 终端修复

因子

V0和V1分别是常数,取值在1和4附近。 •

MOS采用ACR MOS(1分到5分,1分表示最差,5分表示最好)作为拟 •

合参考。

原始体验值是指不经过网络传输,直接本地播放视频文件的视频质 •

量体验,受编码类型(如mpeg2或h264),编码比特率,帧速率等因素

的影响。

网络损伤因子是指因网络因素对视频造成的体验劣化,如丢包,抖 •

动,乱序,延迟等。

应用损伤因子是指因应用层参数出错对视频造成的体验劣化,如TS •

参数错误等。

终端修复因子是指因终端解码器或丢包重传或AL-FEC等技术来对视 •

频损伤所进行的修复,如终端解码器类型(错误隐藏率),重传,AL-

FEC等。

网络损伤因子 P-net:丢包,乱序,时延,突发。 •

29

9.1 逐流MDI、VMOS视频监控方案

逐流MDI、VMoS视频监控方案,原理上是查看到业务流经过的每一

个节点的承载质量,U2520系统支持RFC4445,输出和业务部门评估业务

系统质量的相同的度量指标VMos和MDI,并将网络承载的每一个节点的

承载质量输出对比,可以看到在那个链路的质量发生劣化和劣化根因,

支持不同厂商混合组网,视频承载故障定位一目了然。

U2520对视频流全路径进行逐流检测,界定故障点

U2520结合MQMC(IPTV业务平台监控系统),实现业务运维部门E2E监

测视频质量

9 典型应用

图10 U2520逐流监控IPTV业务方案典型应用组网图

ApplicationCore Metro Access

MonitorBVMoS=3.2

Verifier EVMoS=3.2

Verifier DVMoS=3.2

Verifier CVMoS=3.2

Verifier BVMoS=4.8

Verifier AVMoS=4.8

Monitor AVMoS=4.8

InternetDSLAM

DSLAMBRAS

BTV Headend

30

图11 逐流MDI、VMOS视频监控方案

主要测试指标:

IP Transport Metrics: •

1. packet loss

2. jitter

3. packet discards

4. out-of-order packets

5. MDI:Loss Rate (RFC 4445)

6. MDI:Delay Factor (RFC 4445)

媒体流传输指标: •

1. PAT/PMT/NIT/CAT frequency and errors

2. Sync Errors

3. PID missing errors

4. TS error

5. PCR error

6. PRS error

7. CRC error

视频内容指标: •

1. frame rate

2. frame loss

3. ETSI TR 101-290 parameters

4. PCR jitter

5. Media Quality Index (MQI)

6. Noticeble loss (IEFT RFC 3357)

MQMC: IPTV业务系统内部署,监控节目源质量

U2520:网络结点部署,快速定位故障点

Encoder中心节点

HMS HMS HMS

骨干网 城域网

Router Router Router BAS LSW DSLAM

检测点

STB

区域节点 边缘节点

31

图12 EANTC测试物理拓扑图

10.1 EANTC测试(视频监控测试)

欧洲先进网络测试中心(EANTC)在2010年1月举行了一系列针对MPLS

网络的测试,包括华为、思科、Alcatel-Lucent、juniper、中兴等10多家

设备厂商和测试仪器厂商参加了多厂商的MPLS互通测试,测试的物理拓

扑图如下图所示。

10 互联互通

32

在视频监控测试中,华为、Cisco和Spirent参加,Sprent提供业务头

端系统和硬件损伤环境,华为NE40E、U2520和CiscoASR900完成互通测

试。EANTC按照RFC4445对各厂家的视频监控能力进行测试。

在测试中,华为采用采用内外置探针结合的方案,是唯一能够提供

E2E逐流MDI值并且通过U2520上层监控系统,提供E2E的GUI显示,建立

业务的SLA监控,一旦Spirent干扰仪开启损伤环境,U2520的外置探针和

CiscoASR9000都可以马上显示Cisco节点承载质量下降,U2520通过旁挂

外置探针NEU100实现和Cisco相同的指标数据,U2520系统显示各节点状

态,通过各节电的指标质量对比,迅速实现故障的定界和定位。

EANTC按照RFC4445标准,连续测试。结果表明,U2520支持E2E视

频监控解决方案,提供检测第三方厂商的能力,并通过GUI显示,指标数

据可以进一步聚合关联到SLA,可以更精确的反馈网络设备承载视频业务

的能力。

EANTC具体测试例说明可以参考《EANTC-MPLSEWC2010-WhitePaper》

图13 视频监控拓扑图

SpirentTcstCenter

HuaweiNE40E-X8

SpirentxGEM

CiscoASR 9000

Huawei NEU100

HuaweiU2520

MPEG Transport Stream

SNMP

33

网络标准和协议

标准/协议号 标准/协议标题

DSL Forum TR-126Triple-play Services Quality of Experience(QoE) Requirements

ETSI TR 101 290Digital Video Broadcasting (DVB)Measurement guidelines for DVB systems

ISO/IEC 13818-1Information technology — Generic coding of moving pictures and associated audio information: Systems

ITU-T G.107The E-model, a computational model for use in transmission planning

ITU-T G.711 Pulse code modulation (PCM) of voice frequencies

ITU-T G.723Dual rate speech coder for multimedia communications transmitting at 5.3 & 6.3 kbit/s

ITU-T G.72640, 32, 24, 16 kbit/s Adaptive Differential Pulse Code Modulation (ADPCM)

ITU-T G.729Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP)

ITU-T G.1080 Quality of experience requirements for IPTV services

ITU-T G.1081 Performance monitoring points for IPTV

ITU-T H.248 Gateway control protocol

ITU-T H.323 Packet-based multimedia communications systems

RFC 0768 User Datagram Protocol

RFC 0791 Internet Protocol

RFC 0792 Internet Control Message Protocol

RFC 0793 Transmission Control Protocol

RFC 0854 Telnet Protocol Specification

RFC 0959 File Transfer Protocol

RFC 1034 Domain names - concepts and facilities

RFC 1035 Domain names - implementation and specification

RFC 1305 Network Time Protocol (Version 3)

U2520遵循如下标准和规范:

34

标准/协议号 标准/协议标题

RFC 1350 The TFTP Protocol (Revision 2)

RFC 2131 Dynamic Host Configuration Protocol

RFC 2236 Internet Group Management Protocol, Version 2

RFC 2326 Real Time Streaming Protocol (RTSP)

RFC 2327 SDP: Session Description Protocol

RFC 2330 Framework for IP Performance Metrics

RFC 2516 A Method for Transmitting PPP Over Ethernet (PPPoE)

RFC 2543 SIP: Session Initiation Protocol

RFC 2616 Hypertext Transfer Protocol — HTTP/1.1

RFC 2679 A One-way Delay Metric for IPPM

RFC 2680 A One-way Packet Loss Metric for IPPM

RFC 3393IP Packet Delay Variation Metric for IP Performance Metrics (IPPM)

RFC 3418Management Information Base (MIB) for the Simple Network Management Protocol (SNMP)

RFC 3433 Entity Sensor Management Information Base

RFC 3435 Media Gateway Control Protocol (MGCP) Version 1.0

RFC 3550 RTP: A Transport Protocol for Real-Time Applications

RFC 3576Dynamic Authorization Extensions to Remote Authentication Dial In User Service (RADIUS)

RFC 3611 RTP Control Protocol Extended Reports (RTCP XR)

RFC 4445 A Proposed Media Delivery Index (MDI)

表3 网络标准和协议

35

表4 以太业务标准和协议

以太业务标准和协议

标准/协议号 标准/协议标题

IEEE802.1ad Provider bridges

IEEE802.1ag Connectivity fault management

IEEE802.1D Media access control (MAC) bridges

IEEE802.1Q Virtual bridged local area networks

ITU-T G.1731 OAM functions and mechanisms for Ethernet based networks

ITU-T G.8010 Architecture of Ethernet layer networks

ITU-T G.8011 Ethernet over Transport - Ethernet services framework

ITU-T G.8012 Ethernet UNI and Ethernet NNI

ITU-T G.8021Characteristics of Ethernet transport network equipment functional blocks

ITU-T G.8031 Ethernet protection switching

MEF MEF2Requirements and framework for Ethernet service protection in metro Ethernet networks

MEF MEF4Metro Ethernet network architecture framework - Part 1: generic framework

表5 缩略语清单

缩略语清单:

缩略语 英文全名 中文解释

VoIP Voice over IP 分组语音

SAP Service Access Point 业务访问点

SE Service Element 业务元素

NQA Network Quality Analyse 网络品质分析

SLA Service Level Agreement 业务等级合同

KPI Key Performance Indicators 关键性能指标

KQI Key Quality Indicators 关键质量指标

DSQ Degraded Service Quality event 服务质量降级事件

无担保声明

本手册内容均“如是”提供,不构成任何形式的承诺。除非适法要求,

华为技术有限公司对本手册所有内容不提供任何明示或暗示的保证。

在法律允许的范围内,华为技术有限公司在任何情况下,都不对因使用

本手册相关内容而产生的任何特殊的、附带的、间接的、继发性的损害

进行赔偿,也不对任何利润、数据、商誉或预期节约的损失进行赔偿。

版权所有 © 华为技术有限公司 2010。 保留一切权利。

非经华为技术有限公司书面同意,任何单位和个人不得擅自摘抄、复制本手册内容的部分或全部,并不得以任何形式传播。

商标声明

、HUAWEI、华为、 是华为技术有限公司的商标或者注册商标。

在本手册中以及本手册描述的产品中,出现的其他商标、产品名称、服务名称以及公司名称,由其各自的所有人拥有。

华为技术有限公司

深圳市龙岗区坂田华为基地

电话: (0755) 28780808

邮编: 518129

版本号: M3-013030801-20100903-C-1.0

www.huawei.com