ss005301 sdh故障处理与案例分析
DESCRIPTION
SS005301 SDH故障处理与案例分析. 固网产品课程开发室. 引入. 本课程通过讲述 SDH 的逻辑功能块,分析告警产生的机制和流程;通过对故障现象地讨论,总结故障现象及处理步骤。结构上分为 4 部分: SDH 的 逻辑 功能块及告警流程图 常见的告警及性能事件介绍 讨论具体的故障现象和处理步骤 总结故障定位的基本思路及方法. 学习目标. 1 、了解 SDH 常见告警的产生机制 2 、掌握故障定位的基本思路 3 、掌握分析和定位的几种基本方法 4 、掌握几种常见分类故障的处理方法. 学习完本课程,您应该能够:. 课程内容. - PowerPoint PPT PresentationTRANSCRIPT
1
SS005301 SDH 故障处理与案例分析
SS005301 SDH 故障处理与案例分析
固网产品课程开发室
2
引入引入
本课程通过讲述 SDH 的逻辑功能块,分析告警产生的机制和流程;通过对故障现象地讨论,总结故障现象及处理步骤。结构上分为 4 部分:
SDH 的逻辑功能块及告警流程图 常见的告警及性能事件介绍 讨论具体的故障现象和处理步骤 总结故障定位的基本思路及方法
3
学习目标学习目标
1 、了解 SDH 常见告警的产生机制
2 、掌握故障定位的基本思路
3 、掌握分析和定位的几种基本方法
4 、掌握几种常见分类故障的处理方法
学习完本课程,您应该能够:
4
课程内容课程内容
第一章 SDH的逻辑功能块
第二章 常见的告警与性能事件
第三章 故障现象讨论
第四章 故障定位的基本思路
5
一、 SDH 的基本逻辑功能块
二、 SDH 的辅助逻辑功能块
三、 SDH 的告警流程图
SDH 的逻辑功能块
6
一、一、 SDHSDH 逻辑功能块示意图逻辑功能块示意图
7
SPISPI
SPI
同步设备物理接口
收方向A→B
O/E
提取线路定时失效
RLOS
发方向B→A
E/O 变换
SPI:同步设备物理接口功能块( A—B)
8
SDHSDH 基本逻辑功能块基本逻辑功能块
A 、 B、 C点信号帧结构:
9
RSTRST
收方向B→C
RLOS
C 点信号全“ 1”
定帧A1 、 A2
失败ROOF 、 RLOF
C 点信号“ 1”
正常解扰
处理 E1 、 D1-D3
校验 B1
RS-BBE
RST:再生段终端功能块( B—C)
10
RSTRST
发方向C→B
写 RSOH
计算 B1加入 E1
D1-D3
加扰STM-N 帧
RST:再生段终端功能块( B—C)
11
SDHSDH 基本逻辑功能块基本逻辑功能块
D点信号帧结构
再生段和复用段的区别
12
MSTMST
收方向C→D
提取 APS 信令K1 、 K2 ( b1-b5 )
检测 K2 ( b6-b8 )
110
MS-RDI
111
MS-AISD 点信号“ 1”
检测 B2
不符MS-BBE
越限MS-EXC ( B2 )
D 点信号“ 1”
MST:复用段终端功能块( C—D)
13
MSTMST
发方向D→C
写 MSOH
M1→MS-REI
收 MS-BBE 时
K2→110
MS-RDI
收 MS-AIS 时
MST:复用段终端功能块( C—D)
14
MSPMSP 与与 MSAMSA
MSP :复用段保护功能块( D—E)进行复用段保护倒换的启动条件 RLOS 、 RLOF 、 MS-AIS
MSA:复用段适配功能块( E—F)
发方向F→E
写指针AU-PTR
字节间插N×AU-4→AUG
15
MSA:复用段适配功能块( E—F)收方向E→F
消间插AUG→
N×AU-4
解读指针AU-PTR
H1H2H3 全“ 1”
AU-AIS
F 点信号全“ 1”
无效指针8 个 NDF
AU-LOP→F“1”
MSAMSA
16
SDHSDH 基本逻辑功能块基本逻辑功能块
F点信号帧结构: VC4
1 261
9
C4
1 260
9
G点信号帧结构:
17
HPC:高阶通道连接功能块( F—F)对 VC4的交叉矩阵仅选择路由,不处理信号对应 SBS2500设备 X16板
HPT:高阶通道终端( F—G)HPOH源和宿对高阶 VC4进行实时监控
发方向G→F
写 HPOHG1→HP-REI
收 HP-BBE 时
G1→HP-RDI
收 HP-TIM 、 HP-SLM
HP-UNEQ
HPCHPC 与与 HPTHPT
18
收方向F→G
检测 B3
不符HP-BBE
检测 J1
失配 HP-TIM
G 点全“ 1”
检测 C2
失配 HP-SLM
00H HP-UNEQ
G 点全“ 1”
H4 传给HPA
HPT:高阶通道终端( F—G)
HPTHPT
19
收方向G→H
消间插C4→TU12
处理指针TU-PTR 、 TU12→VC12
V1V2V3“1”
TU-AIS
H 点全“ 1”
无效指针TU-LOP
H 点全“ 1”
HPA:高阶通道适配功能块 (G—H)
HPAHPA
20
HPAHPA
发方向H→G
写指针TU-PTR 、 VC12→TU12
字节间插TU12→C4
HPA:高阶通道适配功能块 (G—H)
21
SDHSDH 基本逻辑功能块基本逻辑功能块
H点信号帧结构
I点信号帧结构
22
SDHSDH 基本逻辑功能块基本逻辑功能块
LPC:低阶通道连接功能块
对 VC12、 VC3的交叉矩阵仅选择路由,不处理信号对应 SBS2500设备 TXC板
LPT:低阶通道终端
LPOH源和宿对低阶 VC12进行实时监控
23
LPT
收方向H→I
检测 V5
LP-BBE
LP-TIM 、 LP-SLM,LP-UNEQ
发方向I→H
写 LPOH
收 LP-BBE→LP-REI
收 LP-TIM 、 SLM→LP-RDI
LPT:低阶通道 终端 (H—I)
SDHSDH 基本逻辑功能块基本逻辑功能块
24
LPA:低阶通道适配功能块( I—J)
包封 /拆包封: PDH—C
PPI: PDH物理接口功能块( J—K)
设备与 PDH线路接口提取 PDH支路定时信号码型变换: NRZ—HDB3、 NRZ—CMI
SDHSDH 基本逻辑功能块基本逻辑功能块
25
SEMF :同步设备管理功能块本设备各功能块的监控其他设备间 OAM 信息互通
MCF :消息通信功能块提供网管 f&Q 接口提供 D1-D3 、 D4-D12 接口( P、 N)
SETS :同步设备定时源提供本地时钟4 种时钟源
输出本地时钟OHA :开销接入功能块公务开销的接入: E1、 E2 、 F1
二、二、 SDHSDH 辅助逻辑功能块辅助逻辑功能块
26
三、三、 SDHSDH 告警流程图告警流程图
27
课程内容课程内容
第一章 SDH的逻辑功能块
第二章 常见的告警与性能事件
第三章 故障现象讨论
第四章 故障定位的基本思路
28
常见告警及性能事件常见告警及性能事件
一、什么是 SDH 告警
二、 SDH 告警的分类
三、 SDH 常见性能事件的分类
29
一、什么是一、什么是 SDHSDH 告警告警
SDH告警的定义
网元产生——网元指示灯或网管指示
SDH告警的特点
原发告警、伴随告警
告警的速率标志
30
二、二、 SDHSDH 告警的分类告警的分类
输入信号丢失( LOS)
帧定位丢失告警( LOF)
连续 4帧 A1A2错误— OOF帧失步指示
OOF超过 3ms—LOF告警
31
二、二、 SDHSDH 告警的分类告警的分类
上游故障告警( AIS)
指针丢失( LOP)
连续 8帧无合法的指针值
过误码( EXC BER)
误码率 BER 〉 1*10-3
32
二、二、 SDHSDH 告警的分类告警的分类
B1 , B2 , B3 误码( ERROR )
B1 的作用是再生段误码监视
B2 的作用是复用段误码监视
B3 的作用是高阶通道误码监视
33
二、二、 SDHSDH 告警的分类告警的分类
远端误码指示( REI)
MS-REI、 HP-REI、 LP-REI
远端缺陷指示( RDI)
MS-RDI、 HP-RDI、 LP-RDI
34
二、二、 SDHSDH 告警的分类告警的分类
通道接入点标识不匹配( TIM)
J0(复用段)、 J1(高阶通道)、 J2(低阶通道)
负荷标签不匹配( PLM)
C2(高阶通道)、 V5(低阶通道)
35
三、三、 SDHSDH 常见性能事件的分类常见性能事件的分类
误码秒( ES)、严重误码秒( SES)、不可用秒( UAS)
ES表示传输过程中至少有一个误码的秒
SES表示误码率 〉 10-3的秒
UAS的开始是连续出现 10个 SES
UAS的结束是连续出现 10个非 SES
36
三、三、 SDHSDH 常见性能事件的分类常见性能事件的分类
背景误码块( BBE )
BBE 表示同一块中的任意比特发生差错的块
指针调整统计( PJC )
帧失步( OOF )
保护倒换( PS )
37
课程内容课程内容
第一章 SDH的逻辑功能块
第二章 常见的告警与性能事件
第三章 故障现象讨论
第四章 故障定位的基本思路
38
讨论故障现象与处理步骤讨论故障现象与处理步骤
一、故障现象讨论
二、故障的分类与处理步骤
39
一、故障现象讨论一、故障现象讨论讨论业务中断的原因?
外部原因
人为原因
设备本身故障
供电电源故障,如设备掉电、供电电压过低等交换机故障光纤、电缆故障。如光纤性能劣化、损耗过高, 或光纤损断;中继电缆脱落、损断或接触不良等
误操作设置了光路或支路通道的环回误操作更改、删除配置数据
单板失效或性能不好
40
一、故障现象讨论一、故障现象讨论讨论传输误码的原因?
外部原因
设备故障
光纤性能劣化、损耗过高光纤接头不清洁或连接器不正确设备接地不好设备附近有强烈干扰源设备散射不好、工作温度过高
线路板接收侧信号衰减过大、对端发送电路有故障、本端接收电路故障时钟同步性能不好交叉板与线路板、支路板配合不好支路板故障风扇故障单板失效或性能不好
41
一、故障现象讨论一、故障现象讨论讨论业务丢失的原因?
人为原因
业务开通后,未对数据做备份
静态库 SDB——闪存库( FDB0、 FDB1 )
多网管操作的结果
42
一、故障现象讨论一、故障现象讨论讨论公务电话故障的原因?
外部原因
人为原因
设备本身故障
光纤断会导致正在通话的公务电话单通
公务配置数据错,包括“允许通话逻辑系统”、“呼叫等待时长”、“电话号码”等
支持公务电话的单板失效或性能不好
43
一、故障现象讨论一、故障现象讨论讨论出现大量指针调整的原因?
外部原因
人为原因
设备本身故障
光纤接反,出现两个网元间时钟互锁的情况
时钟源配置错误,出现同一个网中有两个时钟源的情况时钟源配置错误,出现两个网元间时钟互跟的情况
线路板故障,提取时钟质量不好时钟板故障,提供的时钟源质量不好交叉板故障,给各单板分配的工作时钟质量不好
44
一、故障现象讨论一、故障现象讨论讨论网关网元登陆不上的原因?
外部原因
人为原因
设备本身故障
网线选择错误或者网管台的网卡坏
ID或 IP地址设置 错误
SCB板故障,无法 PING通或者无法登陆软件版本不匹配,主机版本较网管版本新
45
一、故障现象讨论一、故障现象讨论讨论非网关网元登陆不上的原因?
外部原因
人为原因
设备本身故障
光纤故障,如光纤性能劣化、损耗过高,或光纤断供电电源故障,如设备掉电、供电电压过低等
ID 设置 错误网管中网关网元删除再恢复,非网关网元的网管属性丢失
SCC 板故障光板故障网元有大量的性能数据上报到网管
46
二、故障的分类与处理步骤二、故障的分类与处理步骤业务中断类故障处理
常用方法告警分析法逐段环回法互换、替换法
处理步骤检查各站登录是否正常,各站光路上是否有紧急告警。检查业务中断站点支路板上业务通道,是否有 T-ALOS 告警。逐段环回
47
二、故障的分类与处理步骤二、故障的分类与处理步骤误码类故障处理
常用方法告警、性能分析法逐段环回法互换、替换法
处理步骤根据告警及性能,分析是线路上还是支路上的误码?通过逐段环回法定位误码产生的位置。根据定位的信息做排除或替换处理
48
二、故障的分类与处理步骤二、故障的分类与处理步骤指针调整的问题处理
常用方法性能分析法更改配置法互换、替换法
处理步骤排除光纤接反可能。只有在通道环的情况下,才可能发生 光纤接反的情况。其它组网下,光纤接反将导致业务中断。检查配置,排除配置错误的可能。分析指针调整性能事件,并通过更改时钟源位置以 及时钟跟踪方向等方法,定位故障点。
49
二、故障的分类与处理步骤二、故障的分类与处理步骤ECC 的问题处理
常用方法告警性能数据分析法替换法
处理步骤排除外部因素,如掉电、光纤折断、光纤性能劣化等将故障定位到单站或两个站之间。对于 ECC 问题,逐段自环不能定位故障;一般根据从哪一站开始不能登录来判断故障位置。检查 SCC 板。检查光板。
50
课程内容课程内容
第一章 SDH的逻辑功能块
第二章 常见的告警与性能事件
第三章 故障现象讨论
第四章 故障定位的基本思路
51
故障定位的基本思路及方法故障定位的基本思路及方法
一、故障定位的原则
二、故障定位的基本方法
三、总结
52
故障定位的关键
“ 将故障点准确地定位到单站网元”
一、故障定位的原则一、故障定位的原则一、故障定位的原则一、故障定位的原则
53
一、故障定位的原则 一、故障定位的原则
故障定位的原则
“先外部,后传输”
“先单站,后单板”
“先线路,后支路”
“先高级,后低级”
54
二、故障定位的基本方法 二、故障定位的基本方法
故障定位的基本方法
“ 一分析,二环回,三换板”
一 .当故障发生时,首先通过对告警事件、性能 事件、业务流向的分析,初步判断故障点范围;
二 . 通过逐段环回,排除外部故障,并最终将故障 定位到单站,乃至单板;
三 . 通过换板,排除故障问题
55
二、故障定位的基本方法 二、故障定位的基本方法
故障定位的其它方法
更改配置法
仪表测试法
经验处理法
56
二、故障定位的基本方法 二、故障定位的基本方法
告警、性能分析法
通过网管获得的告警及性能指标
全面、详实
设备上的指示灯也可显示告警信息
57
二、故障定位的基本方法 二、故障定位的基本方法
环回法(硬件环回、软件环回)定位故障最有效、最常用的方法
支持软件环回的单板
操作工具
软件环回操作类型
环回级别 应用
线路板( 155H 不支持)
网管、命令行
内环回、外环回
按 VC4 通道级别或整个 STM-N 信号环回
将故障定位到单站,且可初步判断线路板是否存在故障
支路板 网管、命令行
内环回、外环回
按通道环回 可分离交换机故障还是传输故障,且可初步判断支路板是否存在故障。
交叉板 网管、命令行
线路环回、支路环回
按业务通道环回 可定位单站故障中,是线路侧故障还是支路侧故障。
58
二、故障定位的基本方法 二、故障定位的基本方法
逐段环回,定位故障点
根据不同的组网进行定位
链型是双向无保护业务环型是单向通道保护业务环带链则是环和链两种业务的结合
321e1:17 w1:17 w1:17e1:17
t2:1 t1:1
59
二、故障定位的基本方法 二、故障定位的基本方法 采用环回法应注意的问题:
软件环回是一种不彻底的环回,只能初步定位故障的位置。
对远端站点线路板第一个 VC4 作环回操作时 ,一定要确认环回后 ECC 通信不会中断,才可进行操作。一旦远端站点的 ECC 通信中断,则只能到远端站点现场才能解开环回,恢复 ECC 通信。
“ 环回法”会导致正常业务的暂时中断,一般只有在出现业务中断等重大事故时,才使用环回法进行故障排除。
60
二、故障定位的基本方法 二、故障定位的基本方法
替换法
“ 替换法”适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等;
当故障定位到单站后,用于排除单站内单板或模块的问题。
61
二、故障定位的基本方法 二、故障定位的基本方法
更改配置法
“ 更改配置法”所更改的配置内容可以包括:时隙配置、板位配置、单板参数配置等。
“ 更改配置法”适用于故障定位到单站后,排除由于配置错误导致的故障。
该方法适用于没有备板的情况下,初步定位故障类型,并暂时排除故障,恢复业务。
62
二、故障定位的基本方法 二、故障定位的基本方法
仪表测试法
““仪表测试法”一般用于排除传输外部设备问题以及与其它设备的对接问题。
“仪表测试法”分析定位故障,说服力比较强。
常见的仪表有:光功率计、误码仪、万用表等
63
二、故障定位的基本方法 二、故障定位的基本方法
经验处理法
在一些特殊的情况下通过复位单板、单站掉电重启、重新下发配置或将业务倒到备用通道等手段可有效及时的排除故障、恢复业务。
建议该处理故障的办法尽量少用,因为该方法不利于故障原因的彻底查清。
64
三、总结 三、总结
故障定位的基本思路与方法
故障定位过程 常用方法 其它方法
1. 排除外部设备故障 替换法、测试法、环回法
告警性能分析法
2. 故障定位到单站 环回法 告警性能分析法
3. 故障定位到单板并最终排除 替换法
告警性能分析法、环回法、更改配置法、经验处理法
65