降低 adc 故障时长率

38
2010 年年年年年 QC 年年年年年年年年 年年 ADC 年年年年年 年年年年年年 QC 年年 2010 2010 3 3

Upload: igor-jacobson

Post on 03-Jan-2016

83 views

Category:

Documents


0 download

DESCRIPTION

集团新业务部 QC 小组. 降低 ADC 故障时长率. 2010 年 3 月. 、小组概况:. 专业术语解释:. ADC :. 英文全称 :Application Data Center, 中文名为数据应用中心。是指中国移动为集团客户(主要为中小企业客户)按需提供基于移动终端的托管式的信息化应用服务。. 月故障时长率 :. 指每月发生故障的小时数除以每月的总小时数再乘以 100% 例如: 1 月发生故障的小时数为 76 小时, 1 月的总小时数为 744 小时,则 1 月的故障时长率为 76÷744×100% =10.2 %. 二、选题理由. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 降低 ADC 故障时长率

2010 年贵州移动 QC 小组活动汇报材料

降低 ADC 故障时长率

集团新业务部 QC 小组

20102010年年 33月月

Page 2: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

一、小组概况:

课题名称:课题名称: 降低降低 ADCADC 故障时长率故障时长率课题类型: 现场型活动时间: 2009.7——2010.3

小组名称 : 集团新业务部业务运营维护室 QC小组小组成员小组成员

姓名 性别 文化程度 组内分工 组内工作职责

李文华 男 硕士 组长 组织协调,任务布署

齐肇建 男 硕士 副组长 任务实施,成果整理

沈巍 男 本科 组员 数据分析,制定对策

曾果 男 本科 组员 执行措施,效果检查

范丹 男 本科 组员 数据收集,执行措施

赵喆 男 本科 组员 数据收集,执行措施

李荣琼 女 本科 组员 数据收集,材料整理

周杰 男 本科 组员 技术支撑

钟方学 男 本科 组员 技术支撑

王宁 男 硕士 组员 发布统筹

刘芸 女 本科 组员 发布实施

童自影 男 本科 组员 发布实施

Page 3: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

专业术语解释:

• ADCADC :: • ADCADC ::

•月故障时长率 :月故障时长率 :•月故障时长率 :月故障时长率 :

英文全称 :Application Data Center,中文名为数据应用中心。是指中国移动为集团客户(主要为中小企业客户)按需提供基于移动终端的托管式的信息化应用服务。

指每月发生故障的小时数除以每月的总小时数再乘以 100%

例如: 1 月发生故障的小时数为 76小时, 1 月的总小时数为744小时,则 1 月的故障时长率为 76÷744×100% =10.2 %

Page 4: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

经过维护月报统计,发现所管理的几个业务平台中, ADC平台故障较多。

二、选题理由

经调查发现 ADC的故障时长率较

为尽快改进 ADC 的维护支撑状况,支持业务发展,我们选择课题如下:

课题名称:课题名称:降低降低 ADCADC 故障时长率故障时长率

2009年 1 — 6月 ADC平台故障时长率较高,月均达到 5.23%

Page 5: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

三、活动计划

时间

2009—7 2010—3

现状调

查 活动目

标 原因分

析 要因确

认 制定对

策 组织实

施 效果检

查 巩固措

施 计划打

达到目标啦!

Page 6: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

三、现状调查

2009年 1 、 2 、 3 、 4 、 5 、 6 月 ADC平台月故障时长率统计表

  月总时长(时) 月故障总时长(小时) 月故障时长率1 月 744744 39.539.5 5.3%5.3%

2 月 672672 34.334.3 5.1%5.1%

3 月 720720 35.735.7 4.95%4.95%

4 月 744744 37.537.5 5%5%

5 月 744744 4242 5.6%5.6%

6 月 720720 4040 5.56%5.56%

合计: 43444344 230230 5.23%5.23%

本小组于 2009年 7 月对 2009年 1 、 2 、 3 、 4 、 5 、 6 月ADC平台的故障时长率进行了统计,如下表:

该统计表显示:此六个月的平均月故障率达到 5.23%5.23% 。

Page 7: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

三、现状调查 小组又对故障时长的具体情况进行了分类统计,得出各种故障类型所占总故障时长的比例,如下表:

2009年 1 、 2 、 3 、 4 、 5 、 6 月 ADC故障类型汇总表

序号序号 故障类型故障类型 故障总时长故障总时长 故障时长占比故障时长占比 累计占比累计占比

A 业务无法使用业务无法使用 160.3160.3 小时小时 69.7%69.7% 69.7%69.7%

B 用户无法登陆平用户无法登陆平台台 29.929.9 小时小时 13%13%

82.7%82.7%

C 企业归属地出错企业归属地出错 22.522.5 小时小时 9.8%9.8% 92.5%92.5%

D 计费故障计费故障 5.15.1 小时小时 2.2%2.2% 94.7%94.7%

E 其他故障其他故障 12.212.2 小时小时 5.3%5.3% 100%100%

Page 8: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

三、现状调查

从此图可看出,“业务无法使用”的故障时长占比数值最高( 69.7%),因此“业务无法使用”是影响故障时长的主要故障类型。

根据以上数据我们制作了饼图:

69.7%

9.8%

5.3%

13%

69.7%9.8%

13%

2.2%

业务无法使用 用户无法登陆平台

5.3%

2.2%计费故障企业归属地出错

其它故障

Page 9: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

四、目标确定

通过对业内情况的了解, ADC月平均故障时长率一般不高于 3%小组成员通过计算发现,如果能解决“业务无法使用”这个主要问题(占 69.7%) ,就可以将故障时长率从 5.23%降低到 3% 以下,即: 5.23% -69.7%*5.23%= 1.58%。所以 QC小组成员认为 ADC月平均故障时长率达到 3%3% 的平均水平是可能的。

3%

5.23%

目标 值目标 值现值现值

Page 10: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

五、原因分析 小组成员应用头脑风暴法,得出以下树图:

业务无法使用

用户订购失败

业务请求响应慢

网络阻塞

并发进程过多

外网攻击

网络不稳定

网络链路不合理

客户经理未鉴权

不能及时发现SI侧产品故障

产品业务流程不熟

SI使用其它运营商的网

用户登陆失败

用户帐号密码忘记

用户帐号被锁

设备处理能力不足

CPU和内存处理能力不足

F5配置不合理

BOSS与平台链路不合理

业务平台鉴权失败

Page 11: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

五、原因分析

小组对“业务无法使用”的问题进行了分析,共得出十一条末端原因:

11 、、产品业务流程不熟悉11 、、产品业务流程不熟悉 7 、 BOSS与平台链路连接不合理7 、 BOSS与平台链路连接不合理

2 、 SI侧无鉴权2 、 SI侧无鉴权 8 、 CPU处理和内存处理能力不足8 、 CPU处理和内存处理能力不足

3 、不能及时发现 SI侧产品故障3、不能及时发现 SI侧产品故障 9 、 F5配置不合理9 、 F5配置不合理

4 、用户账户密码忘记4 、用户账户密码忘记 10、并发进程冲突10、并发进程冲突

5 、用户帐号被锁5 、用户帐号被锁 11、外网攻击11、外网攻击

6 、 SI与 ADC跨网连接6 、 SI与 ADC跨网连接

Page 12: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

这对上述十一条末端原因,我们用要因确认表进行 逐条的分析:这对上述十一条末端原因,我们用要因确认表进行 逐条的分析:六、要因确认

序号 末端原因 确认方法 确认标 准 确认 结果是否要因

1产品业务流程不熟 现场确认

对操作人员进行随机抽查,要求合格率达到 90%以上

抽查人员中有将近 56%的人员对产品业务流程不太熟悉

2 SI侧无鉴权统计此类故障占订购失败的占比

例是否占订购失败比例

的 5%否 否

3用户帐号密码忘记 查看系统日志 重置密码的比例不高

于登录次数的 5%1.00% 否

4用户帐号被锁 现场确认 重置密码的比例不高

于总用户数的 0.1%ADC没有开启账

户锁定功能 否

5不能及时发现SI侧产品故

比较因投诉发现的 SI侧产品故障次数和主动发现的次数的比例

是否比例大于 1 比值为 32>1 是

Page 13: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认 序号 末端原因 确认方法 确认标 准 确认 结果 是否

要因

6SI使用其它运营商的网络

比较其它运营商网络接入与移动专网接入的单位处理能力 

比较运营商之间的专网处理能力相差 1 倍

以上 是 是

7BOSS与平台链路不合理 分析现网结构 有无多余路由节点 有 是

8CPU和内存处理能力不足 现场确认

设备的 CPU,内存的占用率是否低于 70%

的要求

设备的 CPU、内存占用率都比较低, CPU在 30%左右,内存在40%左右。

9F5配置不合

理 检查配置 确认 连接数是否平均分配给各台服务器。

采用“空闲接入”的配置进行分配,各台服务器连接数几乎相同

10 并发进程过多 现场确认 是否存在垃圾进程 无垃圾进程 否

11 外网攻击 现场确认 是否有外网攻击的痕迹

经过检查主机及网络设备发现,并无被攻击的情

况否

Page 14: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认确认 一:客户经理对产品和业务流程不熟悉确认 一:客户经理对产品和业务流程不熟悉

目前,我省 ADC平台的产品共计 13个,各个产品的业务开通的流程不尽相同,而且业务开通的整个过程涉及 BOSS、 ADC和 SI三方,需要客户经理具备比较丰富的业务知识和操作经验。 QC小组专门查阅了“用户订购失败”故障解决的记录,经过对此类故障原因的分析发现: 从 2009年 1 月 1 日至 6 月 30日,因客户经理不熟悉业务造成用户订购失败的情况共计发生 85次,占造成此类故障原因的 82.52% ,具体数据见下表:

1 月 2月

3 月 4 月 5 月 6 月 合计 占比

因客户经理 不熟悉业务造成用户订购失败的情况

18 6 17 21 8 15 8582.5282.52

%%

其它故障 4 0 3 6 1 3 17 17.48%

总计: 103

2009年 1月至 6月“用户订购产品失败”故障原因统计表

Page 15: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认确认 一:客户经理对产品和业务流程不熟悉确认 一:客户经理对产品和业务流程不熟悉

在发现上述问题后,我们又采用问卷和现场访在发现上述问题后,我们又采用问卷和现场访谈的形式对谈的形式对 5050 个客户经理的相关业务知识和电脑个客户经理的相关业务知识和电脑操作能力进行了抽样调查,以便再次确认该 项要因。操作能力进行了抽样调查,以便再次确认该 项要因。调查显示:抽查人员中有调查显示:抽查人员中有 56%56% 的人对产品和业务的人对产品和业务流程不熟悉;而仅有流程不熟悉;而仅有 7%7% 的人电脑操作能力较差。的人电脑操作能力较差。具体数据如下:具体数据如下:

好好 一般一般 不熟悉不熟悉产品和业务知识 15% 29% 56%56%电脑操作能力 25% 68% 7%

2009年 7 月业务能力情况调查表

结论:客户经理对产品和业务流程不熟悉是要因。

是是要要

因因QCQC 小组小组

Page 16: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认

确认二:确认二: SISI侧未鉴权 侧未鉴权 QC小组通过对 ADC平台和 SI平台接口进行调查,发现 SI侧未鉴权

的次数为 2 次,占用户订购失败次数 103次的 1.9%,因此 不是要不是要因因。

QC小组通过对 ADC平台用户帐号管理情况进行调查,并访谈 ADC平台帐

号管理人员,发现要求重置密码的情况每月不超过 2 次。按照全省用

户比例,不到 1%。所以用户帐号密码忘记不是要因不是要因。

QC小组通过对 ADC平台帐号登陆的设置进行查阅,发现现 ADC平台未将三

次登陆失败锁定用户的选项打开,不会发生用户帐号被锁的情况,所以

用户帐号被锁不是要因不是要因。

确认三:确认三: 用户帐号密码忘记 用户帐号密码忘记

确认 四:确认 四:用户帐号被锁 用户帐号被锁

Page 17: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认确认 五:不能及时发现确认 五:不能及时发现 SISI侧产品故障侧产品故障

11 月至月至 66 月由客户经理反馈的月由客户经理反馈的 SISI 业务平台故障次数业务平台故障次数 3131 次,次,而平台维护人员仅在而平台维护人员仅在 33 月份发现一次月份发现一次 SISI 业务平台故障。详细情况业务平台故障。详细情况如下表:如下表:

通过上表可以看出通过上表可以看出 ADCADC 业务用户投诉平均值为业务用户投诉平均值为 5.175.17 条,远远高于条,远远高于主动发现的次数,因此主动发现的次数,因此 不能及时发现不能及时发现 SISI 侧产品故障是要因。侧产品故障是要因。

  1 月 2 月 3 月 4 月 5 月 6 月 平均值

ADC业务用户投诉 6 7 3 5 4 6 5.17

维护人员主动发现 0 0 1 0 0 0 0.16

是是要要

因因QCQC 小组小组

Page 18: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认确认六:确认六: SISI使用其它运营商的网络使用其它运营商的网络

通过对通过对 ADCADC 平台与平台与 SISI网络详细、彻底的调查,发现各家网络详细、彻底的调查,发现各家SISI厂商采用不同运营商的网络通过厂商采用不同运营商的网络通过 INTERNETINTERNET与与 ADCADC 平台进行平台进行连接,具体拓扑图如下:连接,具体拓扑图如下:

网络瓶颈

其它运营商

SI系统

SI系统

SI系统

SI系统

ADC平台

其它运营商

其它运营商

其它运营商

移动公司互联网

Page 19: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认确认六:确认六: SISI使用其它运营商的网络使用其它运营商的网络

从以上网络拓扑图可以看出部分从以上网络拓扑图可以看出部分 SISI系统通过其它运营商的互联网络与系统通过其它运营商的互联网络与 ADC ADC 平台进行数据接口交换。由于其它运营商互联网络与中国移动互联网存在网络瓶颈问题,网平台进行数据接口交换。由于其它运营商互联网络与中国移动互联网存在网络瓶颈问题,网络传输得不到保障,对用户的业务使用会造成一定的影响。为了测试络传输得不到保障,对用户的业务使用会造成一定的影响。为了测试 SISI与与 ADCADC 平台跨网连平台跨网连接是否存在影响,我们采用两家接入在不同运营商网络的相似接是否存在影响,我们采用两家接入在不同运营商网络的相似 SISI 业务进行摸拟对比实验。业务进行摸拟对比实验。

实验方法如下:实验方法如下: 编写测试脚本,模拟用户连续订购编写测试脚本,模拟用户连续订购《《移动移动 CRMCRM》》业务和业务和 《 《 移动移动 OAOA》》订购操作,在每订购操作,在每一台一台 ADCADC 服务器上各选取服务器上各选取 55 个区间,在每个区间内执行一次测试脚本,获得个区间,在每个区间内执行一次测试脚本,获得 ADCADC与与《《移动移动CRMCRM》》、、《《移动移动 OAOA》》 SISI 服务器的交换接口的平均时间。经过实验,统计出如下数据:服务器的交换接口的平均时间。经过实验,统计出如下数据:

业务名称业务名称 接入网络接入网络 1010次次 3030次次 5050次次 100100次次 200200次次

移动 CRM接入其它运营商 100s 315s 425s 1325s 3540s

移动 OA接入移动网络 20s 52s 86s 165s 435s

经过上面的测试可以得出经过上面的测试可以得出《《移动移动 CRMCRM》》比比《《移动移动 OAOA》》接口交换网速快了接口交换网速快了 55 倍左右。网络倍左右。网络访问的延时会影响用户定购产品的成功率,增加故障率。访问的延时会影响用户定购产品的成功率,增加故障率。因此因此 SISI 使用其它运营商的网络是要因。使用其它运营商的网络是要因。

是是要要

因因QCQC 小组小组

Page 20: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认确认 七:确认 七: BOSSBOSS与平台链路不合理与平台链路不合理

BOSS计费库ADC平台BOSSAGENT服务器

金阳十一楼 金阳七楼 金阳八楼

黑马二十楼黑马十八楼

新华苑六楼

通过右方网络拓扑图可以看出, BOSS计费库和 BOSSAGENT服务器本来在同一地理位置金阳,但网络传输确经过了黑马和新华苑的交换机等中间网络传输设备再绕回到金阳 ADC机房,网络链路环节过多,故障原因查 找耗时比较长,影响业务故障的及时发现和排处。 故 BOSS与平台链路不合理也是要因。

通过对 ADC平台的 BOSSAGENT与 BOSS计费库的网络进行详细、彻底的调查,发现 BOSS AGENT与 BOSS计费库的网络链路较长,故障点太多,发生故障时不能及时排查修复,维护比较困难。具体拓扑图如下:

是是要要

因因QCQC 小组小组

Page 21: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料21

QC小组经过现场登陆监控软件取得 2009年上半年任意三个月的 CPU和内存数据,以中国移动集团公司设备运行标准, 70%以上作为告警线。发现CPU和内存的平均使用率都在 45%以下。未达到告警线,所以不是要因不是要因。

六、要因确认确认 八: 确认 八: CPU和内存处理能力不足情况情况

Page 22: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认

F5是负载均衡四层交换机, QC小组经过现场登入负载均衡设备查看设备配置,检查 F5日志是否分配到各台 Portal服务器的连接数不均衡。登入后发现 F5的配置是按照“空闲接入”的设置,进入的所有连接都分配给空闲的服务器。各台 Portal服务器的接入量基本相同,所以 F5配置不合理,不是不是要因要因。

QCQC 小组对各台服务器和网络设备及架构进行检查。在网络设备上检查发现,小组对各台服务器和网络设备及架构进行检查。在网络设备上检查发现,连接至外网的连接至外网的 PortalPortal 服务器是单独划立的服务器是单独划立的 VlanVlan ,且在,且在 LiunxLiunx操作系统的操作系统的PortalPortal 服务器前端有华为的服务器前端有华为的 Eudemon500Eudemon500防火墙和防火墙和 AURORA AURORA 200200、、 NIP200NIP200等入侵检测设备。未发现有外网攻击服务器的情况。其余设备等入侵检测设备。未发现有外网攻击服务器的情况。其余设备均在内网也不可能遭到外网攻击,所以外网攻击均在内网也不可能遭到外网攻击,所以外网攻击不是要因不是要因。。

QCQC 小组对各台服务器的进程进行对比整理,现场观察。发现除业务必须进程外,小组对各台服务器的进程进行对比整理,现场观察。发现除业务必须进程外,

并无其它垃圾进程。所以并发进程冲突并无其它垃圾进程。所以并发进程冲突不是要因不是要因。。

确认 九:确认 九: F5F5配置不合理 配置不合理

确认 十:确认 十:并发进程过多 并发进程过多

确认 十一:确认 十一:外网攻击 外网攻击

Page 23: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

六、要因确认

小组通过对十一条末端因素的逐条确认,因此 找到了四项主要原因 :

11 、、产品业务流程不熟悉11 、、产品业务流程不熟悉

4 、 BOSS与平台链路连接不合理4 、 BOSS与平台链路连接不合理

2 、不能及时发现 SI侧产品故障2 、不能及时发现 SI侧产品故障

3 、 SI与 ADC跨网连接3 、 SI与 ADC跨网连接

Page 24: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

七、制定对策针对要因, QC小组经过充分思考和讨论,制定了相应的对策实施表:

主要原因主要原因 对策对策 目标目标 措施措施 责任人责任人 地点地点 日期日期

产品业务产品业务流程不熟流程不熟

产品业务流程培训

 

 合格率达到 合格率达到95%95% 以上以上

培训及管理办法

齐肇建曾果

集团新业务部 

09.7.1-7.14

不能及时发现不能及时发现SISI侧产品故侧产品故

障障

部署 AMS子系统 

有效提升主动发有效提升主动发现故障的次数现故障的次数

优化AMS配置 

赵喆周杰 

ADC机房 

09.7.11-7.21 

SISI 使用其它使用其它运营商的网络运营商的网络

SI与 ADC采用移动专网连接 

提高网络的传输提高网络的传输和稳定 和稳定 

实现专网连接 

沈巍 钟方学

ADC机房 

09.7.4-

8.17 

BOSSBOSS与平台与平台链路不合理链路不合理

整改 boss与平台链路 消除多余的路由消除多余的路由 链路整

改 范丹  李荣琼

ADC机房 

09.7.9-7.28

Page 25: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

八、对策实施 对策实施一:开展内部培训,印发业务手册1. QC小组邀请了 ADC的专业技术人员对客户经理进行分批培训。并强化实际操作的练

习,熟悉各产品的开通办理流程。2. QC小组成员编写 ADC平台的业务手册,印发到客户经理的手中。

8 月 9月

10月 11月 12月 合计 占比

因客户经理 不熟悉业务造成用户订购失败的情况

3 1 2 0 2 8 34.78%34.78%

其它故障 2 3 1 3 6 15 65.22%

2009年 6月至 8月“用户订购产品失败”故障原因统计表

好好 一般一般 不熟悉不熟悉产品和业务知识 15% 29% 56%56%电脑操作能力 25% 68% 7%

2009年 7 月业务能力情况调查表效效果果

11 、因客户经理 不熟悉业务造成用户订购失败的情况由对策实施前的、因客户经理 不熟悉业务造成用户订购失败的情况由对策实施前的 82.52%82.52% 的占比下降到的占比下降到34.78%34.78%22 、经过第二次对客户经理的的抽样调查显示,对产品和业务流程不熟悉的人员由对策实施前的、经过第二次对客户经理的的抽样调查显示,对产品和业务流程不熟悉的人员由对策实施前的 56%56% 下降到下降到 1%1%

Page 26: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

八、对策实施 对策实施二:引入应用监控系统(对策实施二:引入应用监控系统( AMSAMS )的业务拨测子系统()的业务拨测子系统( QTQT )拨测功能解决)拨测功能解决

《《不能及时发现不能及时发现 SISI侧产品故障侧产品故障》》问题问题

通过对 ADC业务投诉的用户电话回访, QC小组发现在 ADC平台长期的运营过程中存在对 SI侧故障发生后处理不及时的情况,当( SI)业务提供商不能向用户提供产品支撑或中断业务服务时故障信息无法及时的反馈给 SI方,进行迅速排故,从而造成用户无法使用该业务的严重后果。

具体情况如下:

1 、无有力的监控手段;

2 、定位故障方不准确;

3 、故障延续时间较长;

4 、用户使用业务投诉增多;

5 、人工值守缺乏灵活性

Page 27: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

八、对策实施

效果:从 2009年 8 月 1 日该对策实施后至 2010年 3 月 1 日,用户使用产品故障投诉率有明显下降,由原先的单业务每月平均故障投诉 5.17条降低至现在单业务每月平均故障投诉1.67条。每月主动的发现的故障次数由原来的 0.16条增加 3.17条。

通过 QT数据业务主动拨打测试 SI系统,由 QT模拟拨测前端机和 QT服务器,实现对SI的产品探测。 QT服务器平台端可以进行整个系统的探测和监控,通过 IE浏览器即可访问平台端实现系统监听。

   88 月月 99 月月 1010 月月 1111 月月 1212 月月 11 月月 平均平均值值

ADC业务用户投诉 22 11 3 3 33 00 1 1

1.61.67 7

维护人员主动发现 44 22 33 55 22 33

3.13.177

对策实施二:引入应用监控系统(对策实施二:引入应用监控系统( AMSAMS )的业务拨测子系统()的业务拨测子系统( QTQT )拨测功能解决)拨测功能解决《《不能及时发现不能及时发现 SISI侧产品故障侧产品故障》》问题问题

Page 28: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

八、对策实施对策实施三:解决对策实施三:解决 SISI跨网联接的问题跨网联接的问题

效果:效果:从 2009年 8 月 12日该对策实施后至 2009年 12月 31日, SI系统与ADC系统接口交换明显加快,比原先的连接速度提高了约 1717倍倍。

网络瓶颈

其它运营商

SI系统

SI系统

SI系统

SI系统

ADC平台

其它运营商

其它运营商

其它运营商

移动公司互联网

SI系统

SI系统

SI系统

SI系统

ADC平台

移动公司互联网

订购次数订购次数 1010次次 3030次次 5050次次 100100次次 200200次次

实话前移动实话前移动 CRMCRM 100100 315315 425425 13251325 35403540

实施后移动实施后移动 CRMCRM 1515 4242 7070 102102 204204

实施前网络连接图实施前网络连接图 实施后网络连接图实施后网络连接图

Page 29: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

八、对策实施对策实施四: 对策实施四: BOSSBOSS与平台链路不合理与平台链路不合理

措施:对网络链接进行改造,将原有多级链接改为直联链路。

BOSS计费库 ADC平台BOSSAGENT服务器

金阳十一楼 金阳八楼金阳七楼BOSS计费库

ADC平台BOSSAGENT服务器

金阳十一楼 金阳七楼 金阳八楼

黑马二十楼黑马十八楼

新华苑六楼

实施前网络连接图实施前网络连接图 实施后网络连接图实施后网络连接图

效果:效果:从 2009年 7 月 26日该对策实施后至 2010年 2 月 1 日,BOSS计费库和 BOSSAGENT之间没有再出现过网络传输故障。

Page 30: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

九、效果检查(一)目标 值检查

2009年 9 月至 2010年 1 月 ADC平台月故障时长率统计表

  月总时长(小时)

月故障总时长(小时) 月故障时长率

9 月 720 16 2.2%

10月 744 17 2.3%

11月 720 16 2.2%

12月 744 13 1.7%

1 月 744 18 2.4%

合计: 3672 80 2.2%2.2%

Page 31: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

九、效果检查(一)目标 值检查

5.30%

3.00%

2.20%

0.00%

1.00%

2.00%

3.00%

4.00%

5.00%

6.00%

ADC月平均故障时长率

对策实施前对策实施前 目标 目标 对策实施后对策实施后

ADCADC 平台月平均故平台月平均故障时长率由项目实障时长率由项目实施前的施前的 5.3%5.3% 下降至下降至2.2% 2.2% 达到了达到了 QCQC 小小组的预定目标。组的预定目标。

Page 32: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

九、效果检查 (二)经济效 益

对策实施后,大大降低了 ADC平台故障时长,各业务等的订购量和使用量也得到大幅提高。

ADC客户数 09年底到达 15839家,较 08年底 7504家增长 111%。 C 类集团客户数 09年底到达 33880家,较 08年底 16825家增长 101%。

统计数据表明: QC活动前 2009年 1 月至 6 月系统无故障时间为 94.77%,所运营所得的费用约为 1000万,平均每 1%的无故障时间产生的信息费约为1000万 /94.77%/100=10.55万元;经过小组活动无故障时间提升了 3.1个百分点;故 QC活动期间共产生经济效益 10.55万 *3.1 = 32.7 32.7万 。万 。

元3 2 0 0 07

Page 33: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

九、效果检查 (三)社会效益

1. 用户订购和使用 ADC业务更加顺畅快捷2. 提高了客户的使用感知 , 提升了客户满意度。

3. 增加了对中小型集团客户的粘性 , 有效促进了目标 市场的稳定

4. 彰显移动信息专家的价值

Page 34: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

十、巩固措施为了保障活动成果持续有效,小组针对对策实施的效果,进行了巩固:

修订修订《《 ADCADC 维护管维护管理办法理办法》》,并组织,并组织维护人员和系统厂维护人员和系统厂商认真学习;商认真学习;

11 22 不定期对集团经不定期对集团经理进行抽查,并设业理进行抽查,并设业务流程操作无错误指务流程操作无错误指标进行 考核。标进行 考核。

Page 35: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

十、巩固措施 在 2009年 11月至 2010年 2 月的巩固 期内,能正确执行 已纳入的有效措施、规定,并能把效果维持在良好的水平上。

实施前 实施中 巩固 期

0.00%

1.00%

2.00%

3.00%

4.00%

5.00%

6.00%

5月 6月 7月 8月 9月 11月 12月 2010-1 2010-2

目标 值目标 值 3%3%

Page 36: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料36

十一、总结及下一步打算

通过此次活动,小组综合素质得到很大提高,活动前后对照情况如下:

012345

质量意识

解决问题的能力团队精神

改进意识

QC工具运用技巧

进取精神

活动前(分) 活动后(分)

Page 37: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料

十一、总结及下一步打算

通过“降低 ADC平台故障时长率”的活动,解决了 ADC故障时长率较高的实际问题,收到了预期的效果,积累了宝贵的经验。下一步我们将把降低MISC平台的故障率作为 QC小组研究的课题。

Page 38: 降低 ADC 故障时长率

贵州移动 集团新业务部 QC小组活动汇报材料