stratus - white paper - everrun enterprise - ready your infrastructure for the always on world

6
www.stratus.com 确保您的基础设施永远在线

Upload: bee-yiu

Post on 01-Apr-2016

219 views

Category:

Documents


6 download

DESCRIPTION

我们生活在一个需要时刻保持连接的世界。所有设备都相互连接 – 不仅包括我们的电脑、电 话以及其他便携式设备,也包括我们日常生活的几乎所有方面。从为汽车加油的油枪(也包 括汽车本身),到办公室门禁系统的读卡器、杂货店的收银台,以及夜晚为我们播放节目的电视机。银行、运输、交通、医疗、政务、公共安全、公用设施、制造、电信以及建筑系统,所有上述领域的服务都需要保持每年365天日夜在线。这就是为什么这些行业的机构必须对其IT基础设施的可用性多加考虑

TRANSCRIPT

Page 1: Stratus - White Paper -  everRun Enterprise - Ready Your Infrastructure for the Always On World

www.stratus.com

确保您的基础设施永远在线

Page 2: Stratus - White Paper -  everRun Enterprise - Ready Your Infrastructure for the Always On World

www.stratus.com

White Paper | 2确保您的基础设施永远在线

您的基础设施准备好永远在线了吗?

我们的解决方案将可以预防宕机的发生,而不是在问题已经发生并导致损害后进行恢复

我们生活在一个需要时刻保持连接的世界。所有设备都相互连接 – 不仅包括我们的电脑、电话以及其他便携式设备,也包括我们日常生活的几乎所有方面。从为汽车加油的油枪(也包

括汽车本身),到办公室门禁系统的读卡器、杂货店的收银台,以及夜晚为我们播放节目的电视机。银行、运输、交通、医疗、政务、公共安全、公用设施、制造、电信以及建筑系统,所有上述领域的服务都需要保持每年365天日夜在线。这就是为什么这些行业的机构必须对其IT基础设施的可用性多加考虑。

保持时刻在线事关企业的利润、人员财产的保护以及企业的声誉。您可能会问:一个机构及其员工、涉众以及客户一年能够容忍多长的停机时间?是3天?8小时?还是5分钟?通常,答案最终会归结到停机所造成的成本。根据Aberdeen集团的研究结果,一小时的停机时间会平均给公司造成$163,674.14的成本损失。要不了多久,这些停机时间就会像滚雪球一样,造成数百万美元的损失

尽管有这些惊人的损失数字,多数机构仍对自己的系统是否已经获得良好的保护估计不足。他们通常将重点放在数据备份以及灾难恢复方面。尽管上述两种策略对于系统保护非常重要,但他们仅专注于损害控制,而非对系统停机进行早期预防。此外,这些机构很少将如服务器崩溃以及内存失效这样的日常“灾难”纳入考虑范畴。类似事件将会对机构的许多方面产生影响,这些方面不仅仅是“任务关键”或“业务关键”系统,也包括研发

、通信、人力资源以及网站等应用。所有这些应用都必须保持持续运转,以保持机构的生产率、员工的满意度、机构的竞争力以及高质量的客户体验。

机构通过各种方式来处理系统可用性问题,包括使用传统服务器、虚拟化技术以及集群技术。在解决系统停机问题方面,这些方法的有效程度各有不同(参见图1)。

根据Aberdeen集团的研究结果,一小时的停机时间会平均给公司造成$163,674.14的成本损失。要不了多久,这些停机时间就会像滚雪球一样,造成数百万美元的损失。

Page 3: Stratus - White Paper -  everRun Enterprise - Ready Your Infrastructure for the Always On World

一些机构仅依赖传统的x86服务器所提供的系统可用性水平(图2),这种系统每年的典型停机时间为87.6小时。

在这种架构下,数据通常存储在配置RAID(磁盘冗余阵列)的存储系统上。但是,一旦发生任何服务器失效,所有服务器都将会停止信息处理,用户将无法访问其应用程序及数据。作为应对更严重问题的应急措施,一些机构可能会部署一个冷备份服务器,在上面安装与主服务器相同的操作系统与应用程序。但是除非必要,备份系统通常处于关闭状态,从而会造成成本高昂的资源浪费。此外,故障切换到备份服务器的过程可能需

要数个小时才能完成,并且需要技能熟练的IT专业人员在现场操作。

虚拟技术越来越多的机构开始采用虚拟技术和云解决方案,他们期待这些技术环境所带来的灵活性及数据传输的便利性可以提供更高水平的系统可用性。虚拟技术在硬件之上增加了一个抽象层,让多个虚拟机(VMs)分享单个物理服务器的资源。如果一台虚拟机发生崩溃,可以独立对其进行重启,而不会影响其他虚拟机。虚拟机还可以轻松地从一个物理设备迁移至另外一个物理设备,这一特色非常有利于硬件的升级和维护。但是,如果物理服务器发生失效,其上所运行的所有虚拟机也都将会失效。虚拟技术是云计算的核心,这种架构的年平均停机时间为8.76小时。考虑到最近备受关注的云系统发生停机的新闻,云系统的可用性显然仍是一个重要问题。

故障切换集群利用集群技术来增强传统服务器或VM架构可以将系统可用性每年提升几个小时,但是其代价就是复杂性和成本的上升。集群技术是将两个或多个物理服务器连接在一个网络当中(见图3)。

确保您的基础设施永远在线

www.stratus.com

White Paper | 3

图1: Always-on E�ectiveness Matters

传统服务器

图2: Conventional Standalone Server

99%87.6

$ 14,688,242

99.9%8.76 小时

$ 1,468,824

99.95%4.38 小时$ 734,412

Stratus

99.999%5¼ 分钟$ 14,688

Stratus Always-On

Zone99.999% 的底线: 何谓 “Always on 永远在线”

“永远在线”等级

未经管理的常规系统

小时

传统集群,VMs 优势一般的云服务水平

每年的系统停机时间每年成本

假设: 一个小时的系统停机时间可能对普通公司造成$163,674.14的成本费用。计算: 365天X24(一天24小时)X60(每小时60分钟)X60(每分钟60秒)=每年31,536,000秒根据99.999%的正常运行时间比例,一年内共有315.36秒的系统停机时间,即5.25分钟。

**信息来源:Aberdeen Group, Analyst Insight, 2013年6月

Page 4: Stratus - White Paper -  everRun Enterprise - Ready Your Infrastructure for the Always On World

软件解决方案Stratus® everRun® Enterprise预防停机软件支持Windows®和Linux环境,可以部署在基于Intel®的标准服务器上,其中包括IBM、戴尔以及惠普的产品。这款时刻在线软件解决方案提供了全面的停机预防功能,可以确保业务连续性不受到日常故障以及大面积停机或自然灾害的影响(图4)。

为了防止服务器发生故障,everRun Enterprise集成了Stratus 的可用性引擎(Availability Engine),该引擎可以将一个应用在两个物理服务器上进行镜像操作(图5)。安装了Stratus 的可用性引擎之后,如果一台服务器发生失效,应用程序将会继续在另外一台服务器上运行,不会出现任何中断或数据丢失。该引擎将会保存所有运行交易数据,包括内存及缓存中的数据,因此无需进行系统重启。

集群中的服务器通过连续检查心跳(heartbeat)来相互通信,以确认其他服务器是否在正常运行。如果集群中的一台服务器发生失效,另外一台将会自动接管与网络资源的联络。但是,集群需要高度复杂的软件,并且需要具备专门的专业知识来编写和测试故障切换软件程序。其结果就是,不仅需要高昂的初始成本,同时也需要持续花费巨额开支来升级这些项目 – 而这些又需要额外的现场操作专业知识。此外,集群架构通常依赖共享的存储,而这成为了一个潜在的失效点和停机故障来源。

Stratus的解决方案: 简单而有具有成本效益地预防停机

Stratus采取了一种完全不同的方法来提升系统的可用性,这种方法着眼于预防停机的发生,而非在故障发生后进行系统恢复。Stratus的时刻在线解决方案部署快速方便,无需专门的专业知识,也无需对应用进行任何修改。冗余和容错机制都内置于系统之中,可以随时帮助您当前的IT基础设施实现时刻在线,减少系统出现停机的机会 - 通常每年停机时间不超过5分钟。

确保您的基础设施永远在线

www.stratus.comwww.stratus.com

White Paper | 4

图3 : Failover Cluster

图4: Stratus Downtime Prevention Software

图5 – Stratus Availability Engine Architecture

Stratus采取了一种完全不同的方法来提升系统的可用性,这种方法着眼于预防停机的发生,而非在故障发生后进行系统恢复。

管理网络

网络

业务网络

可用性链接

KVM 虚拟化 KVM 虚拟化

可用性扩展 可用性扩展

x86 服务器 x86 服务器

Windows 保护虚拟机

Linux保护虚拟机

应用程序"A"

物理服务器 1 物理服务器 2

FT 保护 FT 保护

存储 存储

应用程序集 "B"

应用程序集 "B"

应用程序"A"

Windows 保护虚拟机

Linux保护虚拟机

网络

Page 5: Stratus - White Paper -  everRun Enterprise - Ready Your Infrastructure for the Always On World

为了防止由于人为失误、火灾或断电而导致的局部损失,Stratus还提供了附加解决方案来对整个大都会区域应受保护的基础设施进行同步数据复制。针对更大的地理分散区域,Stratus为这种广域网络连接提供了集成的异步数据复制,以防止受到重大灾难的影响。

此外,Stratus还提供了一个集中管理控制台来对整个基础设施进行管理。管理人员可以通过一个单一屏幕构建和部署虚拟机,指定容错服务器对,选择应用的可用性模式,并对服务器上的多套软件进行配置。对于多个容错服务器对来说,也可以通过这个集中控制台进行管理。这不仅是一种确保系统可用性的强大方式,同时也可以尽量减少管理时间与操作。此外,Stratus还通过其支持中心提供另外一层保护,对系统进行全天候监控,并在发现问题时自动通知系统管理员。

平台解决方案Stratus平台通过集成硬件、软件以及服务的成套解决方案,确保系统的无忧运行。这些平台以Intel® Xeon®技术为基础,并且可以运行Windows, Linux®, 以及 VMware®等操作系统。Stratus时刻在线平台的每个构件都成对配备 – 包括CPU、内存、I/O、磁盘以及电源 – 并且所有部件都作为一个系统同步工作(见图6)。

当部件发生故障时,其配对部件会立刻将系统操作接管过来,防止系统出现性能下降、数据丢失或停机等问题,从而无需对系统进行重启或故障切换。

由于网络、操作系统以及应用程序都将整个系统视为一个单一的系统映像,因此无需对应用程序进行任何修改或取得多套软件许可。这使得Stratus平台便于设置和维护 – 特别是与集群架构相比 – 并且通常不需要现场IT支持。内置于Stratus平台的软件可以检测并预防许多导致停机与数据丢失的故障。这些软件还可以简化服务器的监控和管理,为系统提供远程服务与支持。此外,Stratus还提供了一项独特的功能,可以对深达操作系统层面的潜在问题进行诊断。全面监控与分析功能时刻保持运行状态,而非仅在故障发生之后。实际上,它可以透明地处理大多数故障,让Stratus平台越过瞬间故障正常运行,保护系统免于受到设备驱动程序发生故障的影响,防止硬件及软件故障导致系统停机。如果系统中安装的软件无法使问题获得彻底解决,Stratus平台将会自动通知Stratus支持中心,以提醒他们系统存在的问题。Stratus可用性专家将会全天候对Stratus平台进行监控,以便在业务运营受到影响之前,主动对问题加以解决。这些训练有素的技术人员可以在30分钟内解决大多数问题。只有不到1%的系统问题需要现场支持。如果平台构件发生失效,系统将会自动派送第二天到达的替换部件。由于Stratus独特的热插拔设计,新部件可以很方便地进行更换,无需任何工具或特别计算机技能。您只需将故障单元从系统中拔出,然后将新单元插入系统即可。在这个部件更换过程中,不会对系统正常运行造成任何中断,并且不会造成任何数据丢失。

确保您的基础设施永远在线

www.stratus.comwww.stratus.com

图6 – Stratus Availability Engine Architecture

Stratus提供的基础设施解决方案就是针对系统要求 - 永远在线”Always-on”而设计。

www.stratus.com

White Paper | 5

Page 6: Stratus - White Paper -  everRun Enterprise - Ready Your Infrastructure for the Always On World

结论

如今,我们日常生活的几乎方方面面都依赖于需要无间断持续运行的IT系统,因此保持系统的连续可用性以及预防系统停机非常必要。Stratus基础设施解决方案从一开始就是针对保持系统时刻在线的需求而设计的。与其他专注于对已发生故障进行恢复的设计方法不同(比如冷备份服务器,以及故障切换集群),Stratus的解决方案致力于防患于未然。虽然多数机构也为大型自然灾害或突发性地缘政治事件进行了准备,但是他们往往忽视了日常的服务器故障及驱动器崩溃事件。Stratus的设计理念是对这些事件进行预防,避免故障的发生,以防客户的生产率和利润受损,以及数据发生丢失。Stratus为世界上最苛刻的应用提供高可用性和容错解决方案已经有30年的历史,新的解决方案正是建立在这个强大的基础之上。Stratus的解决方案:

◆ 灵活性高 - 可支持多种操作系统,可以在物理 、虚拟或云环境中使用

◆ 简单易用 - 在几分钟内就可完成部署,无需对应用进行任何修改,也无需特别的专业知识

◆ 值得信赖 - 从全球财富 500 强企业到中小企业以及市政府,我们的客户都依赖 Stratus 来保持其最关键应用的正常运转。

对于制造业,Stratus的解决方案是保持生产率和降低浪费的关键;对于零售商来说,这些解决方案可以确保交易处理系统时刻保持在线,以实现销售目标;在建筑安全领域,Stratus的解决方案可以保护建筑及人员免遭内部或外部威胁;医疗急救人员可以确保对救生系统的访问;每秒钟需要处理成千上万笔交易的金融服务公司可以避免成本高昂的系统停机。而医疗机构可以确保对患

者记录进行不间断的访问,同时满足合规性要求。Stratus可提供适当的解决方案,满足当今需要保持时刻在线的应用环境的要求,防止系统因日常问题发生停机,确保业务在发生重大灾难时仍然能够保持连续性。

关于Stratus Technologies

在当今永远在线的世界里,应用程序的运行要求越来越苛刻。而随着这些需求的迅猛增长,防止应用程序停机的压力也随之加大。许多公司都在积极探索能够兼容或增强当前 IT 基础设施的技术,从而满足解决方案永远在线这一需求。

Stratus 的解决方案可帮助您从企业服务器到云快速部署永远在线不间断运行的基础设施,且无需更改您的应用程序也无需专业技术。我们的软件和平台产品与我们的人员和服务相结合,使我们能在停机发生之前进行预防,并确保基本业务运营全年全天候不间断。

如欲了解更多信息,请登录:www.stratus.com 或 www.cn.stratus.com

确保您的基础设施永远在线

Stratus提供适当的解决方案,满足当今需要保持时刻在线的应用环境的要求,防止系统因日常问题发生停机,确保业务在发生重大灾难时仍然能够保持连续性。

www.stratus.com

White Paper | 6

Specifications and descriptions are summary in nature and subject to change without notice.

Stratus and the Stratus Technologies logo are trademarks or registered trademarks of Stratus Technologies Bermuda Ltd. All other marks are the property of their respective owners. ©2014 Stratus Technologies Bermuda Ltd. All rights reserved. 140122

美国容错技术(香港)有限公司香港尖沙咀海港城海洋中心9楼901室 | 电话: 852-28445200 | 邮箱: [email protected]

北京代表处北京市西城区西直门外大街1号 | 西环广场T3-21层-B1 | 100044 | 电话: 86-10-58302999 | 邮箱:[email protected]

上海办事处上海市浦东新区陆家嘴花园石桥路66号 | 东亚银行金融大厦15楼 | 200120 | 邮箱:[email protected]