vmware 技术大讲堂 —— 虚拟化容灾方案

40
© 2011 VMware Inc. All rights reserved VMware 技技技技技 ——技技技技技技技

Upload: lilah-horton

Post on 31-Dec-2015

210 views

Category:

Documents


0 download

DESCRIPTION

VMware 技术大讲堂 —— 虚拟化容灾方案. 议程. 1. 2. 3. 4. 5. 虚拟数据中心容灾特点. 对企业而言,灾难意味着可能永远出局. 43% 的企业在 经历 灾难后无法继续运营, 29 % 的企业在 2 年 内倒闭 ( McGladrey and Pullen). 93% 的企业在数据中心停运 10 天以上 之后的 1 年内倒闭 ( National Archives & Records Administration). 人们 最大的误区:大部分的灾难事件来自于自然灾害. 对于大众与审计部门是可以理解的. 社会工程攻击. 火灾. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: VMware 技术大讲堂 —— 虚拟化容灾方案

© 2011 VMware Inc. All rights reserved

VMware 技术大讲堂 ——虚拟化容灾方案

Page 2: VMware 技术大讲堂 —— 虚拟化容灾方案

2

议程

虚拟数据中心容灾特点

本地虚拟数据中心容灾方案

异地虚拟数据中心容灾方案

双活虚拟数据中心数据中心

虚拟数据中心容灾案例分享

1

2

3

4

5

Page 3: VMware 技术大讲堂 —— 虚拟化容灾方案

3

虚拟数据中心容灾特点

Page 4: VMware 技术大讲堂 —— 虚拟化容灾方案

4

43% 的企业在经历灾难后无法继续运营, 29% 的企业在 2 年内倒闭

(McGladrey and Pullen)

93% 的企业在数据中心停运 10 天以上之后的 1 年内倒闭

(National Archives & Records Administration)

对企业而言,灾难意味着可能永远出局

地震 雪灾 海啸 洪水 飓风 火灾

Page 5: VMware 技术大讲堂 —— 虚拟化容灾方案

5

人们最大的误区:大部分的灾难事件来自于自然灾害

地震

27%

73%

天气

洪水

火灾

恶意代码

系统故障

社会工程攻击

人为操作失误

对于大众与审计部门是可以理解

的大众与审计部门是缺乏耐心的

Page 6: VMware 技术大讲堂 —— 虚拟化容灾方案

6

传统业务级容灾方案面临的挑战

昂贵的成本 复杂的恢复方案

?

??

??

??

?

无法检验的恢复

应用

主机

存储

网络

软件

主机

存储

设施

=+现实差距

• 无法满足业务部门的要求• 过渡开销资源

基本要求无法满足

Page 7: VMware 技术大讲堂 —— 虚拟化容灾方案

7

传统灾难恢复方案的覆盖率十分低

Tier 1 应用 – 群集保护

Tier 2 / 3 应用 – 只有备份保护

企业数据中心

小型站点 – 只有备份保护

小型异地分支机构

传统灾备方案无法覆盖的业务: • 大型数据中心的 2 级或 3 级应用 • 中小型企业 • 远程分支机构

OS

APP

OS

APP

OS

APP

OS

APP

OS

APP

OS

APP

OS

APP

OS

APP

OS

APP

OS

APP

Page 8: VMware 技术大讲堂 —— 虚拟化容灾方案

8

业务连续性保证应该是一项适用于各种应用的基础架构服务

资源池

vSphere vSphere vSphere

本地站点 容灾站点

• vCenter Site Recovery Manager

• MetroClustering

• VMware High Availability (app-aware)

• VMware Fault Tolerance• VMotion and Storage VMotion

• VMware Data Protection• vStorage APIs for Data Protection

资源池

vSphere vSphere

Dev /

Test

Dev /

Test

Dev /

Test

灾难恢复本地高可用

数据保护

8

• 与应用程序和操作系统无关 • 简单,经济

Page 9: VMware 技术大讲堂 —— 虚拟化容灾方案

9

• Active/Active存储

• VMware HA

备份软件 & 异地数据复制

虚拟数据中心容灾方案的几种选择

异地双活业务容灾

• SRM 灾难恢复计划• 虚拟机 IP 复制• 存储 FC 复制

RTO&RPO

成本

异地业务容灾

本地容灾方案

异地数据容灾

• VMware HA• 备份软件• 虚拟机基于 IP 的复制

• Active/Active 存储

• VMware HA

Page 10: VMware 技术大讲堂 —— 虚拟化容灾方案

10

结合业务梳理,选择适合的容灾方案

  RTO RPO 解决方案

生产核心业务单台存储故障时,

业务零中断数据零丢失

异地双活数据中心,

数据本地 / 异地备份

营销业务允许短暂的业务中

断(少于 2 小时)数据零丢失

异地双活数据中心,

数据本地 / 异地备份

运营业务允许 1 天之内恢复

业务

可以容忍 1 天的数据

丢失数据本地 / 异地备份

Page 11: VMware 技术大讲堂 —— 虚拟化容灾方案

11

本地虚拟数据中心容灾方案

Page 12: VMware 技术大讲堂 —— 虚拟化容灾方案

12

VMware HA 确保虚拟机高可用

Page 13: VMware 技术大讲堂 —— 虚拟化容灾方案

13

虚拟机的自启动顺序

• 相关应用的虚拟机的启动顺序

通过 vApp 设置启动顺序

• 主机的正常开机、关机、重启

virtual machine startup and shutdown

• 主机故障 VMware HA 生效时

VMware HA 启动顺序 (VM Restart Priority)

Page 14: VMware 技术大讲堂 —— 虚拟化容灾方案

14

应用的自启动顺序

VMware Tools 启动脚本路径:1. Windows : C:\Program Files\VMware

2. Linux : /etc/vmware-tools

其他自动启动应用的方式:1. Windows

修改注册表 注册 Windows Service

2. Linux 的开机启动脚本

Page 15: VMware 技术大讲堂 —— 虚拟化容灾方案

15

应用程序资源

操作系统

VM

ESX 服务器

站点

应用程序组件

与 VMware HA 配合的第三方高可用方案

15

VM

操作系统

VM

操作系统

VMware ESX

VM

操作系统

c3c2

c1

c2 c4

c1 c3c1

c2

Symantec Application

HA

保护应用程序组件

VMware HA

保护基础架构组件

与 VMware Tools Application Monitoring API 集成

Page 16: VMware 技术大讲堂 —— 虚拟化容灾方案

16

与 VMware HA 配合的第三方高可用方案 (控制台界面)

Page 17: VMware 技术大讲堂 —— 虚拟化容灾方案

17

异地虚拟数据中心容灾方案

Page 18: VMware 技术大讲堂 —— 虚拟化容灾方案

18

通过数据备份实现异地数据级容灾

ESX

备份数据经过重复数据删除后复制到容灾站点

磁带出库

生产中心备份服务器

灾备中心备份服务器

ESX

ESX

Page 19: VMware 技术大讲堂 —— 虚拟化容灾方案

19

Application

Application

Application

Application

Application

数据中心 2

Tier 1 关键业务系统

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Tier 2 与 Tier 3 应用

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

Application

数据中心 1

Tier 1 关键业务系统

2:46 p.m.

45 英里以外的海域发生地震

2:57 p.m.

IT 部门紧急反应

3:55 p.m.

海啸来袭!!!

2:49 p.m.

发布海啸警报

Tier 2 与 Tier 3 应用

19

异地业务级容灾示例

Page 20: VMware 技术大讲堂 —— 虚拟化容灾方案

20

容灾方案启动的若干场景

突然发生的站点故障

• 例如:地震,火灾等

• 全站或部分系统故障

最关键但是最不常见的情形

• 站点的故障不会经常发生

• 一旦发生,需要快速恢复

可预测的潜在危险

• 例如: 台风,洪水,强制疏散等

启动故障应急预案,将业务平稳转移

• 计划内迁移:保证没有数据丢失

• 自动回迁:保证平稳地恢复系统

最常见的用户使用情形

• 预先规划好的数据中心的维护

• 全局负载均衡

在站点之间的平稳迁移

• 不中断业务的测试

• 测试部分故障转移

• 计划内迁移:保证没有数据丢失

• 自动回迁:双向的平稳迁移

灾难故障转移Disaster Failover

灾难回避Disaster

Avoidance

计划内迁移Planned

Migration

Page 21: VMware 技术大讲堂 —— 虚拟化容灾方案

21

VMware 虚拟化容灾平台 — Site Recovery Manager 5.1

Storage

Servers

VMware vSphere

vCenter ServerSite

Recovery Manager

Virtual Machines

Site Recovery Manager• 管理恢复计划 (Recovery Plans)• 自动化故障转移 (Failover) 与灾后恢复

(Failback) • 与 vCenter 以及各种复制技术紧密集成

基于存储的复制功能 ( 第三方 )• 由复制软件 / 磁盘阵列供应商提供 • 由各供应商开发、认证、支持的复制适配器

vSphere Replication•vSphere 核心代码的一部分• 支持跨群集 / 跨 vCenter 复制虚拟机

可选的复制功能

生产与灾备中心同时需要部署以下组件

Page 22: VMware 技术大讲堂 —— 虚拟化容灾方案

22

容灾平台的基石 — 数据复制

复制方案提供商 成本 管理 性能

VMware 软件复制方案 — vSphere Replication

VMware

• 支持低端存储• 无需额外的复制

软件许可

• 虚拟机的颗粒度更易管理

• 直接在 vCenter中管理

• 最小 15 分钟RPOs

• 扩展到 500个虚拟机

•文件基本的一致性 •影响的功能: automated failback, FT, linked clones, physical RDM

基于存储的复制方案 — Storage-based Replication

• 高端存储复制 • 额外的复制软件费用

• 以 LUN为最小复制单位

• 需要与存储团队配合

•同步复制 • 大数据量

Page 23: VMware 技术大讲堂 —— 虚拟化容灾方案

23

Oracle Database(SAP) – Oracle Data Guard 与 SRM

vCenter ServerSite

Recovery Manager

vSphere

vCenter ServerSite

Recovery Manager

vSpherevSphere

Replication

Site A (Primary) Site B (Recovery)

PrimarySAP DB

Standby SAP DB

Oracle Data Guard

Log Shipping

SAP CS SAP PAS SAP CS SAP PAS

同样适用于以下的 Log Shipping 方式 Exchange DAG

SQL Always-on

Page 24: VMware 技术大讲堂 —— 虚拟化容灾方案

24

适合 vSphere Replication 的使用场景

只需要基本的复制需求

远程 / 分支机构恢复方案

本地恢复方案

利用同一个 vCenter 控制小型、相邻地区的分支机构

数据中心迁移项目

✔✔✔✔✔

Page 25: VMware 技术大讲堂 —— 虚拟化容灾方案

26

通过 Seeding 的方式加速 vSphere Replication 的初次同步时间、节省带宽

用户可以为初次拷贝提供复制种子

“种子”可以通过任意带外的方式递送到灾备中心

“种子”的时间点越接近生产虚拟机越好

在用户配置复制关系时可以指定导入种子文件

Page 26: VMware 技术大讲堂 —— 虚拟化容灾方案

27

vSphere Replication :上传种子

Page 27: VMware 技术大讲堂 —— 虚拟化容灾方案

28

vSphere Replication :选择种子

Page 28: VMware 技术大讲堂 —— 虚拟化容灾方案

29

vSphere Replication :确认使用种子

Page 29: VMware 技术大讲堂 —— 虚拟化容灾方案

30

适合 Site Recovery Manager 的使用场景

扩展性

• 需要保护的虚拟机的数量急速增长

自动

• 需要在容灾方案中获得更好的自动化手段

可靠性

• 要求拥有可靠的不中断容灾演练、迁移、 failover 与 failback

自定义

• 需要自定义恢复流程,并确保自动地执行( IP变化, VM 与 VM 启动 / 关闭依赖关系,自定义调用其他脚本)

应用支持

• 需要创建虚拟机的保护组

重复

• 需要可重复的、内置的恢复计划,从而可以切换( failover )部分或所有的业务虚拟机

vSphere Replication 仅仅是保护,而 SRM 是灾难恢复

Page 30: VMware 技术大讲堂 —— 虚拟化容灾方案

31

双活虚拟数据中心容灾方案

Page 31: VMware 技术大讲堂 —— 虚拟化容灾方案

32

Site A Datastore

典型的双活数据中心方案拓扑vSphere Metro Storage Cluster (vMSC)

vMotion

vCenter Server

vSphere Cluster

站点 A 主机ESXiESXiESXiESXi

Site B Datastore

站点 B 主机ESXiESXiESXiESXi

Active / Active Storage

最大的优势:1. 跨站点的资源负载在线调配 (workload balance)2. 灾难回避 (disaster avoidance)& 计划内迁移 ,业务零中断 , 数据零丢失

Page 32: VMware 技术大讲堂 —— 虚拟化容灾方案

33

VMware Metro vMotion 基础架构要求

vMotion

跨数据中心虚拟网络扩展

(VLAN)

跨数据中心存储扩展

IP 路由考虑

存储• 任意时间任意位置读 /写,且冗余保

障 • 存储链路延迟小于 5ms RTT• 存储硬件兼容性 -Certified vMCS

网络• IP 路由与服务• L2层网络相邻• ESXi 管理网络延迟 小于 10ms RTT• 考虑”脑裂”现象

Page 33: VMware 技术大讲堂 —— 虚拟化容灾方案

34

个别关键应用的最佳选择: vMCS 与 Oracle RAC 配合的 SAP 双活方案

Site A Site B

VPLEX MetroStorage Replication

Layer 2

Latency 1 msDistance 100 km

Brocade MLX

Brocade MLX

Brocade VDX

Brocade VDXLayer 2 Domain

Oracle RAC Oracle RACBrocade DCX Brocade DCX

EMC Symmetrix VMAX EMC VPLEX EMC VPLEX EMC VNX

vLAG vLAG

VMware ESXiSAP

VPLEX Witness

Site C

VMware ESXi

VMware ESXiSAP

Ethernet

IP 10 GbE

Fibre Channel

Client Access

Page 34: VMware 技术大讲堂 —— 虚拟化容灾方案

35

虚拟数据中心容灾案例分享

Page 35: VMware 技术大讲堂 —— 虚拟化容灾方案

36

容灾即服务( DRaaS )

通过云数据中心提容灾服务(基于 VMware SRM ):• FusionStorm

• Hosting.com

• iland

• VeriStor

• SunGard

• Terremark

• IIJ (Japan)

供应商提供不同的定价、服务打包、 服务级别与部署选项

PublicCloud

Service Provider

vSphere

vCenter S

RM

5

Page 36: VMware 技术大讲堂 —— 虚拟化容灾方案

37

SunGuard 用户场景: 完全使用 SRM 实现容灾计划

典型的中小企业用户 100% 虚拟化的数据中心

ATOT/D

Secure NTAPShared Vaults

SRM

SRM

vCenter

vCenter

Customer DR SRM Instance

SnapMirror

SRM

Recover customer environment using SRM

from Secure NTAP Shared Vaults

Use SRAs to orchestrate SnapMirror replication to

Secure NTAP Shared Vaults

SunGard replicates customer’s VM DR plan

using SRM

3TB NTAP SAN, 25 VMs, 要求 4 小时内的 RTO ,按需启动灾备中心业务虚拟机作用于产品测试与用户体验测

SunGard 基于 SRM 的 Recovery-as-a-Service

Page 37: VMware 技术大讲堂 —— 虚拟化容灾方案

38

SunGuard 用户场景 2 : SRM 作为容灾计划的重要组成部分

大型企业用户 虚拟与物理环境混合的数据中心

ATOT/D

SRM vCenter

SunGard SRM RaaSSRM

Bridge recovery environment with

workgroup for end-user access

MRP for orchestrating recovery across multiple

tiers and DR lifecycle management

SRM RaaS for VM recovery and R2C Server Rep for physical servers

(P2V)

300TB EMC SAN, 645 个虚拟机 与 40 台物理服务器。 RTO 按业务不同

要求 4 至 12 小时。

645 VMs on ESX 4.x running on EMC SAN

SRDF

40 台物理Windows服务器 ATOT/

D

SunGard R2C Server Replication P2V Server

Replication

WorkGroup subscription for

50 positions

SunGard’s Managed Recovery Program (MRP) Services

Page 38: VMware 技术大讲堂 —— 虚拟化容灾方案

39

Hosting.com 基于 SRM 为用户提供自助容灾服务

Page 39: VMware 技术大讲堂 —— 虚拟化容灾方案

40

灵活利用多种基于 IP 的复制方式- VMware vSphere Replication- Oracle Dataguard- Microsoft Log Shipping- File Replication Tools

Hosting.com 提供更高性价比的容灾服务

Page 40: VMware 技术大讲堂 —— 虚拟化容灾方案

45