vmware 技术大讲堂 —— 虚拟化容灾方案
Post on 31-Dec-2015
210 Views
Preview:
DESCRIPTION
TRANSCRIPT
© 2011 VMware Inc. All rights reserved
VMware 技术大讲堂 ——虚拟化容灾方案
2
议程
虚拟数据中心容灾特点
本地虚拟数据中心容灾方案
异地虚拟数据中心容灾方案
双活虚拟数据中心数据中心
虚拟数据中心容灾案例分享
1
2
3
4
5
3
虚拟数据中心容灾特点
4
43% 的企业在经历灾难后无法继续运营, 29% 的企业在 2 年内倒闭
(McGladrey and Pullen)
93% 的企业在数据中心停运 10 天以上之后的 1 年内倒闭
(National Archives & Records Administration)
对企业而言,灾难意味着可能永远出局
地震 雪灾 海啸 洪水 飓风 火灾
5
人们最大的误区:大部分的灾难事件来自于自然灾害
地震
27%
73%
天气
洪水
火灾
恶意代码
系统故障
社会工程攻击
人为操作失误
对于大众与审计部门是可以理解
的大众与审计部门是缺乏耐心的
6
传统业务级容灾方案面临的挑战
昂贵的成本 复杂的恢复方案
?
??
??
??
?
无法检验的恢复
应用
主机
存储
网络
软件
主机
存储
设施
=+现实差距
• 无法满足业务部门的要求• 过渡开销资源
基本要求无法满足
7
传统灾难恢复方案的覆盖率十分低
Tier 1 应用 – 群集保护
Tier 2 / 3 应用 – 只有备份保护
企业数据中心
小型站点 – 只有备份保护
小型异地分支机构
传统灾备方案无法覆盖的业务: • 大型数据中心的 2 级或 3 级应用 • 中小型企业 • 远程分支机构
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
OS
APP
8
业务连续性保证应该是一项适用于各种应用的基础架构服务
资源池
vSphere vSphere vSphere
本地站点 容灾站点
• vCenter Site Recovery Manager
• MetroClustering
• VMware High Availability (app-aware)
• VMware Fault Tolerance• VMotion and Storage VMotion
• VMware Data Protection• vStorage APIs for Data Protection
资源池
vSphere vSphere
Dev /
Test
Dev /
Test
Dev /
Test
灾难恢复本地高可用
数据保护
8
• 与应用程序和操作系统无关 • 简单,经济
9
• Active/Active存储
• VMware HA
备份软件 & 异地数据复制
虚拟数据中心容灾方案的几种选择
异地双活业务容灾
• SRM 灾难恢复计划• 虚拟机 IP 复制• 存储 FC 复制
RTO&RPO
成本
异地业务容灾
本地容灾方案
异地数据容灾
• VMware HA• 备份软件• 虚拟机基于 IP 的复制
• Active/Active 存储
• VMware HA
10
结合业务梳理,选择适合的容灾方案
RTO RPO 解决方案
生产核心业务单台存储故障时,
业务零中断数据零丢失
异地双活数据中心,
数据本地 / 异地备份
营销业务允许短暂的业务中
断(少于 2 小时)数据零丢失
异地双活数据中心,
数据本地 / 异地备份
运营业务允许 1 天之内恢复
业务
可以容忍 1 天的数据
丢失数据本地 / 异地备份
11
本地虚拟数据中心容灾方案
12
VMware HA 确保虚拟机高可用
13
虚拟机的自启动顺序
• 相关应用的虚拟机的启动顺序
通过 vApp 设置启动顺序
• 主机的正常开机、关机、重启
virtual machine startup and shutdown
• 主机故障 VMware HA 生效时
VMware HA 启动顺序 (VM Restart Priority)
14
应用的自启动顺序
VMware Tools 启动脚本路径:1. Windows : C:\Program Files\VMware
2. Linux : /etc/vmware-tools
其他自动启动应用的方式:1. Windows
修改注册表 注册 Windows Service
2. Linux 的开机启动脚本
15
应用程序资源
操作系统
VM
ESX 服务器
站点
应用程序组件
与 VMware HA 配合的第三方高可用方案
15
VM
操作系统
VM
操作系统
VMware ESX
VM
操作系统
c3c2
c1
c2 c4
c1 c3c1
c2
Symantec Application
HA
保护应用程序组件
VMware HA
保护基础架构组件
与 VMware Tools Application Monitoring API 集成
16
与 VMware HA 配合的第三方高可用方案 (控制台界面)
17
异地虚拟数据中心容灾方案
18
通过数据备份实现异地数据级容灾
ESX
备份数据经过重复数据删除后复制到容灾站点
磁带出库
生产中心备份服务器
灾备中心备份服务器
ESX
ESX
19
Application
Application
Application
Application
Application
数据中心 2
Tier 1 关键业务系统
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Tier 2 与 Tier 3 应用
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
Application
数据中心 1
Tier 1 关键业务系统
2:46 p.m.
45 英里以外的海域发生地震
2:57 p.m.
IT 部门紧急反应
3:55 p.m.
海啸来袭!!!
2:49 p.m.
发布海啸警报
Tier 2 与 Tier 3 应用
19
异地业务级容灾示例
20
容灾方案启动的若干场景
突然发生的站点故障
• 例如:地震,火灾等
• 全站或部分系统故障
最关键但是最不常见的情形
• 站点的故障不会经常发生
• 一旦发生,需要快速恢复
可预测的潜在危险
• 例如: 台风,洪水,强制疏散等
启动故障应急预案,将业务平稳转移
• 计划内迁移:保证没有数据丢失
• 自动回迁:保证平稳地恢复系统
最常见的用户使用情形
• 预先规划好的数据中心的维护
• 全局负载均衡
在站点之间的平稳迁移
• 不中断业务的测试
• 测试部分故障转移
• 计划内迁移:保证没有数据丢失
• 自动回迁:双向的平稳迁移
灾难故障转移Disaster Failover
灾难回避Disaster
Avoidance
计划内迁移Planned
Migration
21
VMware 虚拟化容灾平台 — Site Recovery Manager 5.1
Storage
Servers
VMware vSphere
vCenter ServerSite
Recovery Manager
Virtual Machines
Site Recovery Manager• 管理恢复计划 (Recovery Plans)• 自动化故障转移 (Failover) 与灾后恢复
(Failback) • 与 vCenter 以及各种复制技术紧密集成
基于存储的复制功能 ( 第三方 )• 由复制软件 / 磁盘阵列供应商提供 • 由各供应商开发、认证、支持的复制适配器
vSphere Replication•vSphere 核心代码的一部分• 支持跨群集 / 跨 vCenter 复制虚拟机
可选的复制功能
生产与灾备中心同时需要部署以下组件
22
容灾平台的基石 — 数据复制
复制方案提供商 成本 管理 性能
VMware 软件复制方案 — vSphere Replication
VMware
• 支持低端存储• 无需额外的复制
软件许可
• 虚拟机的颗粒度更易管理
• 直接在 vCenter中管理
• 最小 15 分钟RPOs
• 扩展到 500个虚拟机
•文件基本的一致性 •影响的功能: automated failback, FT, linked clones, physical RDM
基于存储的复制方案 — Storage-based Replication
• 高端存储复制 • 额外的复制软件费用
• 以 LUN为最小复制单位
• 需要与存储团队配合
•同步复制 • 大数据量
23
Oracle Database(SAP) – Oracle Data Guard 与 SRM
vCenter ServerSite
Recovery Manager
vSphere
vCenter ServerSite
Recovery Manager
vSpherevSphere
Replication
Site A (Primary) Site B (Recovery)
PrimarySAP DB
Standby SAP DB
Oracle Data Guard
Log Shipping
SAP CS SAP PAS SAP CS SAP PAS
同样适用于以下的 Log Shipping 方式 Exchange DAG
SQL Always-on
24
适合 vSphere Replication 的使用场景
只需要基本的复制需求
远程 / 分支机构恢复方案
本地恢复方案
利用同一个 vCenter 控制小型、相邻地区的分支机构
数据中心迁移项目
✔✔✔✔✔
26
通过 Seeding 的方式加速 vSphere Replication 的初次同步时间、节省带宽
用户可以为初次拷贝提供复制种子
“种子”可以通过任意带外的方式递送到灾备中心
“种子”的时间点越接近生产虚拟机越好
在用户配置复制关系时可以指定导入种子文件
27
vSphere Replication :上传种子
28
vSphere Replication :选择种子
29
vSphere Replication :确认使用种子
30
适合 Site Recovery Manager 的使用场景
扩展性
• 需要保护的虚拟机的数量急速增长
自动
• 需要在容灾方案中获得更好的自动化手段
可靠性
• 要求拥有可靠的不中断容灾演练、迁移、 failover 与 failback
自定义
• 需要自定义恢复流程,并确保自动地执行( IP变化, VM 与 VM 启动 / 关闭依赖关系,自定义调用其他脚本)
应用支持
• 需要创建虚拟机的保护组
重复
• 需要可重复的、内置的恢复计划,从而可以切换( failover )部分或所有的业务虚拟机
vSphere Replication 仅仅是保护,而 SRM 是灾难恢复
31
双活虚拟数据中心容灾方案
32
Site A Datastore
典型的双活数据中心方案拓扑vSphere Metro Storage Cluster (vMSC)
vMotion
vCenter Server
vSphere Cluster
站点 A 主机ESXiESXiESXiESXi
Site B Datastore
站点 B 主机ESXiESXiESXiESXi
Active / Active Storage
最大的优势:1. 跨站点的资源负载在线调配 (workload balance)2. 灾难回避 (disaster avoidance)& 计划内迁移 ,业务零中断 , 数据零丢失
33
VMware Metro vMotion 基础架构要求
vMotion
跨数据中心虚拟网络扩展
(VLAN)
跨数据中心存储扩展
IP 路由考虑
存储• 任意时间任意位置读 /写,且冗余保
障 • 存储链路延迟小于 5ms RTT• 存储硬件兼容性 -Certified vMCS
网络• IP 路由与服务• L2层网络相邻• ESXi 管理网络延迟 小于 10ms RTT• 考虑”脑裂”现象
34
个别关键应用的最佳选择: vMCS 与 Oracle RAC 配合的 SAP 双活方案
Site A Site B
VPLEX MetroStorage Replication
Layer 2
Latency 1 msDistance 100 km
Brocade MLX
Brocade MLX
Brocade VDX
Brocade VDXLayer 2 Domain
Oracle RAC Oracle RACBrocade DCX Brocade DCX
EMC Symmetrix VMAX EMC VPLEX EMC VPLEX EMC VNX
vLAG vLAG
VMware ESXiSAP
VPLEX Witness
Site C
VMware ESXi
VMware ESXiSAP
Ethernet
IP 10 GbE
Fibre Channel
Client Access
35
虚拟数据中心容灾案例分享
36
容灾即服务( DRaaS )
通过云数据中心提容灾服务(基于 VMware SRM ):• FusionStorm
• Hosting.com
• iland
• VeriStor
• SunGard
• Terremark
• IIJ (Japan)
供应商提供不同的定价、服务打包、 服务级别与部署选项
PublicCloud
Service Provider
vSphere
vCenter S
RM
5
37
SunGuard 用户场景: 完全使用 SRM 实现容灾计划
典型的中小企业用户 100% 虚拟化的数据中心
ATOT/D
Secure NTAPShared Vaults
SRM
SRM
vCenter
vCenter
Customer DR SRM Instance
SnapMirror
SRM
Recover customer environment using SRM
from Secure NTAP Shared Vaults
Use SRAs to orchestrate SnapMirror replication to
Secure NTAP Shared Vaults
SunGard replicates customer’s VM DR plan
using SRM
3TB NTAP SAN, 25 VMs, 要求 4 小时内的 RTO ,按需启动灾备中心业务虚拟机作用于产品测试与用户体验测
试
SunGard 基于 SRM 的 Recovery-as-a-Service
38
SunGuard 用户场景 2 : SRM 作为容灾计划的重要组成部分
大型企业用户 虚拟与物理环境混合的数据中心
ATOT/D
SRM vCenter
SunGard SRM RaaSSRM
Bridge recovery environment with
workgroup for end-user access
MRP for orchestrating recovery across multiple
tiers and DR lifecycle management
SRM RaaS for VM recovery and R2C Server Rep for physical servers
(P2V)
300TB EMC SAN, 645 个虚拟机 与 40 台物理服务器。 RTO 按业务不同
要求 4 至 12 小时。
645 VMs on ESX 4.x running on EMC SAN
SRDF
40 台物理Windows服务器 ATOT/
D
SunGard R2C Server Replication P2V Server
Replication
WorkGroup subscription for
50 positions
SunGard’s Managed Recovery Program (MRP) Services
39
Hosting.com 基于 SRM 为用户提供自助容灾服务
40
灵活利用多种基于 IP 的复制方式- VMware vSphere Replication- Oracle Dataguard- Microsoft Log Shipping- File Replication Tools
Hosting.com 提供更高性价比的容灾服务
45
top related