exchange server 2010 の高可用デザイン及び 障害時回復手順のポイント
DESCRIPTION
セッション ID: T5-402. Exchange Server 2010 の高可用デザイン及び 障害時回復手順のポイント. 富士通 株式会社 プラットフォーム技術本部 MS ミドルウェア技術センター 堀内 啓士. セッションの目的 Exchange Server の高可用性機能を理解して頂く 障害発生時の振舞い、復旧手順を理解して頂く セッションのゴール 可用性の高い Exchange Server 2010 のシステムを構築する上で必要となる機能について説明 できるようになる。 - PowerPoint PPT PresentationTRANSCRIPT
富士通 株式会社プラットフォーム技術本部MS ミドルウェア技術センター堀内 啓士
Exchange Server 2010 の高可用デザイン及び障害時回復手順のポイント
セッション ID: T5-402
3
セッションの目的とゴールSession Objectives and Takeawaysセッションの目的
Exchange Server の高可用性機能を理解して頂く障害発生時の振舞い、復旧手順を理解して頂く
セッションのゴール可用性の高い Exchange Server 2010 のシステムを構築する上で必要となる機能について説明できるようになる。可用性要件を満たす Exchange Server 2010 システムを設計できるようになる。障害が発生した場合のシーケンス、復旧手順を説明できるようになる。
4
自己紹介アライアンス チームでの SI 商談をバックアップ
業種 / 地域
営業
SE部門
営業部門
最適
ソリ
ュー
ショ
ン
マーケティング 本部MS ソリューション推進部
MS ミドルウェア技術センターテクニカル支援 / 情報提供技術者育成支援
お客
様
プラットフォーム技術本部ISV センター
富士通アライアンス営業本部
戦略協議・立案・遂行
活動推進施策実施
5
アジェンダ
Exchange Server 2010 の可用性
DAG 設定ポイント
DAG 設定手順
障害発生時の動作
SP1 可用性機能
参考 : バックアップ
6
アジェンダ
Exchange Server 2010 の可用性
各ロールの可用性Database Availability Group
DAG 設定ポイント
DAG 設定手順
障害発生時の動作
SP1 可用性機能
参考 : バックアップ
7
各ロールの高可用性機能 /1
メールボックス(MBX)サーバー ロール
ハブトランスポート (HUB)サーバー ロール
クライアント アクセス (CAS)サーバー ロール
Database Availability Group (DAG)MSFC をベースとした非共有の冗長化ログ レプリケーション、最大 16 多重化
複数設置することで自動的に冗長化負荷分散
NLB またはハードウェア ロード バランサー による IP ベースの冗長化方式を利用
8
エッジトランスポート (EDGE)サーバー ロール
ユニファイドメッセージング サーバー ロール
NLBMX レコード
複数の UM サーバーを展開し、VoIP ゲートウェイからラウンド ロビン
各ロールの高可用性機能 /2
9
Exchange Server 2007 の高可用性機能 DB の 2 重化 サーバーの 2 重化
内蔵 HDD 利用前提
安価にシステム 全体を 2 重化
Cluster Continuous Replication
サーバーの 2 重化 災害対策
構成に制限がない 手動切り替え Standby
Continuous Replication
DB 部分のみ 2 重化
Local Continuous Replication
高信頼ストレージ 利用前提
一般的な 2 重化構成
Single Copy Cluster
Site BSite A
10
DAG (Database Availability Group)1. シードと呼ぶ DB フルコピー2. トランザクション ログ ファイルの複製3. コピー先への再生
アクティブ パッシブ1. シード処理
2. 複製
3. 再生
11
シャドウ リダンダンシー
[NG]
[OK]
シャドウキューにコピー
送信確認後、コピーを削除
SMTPHUB
EDGE 2
EDGE 1
メール転送経路の冗長化送信が完了するまでキューを保持送信先の機能対応が必要
12
MBX オンライン 移動
MBX の移動中でもメールの送受信が可能Exchange Server 2010 単独、もしくは Exchange Server 2007SP2 混在環境で利用可能負荷再配分、メンテナンス等で利用可能
クライアント
MBX 2
MBX 1
CAS
13
DAG 設計ポイント
Exchange Server 2010 の可用性
DAG 設定手順
障害発生時の動作
SP1 可用性機能
参考 : バックアップ
仕様の確認Quorum モデルDAG 設計のポイント構成例
14
DAG 構成条件
ハードウェア要件なし
MSFC を利用するため、 OS は Enterprise Edition 以上
Windows Server 2008 (SP2) Enterprise Edition 以上Windows Server 2008 R2 Enterprise Edition 以上
Exchange Server の Edition はどちらでも可
メンバー数が偶数の場合、ミラーリング監視サーバーを設置する
DAG 名=クラスター名=コンピューター名
250 msec 以下のレイテンシ
15
DAG 仕様
特徴最大 16 多重 ( アクティブ DB × 1 + パッシブ DB × 15)データベース単位のフェールオーバー (≠ サーバー単位 )
多重度 / 最大構成16 MBX サーバー /DAG16 MBX サーバー × 100 DB/Member = 1,600 DB/DAG
トランザクション ログ コピー方法高可用データベース コピー (HA database copies)時間差データベース コピー (Lagged database copies)
トランザクション ログ転送オプション経路指定、圧縮、暗号
16
DB 1パッシブ
LOG 1パッシブ
LOG 1アクティブ
DB 1アクティブ
関連オプション
ReplicationEnabled
NetworkCompression NetworkEncryption
ReplicationPort
TruncationLagTime
Set-MailboxDatabaseCopy ~ ReplayLagTime/TruncatelagTimeSet-DatabaseAvailabilityGroup ~ NetworkCompression/NetworkEncryption/ReplicationPort
MBX 1
MBX 2
ReplayLagTime
17
Quorum モデル
DAG
【ノードマジョリティ】 【ノード 及びファイル 共有 マジョリティ】
ファイル共有
ノード マジョリティ
ノード 及びファイル共有 マジョリティ
奇数台の MBX サーバーで DAG を構成(MBX サーバー数– 1) ÷ 2 台までの耐性
偶数台の MBX サーバーで DAG を構成MBX サーバー以外のファイル共有をノードとして扱うMBX サーバー数 ÷ 2 台までの耐性
DAG
18
Quorum モデル
MBX サーバーの残存数が過半数以上の場合継続稼働許容される障害数を超える DB コピー数が必要
メンバー数 Quorum モデル 許容される障害数
2 ノードおよびファイル共有マジョリティ 13 ノード マジョリティ 14 ノードおよびファイル共有マジョリティ 25 ノード マジョリティ 26 ノードおよびファイル共有マジョリティ 37 ノード マジョリティ 3
19
設計のポイント サマリー
1 ユーザー数等の要件から基本構成を決定
2
3
4
高可用性要件から集約度、冗長度を調整する
運用要件を構成に反映させる
冗長度によるサイジングの影響を把握する
20
基本構成の決定
ユーザー数、 MBX クォータ、プロファイルの決定
MBX 数 > アクティブ ユーザー数を意識する
MBX サーバーの CPU とメモリ、 DAS を利用する場合はストレージ搭載量を確認
MBX サーバーのスペックが決まれば、比率でHUB サーバー、 CAS サーバーのスペックが決まる
21
高可用成要件の反映
耐 MBX サーバー故障台数の確認 →許容させる MBX サーバー障害数の 2 倍以上の台数で構成
→ DB のコピー数は許容台数 + 1MBX サーバー故障時のユーザーへの影響度 →集約しすぎると影響大、逆はコスト大
災害対策システムを構成する場合 →想定する災害を明確にする →災害後の要件を明確にする →サイト内の冗長化 + サイト間冗長化が基本
22
DB 1
DB 2
DB 1
DB 2
ミラーリング監視サーバー
サーバー 1 台の故障に耐える構成サーバー 2 台、 DB 2 コピー
アクティブ データベース
パッシブ データベース
MBX 2MBX 1
23
MBX 4
DB 2
DB 3
DB 4
DB 3
DB 4DB 4
DB 3
DB 2DB 2
DB 1 DB 1 DB 1
MBX 3MBX 2MBX 1
サーバー 2 台の故障に耐える構成サーバー 4 台、 DB 3 コピー
ミラーリング監視サーバー
アクティブ データベース
パッシブ データベース
24
MBX 4MBX 3MBX 2MBX 1 MBX 5 MBX 6
DB 2
DB 3
DB 4
DB 6
DB 1DB 1DB 1DB 1
DB 2DB 2
DB 3
DB 4
DB 5
DB 3
DB 4
DB 5 DB 5
DB 6
DB 2
DB 4
DB 3
DB 5
DB 6 DB 6
サーバー 3 台の故障に耐える構成サーバー 6 台、 DB 4 コピー
ミラーリング監視サーバー
アクティブ データベース
パッシブ データベース
25
運用要件の反映
バックアップ製品の選択 →要件が先か、バックアップ製品が先か ?バックアップ製品の特長把握 →パッシブ DB からバックアップが可能な製品、
ストレージの機能を制御できる製品
バックアップ方法の選択 → 2 次媒体への保管が必要か、 D2D で良いか ?リカバリ →リカバリできる粒度と方法を要件と合わせる
DB 単位・ MBX 単位・アイテム単位
26
サイジングの注意点 /1アクティブ / パッシブ による必要 CPU リソースの理解
パッシブ DB は アクティブ DB の 15% の CPU リソースを要求パッシブ DB 1 つにつき、アクティブ DB に 10% の CPU リソースを追加障害発生後の最大リソースを想定する
1 日にメールボックスあたりで送受信されるメッセージ
アクティブ DB もしくは
スタンドアロン (MHz)パッシブ DB
(MHz)
50 1 0.15100 2 0.30150 3 0.45200 4 0.60~ ~ ~
500 10 1.50
27
サイジングの注意点 /2
CPU
縮退運転時 (= 最大リソース ) を考慮する
A PA A PP A
待機 DB処理用(15%)
コピー処理用(10%)
28
最小構成の DAG/1マルチロール × 2負荷分散機構の外出し、 FSW
負荷分散装置
AD サイト
DC/DNS
DAGHUBCASMBX
HUBCASMBX
複製
複製
アクティブ データベース
パッシブ データベース
29
最小構成の DAG/2シングル ロール or コンバインド ロール + MBX仮想化によるロールの分散、外部負荷分散装置不要
DC/DNS
AD サイト
HUB
MBX
CAS
DAG
NLB
HUB
MBX
CAS
30
中規模 DAG多重度増により複数台故障の耐性
DC/DNSHUB CAS アレイ
ミラーリング監視サーバー
MBX
DAG
MBX MBX MBX
アクティブ データベース
パッシブ データベース
AD サイト
31
災害対策システムプライマリ サイト単体、サイト間での冗長化切り替えは手動
WAN
プライマリ データセンター セカンダリ データセンター
DC/DNS DC/DNS
DAG 1
HUB CAS アレイ
MBX MBX
ミラーリング監視サーバー
HUB CAS アレイ
MBX
32
大規模 災害対策システム各サイト単独、及びサイト間での冗長化サイト間切り替えは手動操作
HUB CAS アレイ
MBX
MBX
MBX
MBX
DAG 1 用ミラーリング監視サーバー
Active
Passive
Active
Passive
HUB CAS アレイ
MBX
MBX
MBX
MBX
DAG 2 用ミラーリング監視サーバー
Passive Passive
Active Active
WAN
DAG 1
DAG 2
DC/DNS DC/DNS
プライマリ データセンター セカンダリ データセンター
33
DAG 設計手順
Exchange Server 2010 の可用性DAG 設計ポイント
障害発生時の動作
SP1 可用性機能
参考 : バックアップ
確認項目設定方法と手順
34
DAG の設定手順
以下の項目を事前に決定しておく
項目 説明
DAG 名 DAG の名前 (仮想コンピューター名 )
ミラーリング監視サーバー監視ディレクトリ
MBX 以外の ドメイン サーバー ( 推奨 HUB)共有フォルダー (例えば c:\DAGFileShareWitnesses\ ~ )
DAG 用 IP アドレス 仮想 IP アドレス
冗長化する DB ノード上の DB で冗長化構成とするもの
ネットワーク レプリケーションに利用するネットワークを決める
35
DAG の設定手順
項目 説明
1 DAG の作成 New-DatabaseAvailabilityGroupDAG 名、 FSW の登録
2 DAG 用ネットワークの指定 Set-DatabaseAvailabilityGroup -DatabaseAvailabilityGroupIpAddresses
3 ノードの追加 Add-DatabaseAvailabilityGroupServer
4 データベース コピーの追加 Add-MailboxDatabaseCopy
36
設定画面と確認画面 /DAG 作成
37
設定画面と確認画面 /DAG 用 IP 指定
38
設定画面と確認画面 /ノード追加
39
設定画面と確認画面 /DB コピーの追加
40
設定画面と確認画面 / 参考
41
ネットワーク アダプターの設定 /1MAPI 用ネットワークを最優先にする
42
MAPI 用の構成
ネットワーク アダプターの設定 /2
43
レプリケーション用の構成
ネットワーク アダプターの設定 /3
44
障害発生時の動作
Exchange Server 2010 の可用性
DAG 設計ポイント
SP1 可用性機能
参考 : バックアップ
障害時の動作復旧手順災害対策システム
DAG 設計手順
45
アクティブ マネージャー
DAG メンバー全ての MBX サーバーで実行されるコンポーネントDB コピー間での移動、サーバー障害の検出
プライマリ アクティブ マネージャー (PAM)
スタンバイ アクティブ マネージャー (SAM)
クラスター グループを所有する ノード が役割を持つアクティブ化、パッシブ化の決定トポロジの変更通知の受信SAM の役割
PAM 以外のノードローカル データベース、 IS の障害検出PAM への情報通知
46
コピー キューと再生キュー
47
コピー キュー
再生 キュー
アクティブ DB コピーからパッシブ DB コピーへのコピー待ちのキュー数長さが 10 未満であることが優先アクティブ化条件
パッシブ DB コピーへの再生を待つキュー数長さが 50 未満であることが優先アクティブ化条件
コピー キューと再生キュー
48
DB コピーの状態が以下の 4 つの場合に、 アクティブ化するパッシブ DB コピーを優先順位
から選定同優先順位が複数ある場合、アクティブ化優先順位番号 (Activation Preference) で決定する
DB コピーの状態
Healty
DisconnectedAndHealthy
DisconnectedAndResynchronizing
SeedingSource
優先順位
コンテンツ インデックスの状態
コピー キューの長さ
再生キューの長さ
1 Healthy 10 未満 50 未満
2 Crawling 10 未満 50 未満
3 Healthy 無条件 50 未満
4 Crawling 無条件 50 未満
5 無条件 無条件 50 未満
6 Healthy 10 未満 無条件
7 Crawling 10 未満 無条件
8 Healthy 無条件 無条件
9 Crawling 無条件 無条件
コピー キューと再生キュー
49
ディスク / サーバー障害時の振舞い
1.アクティブ マネージャーによる障害の検出
2.PAM によるアクティブ化する DB の選出
3.障害の発生した DB から未コピー ログを抽出a. 消失ログが設定値 (AutoDatabaseMountDial) 以下
であればマウントされるb. 消失ログが設定値外の場合、自動的にマウントされない
AutoDatabaseMountDial 値
最良の可用性 12
良好な可用性 6
ロスレス 0
50
ディスク障害時フロー
障害の発生したデータベースから消失ログをコピー
アクティブ マネージャーが障害を検知
障害が発生したデータベースの回復
同期または再シードによりデータベース コピーを復旧
アクティブ マネージャーがアクティブ化するデータベースを選択
消失ログの許容量を確認
手動でマウント 消失ログの回復
メールボックス データベースのマウント ( 障害復旧 )
データベースに障害発生
消失ログ
MBX 1 MBX 2
DB 3
DB 2
DB 1
DB 2
DB 1
DB 3
MBX 1 MBX 2
DB 3
DB 2
DB 2DB 3
DB 1
DB 2
同期・再シード
成功
失敗 許容範囲内
許容範囲外
成功
失敗
51
DAG メンバー以外のリカバリ1. コンピューター アカウント の リセット2. OS の復旧3. ドメイン への参加4. Exchange ロール の リカバリ インストール
5. ロール アップ の適用
Setup /m:RecoverServer [/lp:LanguagePackBundle.exe]
52
DAG メンバーのリカバリ1.リカバリする サーバー に関連する DAG 情報の削除
2.前ページと同様の手順で サーバー の リカバリ3.DAG の再設定
a) DAG から DB コピーを全て削除 Remove-MailboxDatabaseCopy DB 名 \ サーバー名b) DAG からサーバーを削除 Remove-DatabaseAvailabilityGroupServer
–Identity DAG 名 –MailboxServer サーバー名 –ConfigurationOnly
a) DAG へサーバーの追加 Add-DatabaseAvailabilityGroupServer
–Identity DAG 名 –MailboxServer サーバー名b) DAG へ DB コピーの追加 Add-MailboxDatabaseCopy
–Identity DB コピー名 –MailboxServer サーバー名
53
メールボックスの復元1.データベース を一時領域に リストア2.eseutil3.回復用 DB の作成
4.DB の マウント5.メールボックス の リストア
New-MailboxDatabase – Name 回復 DB 名 – Server サーバー名 – EDBFilePath DB パス – LogFolderpath Log パス – Recovery
Restore-Mailbox –Identity ユーザー名 –RecoveryDatabase 回復 DB 名
54
DAC モード
Datacenter Activation Coordination Mode もしくはデータセンターのアクティブ化調整モード
3 MBX サーバー以上かつ複数サイトで DAG を構成する場合に設定必須
運用側サイトが復旧した場合の自動復旧を抑止し、スプリットブレインを防ぐ
SetDatabaseAvailabilityGroup –Identity DAG 名 –DatacenterActivationMode DagOnly
55
災害対策システム向け事前準備
内容 コマンド等
1 DAC モードの有効化 Set-DatabaseAvailabilityGroup-DatacenterActivationMode DagOnly
2 RPC 暗号化設定の統一 Set-RpcClientAccess
3 CasArray 設定 Set-ClientAccessArray
4 AutoDiscover 設定 Set-ClientAccessServer
5 オフライン アドレス帳設定 Set-OABVirtualDirectory
6 基本認証設定 Set-WebServerVirtualDirectory
56
サイト障害発生後の処置
プライマリ サイト停止時は、セカンダリ サイトも停止するため、手動で再開する必要があります。
内容 コマンド等
1 障害の発生したサイトの DAG メンバーに停止設定 Stop-DatabaseAvailabilityGroup
2 全 MBX サーバーのクラスター サービス停止 Stop-Service Clussvc
3 スタンバイ サイトでの DAG 再開 Restore-DatabaseAvailabilityGroup
4 DNS に登録されている HUB/CassArray の IP 変更 *** 管理ツール
57
サイト復旧後の処置
サイト間フェールバックの操作
内容 コマンド等
1 プライマリ サイトで DAG 再開 Start-DatabaseAvailabilityGroup
2 ミラーリング監視サーバー の再設定 Set-DatabaseAvailabilityGroup
3 DB コピーの再設定 Update-MailboxDatabaseCopy
4 変更した HUB/CassArray の IP 戻し *** 管理ツール
58
サイト障害フロー
障害の発生したサイトの完全停止
サイト障害を検知
アクティブ化するサイトのインフラストラクチャ正常性確認
MBX のアクティブ化
他の役割のアクティブ化
サービスのプライマリ サイトへの復元
MBX の役割のフェールバック
サイトの復元の再確立
自動で行われる処理
現象
手動で行う処理
サイトの回復
サイトに障害発生
サイト 1
サイト 2
MBXMBX
CAS アレイ
HUB
MBXCAS アレイHUB
MBX
サイト 2MBX
CAS アレイHUB
MBX
サイト 1
MBXMBX
CAS アレイHUB
フェールバック
59
SP1 可用性機能
Exchange Server 2010 の可用性
DAG 設計ポイント
参考 : バックアップ
DAG 設計手順
連続レプリケーションの強化EMC 改良追加されたスクリプト
障害発生時の動作
60
SP1 で追加される可用性関係機能
強化された連続レプリケーションファイル モード ブロック モード
Outlook のサイト超え接続ロジックの改良
新しい DAC モード
新しい、管理、監視スクリプトデータベースの冗長性チェック、サーバーメンテ
EMC インタフェースの改良DAG-IP 、監視サーバーと監視ディレクトリ
フェールオーバー性能の向上
61
連続レプリケーションの強化
複製タイミングを切り替えることでデータ ロストの可能性減少
自動的に複製モードを切り替えるファイル モード ( オリジナル )ブロック モード ( ブロック単位複製 )
切り替えプロセス1.初期状態はファイル モード2.複製先からの要求でブロック モードに切り替え3.一定期間後にファイル モードに戻る
62
ブロック モード
動作イメージファイル モード
Log 2Log 1
Log 1
Log 2
Repl
icatio
n Lo
g Bu
ffer
ESE
Log
Buff
er
Log 3 Log 3 Log 4
63
改良された EMC監視サーバー・監視ディレクトリの設定DAG 用の IP アドレス指定
RTM SP1
EMCDAGFailover
Exchange Server 2010 SP1
DEMO
65
参考 : バックアップ
Exchange Server 2010 の可用性
DAG 設計ポイント
DAG 設計手順
障害発生時の動作
ソフトウェア選択のポイントVolume Shadow Copy Serviceソフトウェア プロバイダーとハードウェア プロバイダー
SP1 可用性機能
66
情報保護機能
DAG 、時間差コピージャーナルパーソナルアーカイブ削除済みアイテム ( の復元 )リテンションポリシー、リーガルホールドバックアップ
オフライン で データ を保存できるのはバックアップ のみ
67
バックアップソフト選択のポイント
1 パッシブ DB からの バックアップ が必要か ?
2
3
リカバリ 単位の粒度を決定するDB 単位・ MBX 単位・アイテム 単位
D2D, D2T, D2D2T の決定
68
Volume Shadow
copyServices
Writer:Exchange
Server
Requester:Backup
Software
Provider:StorageSystem
VSS の仕組み
Volume Shadow Copy Services (VSS) により、
リクエスター、ライター、プロバイダーが連携VSS に準拠することで互換性維持が容易ボリューム スナップショット機能により瞬時にバックアップが完了
69
プロバイダーの違い
Hardware Provider
ストレージベンダーが提供
Software Provider
ソフトウェアベンダーが提供
ストレージ装置の資源のみ使用し SAN も活用
データの増大にアプリ性能は影響なし
ストレージ装置の機能 , 性能 , 信頼性を活用
サーバーとネットワークの資源を使用
データの増大にアプリ性能が影響を受ける
ソフトウェアの組合せによる自由度が高い
大規模 システム では Hardware Provider が効果的
VSS Provider の選択がシステムの可用性、信頼性、性能を左右
70
DataVolume
Tape Backup
Windows Server
ソフトウェアプロバイダー
ハードウェアプロバイダー
BackupVolume
ShadowCopy
Volume
業務サーバー バックアップサーバーVSS RequesterVSS WriterBackup Software
Agent SideSQL ServerExchange Server
VSS RequesterBackup Software
Server Side
Volume Shadow
Copy Service
Snapshot
Windows Server
プロバイダーの違い
71
バックアップ検証結果 1 例ハードウェア プロバイダーとソフトウェア プロバイダー による DB バックアップ 比較ハードウェア プロバイダー は、ホスト OS の負担が少ない
0.0
1.0
2.0
3.0
4.0
5.0
6.0 【% Processor Time】 ソフト VSS
ハード VSSアイドル
72
関連セッション
T1-303: Exchange Server 2010 と次世代 Exchange Online の共存
T1-306: Exchange Server のクラウド対応セキュリティ対策
T5-403: Exchange Server 2007/2010 のトラブルシュート Tips
73
関連 Hands-on Lab
H-301: Exchange Server 2010 SP1 のインストール、階層型アドレス帳 v2.0 の構成とグループ スケジュール
H-302: Exchange Server 2010 SP1 メッセージ保護とコンプライアンス対策
H-303: Exchange Server 2010 高可用性対策 (DAG の構成 )
H-304: Exchange Server 2010 2003/2007 からの移行
74
リファレンスTechNet ライブラリ /Exchange Server 2010http://technet.microsoft.com/ja-jp/library/bb 124,558.aspx
Exchange Server 2010 自習書シリーズhttp://technet.microsoft.com/ja-jp/exchange/2010/dd 775,186.aspx
Exchange Server 2010 ホワイトペーパーhttp://technet.microsoft.com/ja-jp/exchange/ff 798,019.aspx
Exchange Server 2010 導入システム構成例http://www.microsoft.com/exchange/2010/ja/jp/hardware.aspx
ご清聴ありがとうございました。
T5-402アンケートにご協力ください。