exchange server 2010 の高可用デザイン及び 障害時回復手順のポイント

Post on 18-Mar-2016

717 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

セッション ID: T5-402. Exchange Server 2010 の高可用デザイン及び 障害時回復手順のポイント. 富士通 株式会社 プラットフォーム技術本部 MS ミドルウェア技術センター 堀内 啓士. セッションの目的 Exchange Server の高可用性機能を理解して頂く 障害発生時の振舞い、復旧手順を理解して頂く セッションのゴール 可用性の高い Exchange Server 2010 のシステムを構築する上で必要となる機能について説明 できるようになる。 - PowerPoint PPT Presentation

TRANSCRIPT

富士通 株式会社プラットフォーム技術本部MS ミドルウェア技術センター堀内 啓士

Exchange Server 2010 の高可用デザイン及び障害時回復手順のポイント

セッション ID: T5-402

3

セッションの目的とゴールSession Objectives and Takeawaysセッションの目的

Exchange Server の高可用性機能を理解して頂く障害発生時の振舞い、復旧手順を理解して頂く

セッションのゴール可用性の高い Exchange Server 2010 のシステムを構築する上で必要となる機能について説明できるようになる。可用性要件を満たす Exchange Server 2010 システムを設計できるようになる。障害が発生した場合のシーケンス、復旧手順を説明できるようになる。

4

自己紹介アライアンス チームでの SI 商談をバックアップ

業種 / 地域

営業

SE部門

営業部門

最適

ソリ

ュー

ショ

マーケティング 本部MS ソリューション推進部

MS ミドルウェア技術センターテクニカル支援 / 情報提供技術者育成支援

お客

プラットフォーム技術本部ISV センター

富士通アライアンス営業本部

戦略協議・立案・遂行

活動推進施策実施

5

アジェンダ

Exchange Server 2010 の可用性

DAG 設定ポイント

DAG 設定手順

障害発生時の動作

SP1 可用性機能

参考 : バックアップ

6

アジェンダ

Exchange Server 2010 の可用性

各ロールの可用性Database Availability Group

DAG 設定ポイント

DAG 設定手順

障害発生時の動作

SP1 可用性機能

参考 : バックアップ

7

各ロールの高可用性機能 /1

メールボックス(MBX)サーバー ロール

ハブトランスポート (HUB)サーバー ロール

クライアント アクセス (CAS)サーバー ロール

Database Availability Group (DAG)MSFC をベースとした非共有の冗長化ログ レプリケーション、最大 16 多重化

複数設置することで自動的に冗長化負荷分散

NLB またはハードウェア ロード バランサー による IP ベースの冗長化方式を利用

8

エッジトランスポート (EDGE)サーバー ロール

ユニファイドメッセージング サーバー ロール

NLBMX レコード

複数の UM サーバーを展開し、VoIP ゲートウェイからラウンド ロビン

各ロールの高可用性機能 /2

9

Exchange Server 2007 の高可用性機能 DB の 2 重化 サーバーの 2 重化

内蔵 HDD 利用前提

安価にシステム 全体を 2 重化

Cluster Continuous Replication

サーバーの 2 重化 災害対策

構成に制限がない 手動切り替え Standby

Continuous Replication

DB 部分のみ 2 重化

Local Continuous Replication

高信頼ストレージ 利用前提

一般的な 2 重化構成

Single Copy Cluster

Site BSite A

10

DAG (Database Availability Group)1. シードと呼ぶ DB フルコピー2. トランザクション ログ ファイルの複製3. コピー先への再生

アクティブ パッシブ1. シード処理

2. 複製

3. 再生

11

シャドウ リダンダンシー

[NG]

[OK]

シャドウキューにコピー

送信確認後、コピーを削除

SMTPHUB

EDGE 2

EDGE 1

メール転送経路の冗長化送信が完了するまでキューを保持送信先の機能対応が必要

12

MBX オンライン 移動

MBX の移動中でもメールの送受信が可能Exchange Server 2010 単独、もしくは Exchange Server 2007SP2 混在環境で利用可能負荷再配分、メンテナンス等で利用可能

クライアント

MBX 2

MBX 1

CAS

13

DAG 設計ポイント

Exchange Server 2010 の可用性

DAG 設定手順

障害発生時の動作

SP1 可用性機能

参考 : バックアップ

仕様の確認Quorum モデルDAG 設計のポイント構成例

14

DAG 構成条件

ハードウェア要件なし

MSFC を利用するため、 OS は Enterprise Edition 以上

Windows Server 2008 (SP2) Enterprise Edition 以上Windows Server 2008 R2 Enterprise Edition 以上

Exchange Server の Edition はどちらでも可

メンバー数が偶数の場合、ミラーリング監視サーバーを設置する

DAG 名=クラスター名=コンピューター名

250 msec 以下のレイテンシ

15

DAG 仕様

特徴最大 16 多重 ( アクティブ DB × 1 + パッシブ DB × 15)データベース単位のフェールオーバー (≠ サーバー単位 )

多重度 / 最大構成16 MBX サーバー /DAG16 MBX サーバー × 100 DB/Member = 1,600 DB/DAG

トランザクション ログ コピー方法高可用データベース コピー (HA database copies)時間差データベース コピー (Lagged database copies)

トランザクション ログ転送オプション経路指定、圧縮、暗号

16

DB 1パッシブ

LOG 1パッシブ

LOG 1アクティブ

DB 1アクティブ

関連オプション

ReplicationEnabled

NetworkCompression NetworkEncryption

ReplicationPort

TruncationLagTime

Set-MailboxDatabaseCopy ~ ReplayLagTime/TruncatelagTimeSet-DatabaseAvailabilityGroup ~ NetworkCompression/NetworkEncryption/ReplicationPort

MBX 1

MBX 2

ReplayLagTime

17

Quorum モデル

DAG

【ノードマジョリティ】 【ノード 及びファイル 共有 マジョリティ】

ファイル共有

ノード マジョリティ

ノード 及びファイル共有 マジョリティ

奇数台の MBX サーバーで DAG を構成(MBX サーバー数– 1) ÷ 2 台までの耐性

偶数台の MBX サーバーで DAG を構成MBX サーバー以外のファイル共有をノードとして扱うMBX サーバー数 ÷ 2 台までの耐性

DAG

18

Quorum モデル

MBX サーバーの残存数が過半数以上の場合継続稼働許容される障害数を超える DB コピー数が必要

メンバー数 Quorum モデル 許容される障害数

2 ノードおよびファイル共有マジョリティ 13 ノード マジョリティ 14 ノードおよびファイル共有マジョリティ 25 ノード マジョリティ 26 ノードおよびファイル共有マジョリティ 37 ノード マジョリティ 3

19

設計のポイント サマリー

1 ユーザー数等の要件から基本構成を決定

2

3

4

高可用性要件から集約度、冗長度を調整する

運用要件を構成に反映させる

冗長度によるサイジングの影響を把握する

20

基本構成の決定

ユーザー数、 MBX クォータ、プロファイルの決定

MBX 数 > アクティブ ユーザー数を意識する

MBX サーバーの CPU とメモリ、 DAS を利用する場合はストレージ搭載量を確認

MBX サーバーのスペックが決まれば、比率でHUB サーバー、 CAS サーバーのスペックが決まる

21

高可用成要件の反映

耐 MBX サーバー故障台数の確認 →許容させる MBX サーバー障害数の 2 倍以上の台数で構成

→ DB のコピー数は許容台数 + 1MBX サーバー故障時のユーザーへの影響度 →集約しすぎると影響大、逆はコスト大

災害対策システムを構成する場合 →想定する災害を明確にする →災害後の要件を明確にする →サイト内の冗長化 + サイト間冗長化が基本

22

DB 1

DB 2

DB 1

DB 2

ミラーリング監視サーバー

サーバー 1 台の故障に耐える構成サーバー 2 台、 DB 2 コピー

アクティブ データベース

パッシブ データベース

MBX 2MBX 1

23

MBX 4

DB 2

DB 3

DB 4

DB 3

DB 4DB 4

DB 3

DB 2DB 2

DB 1 DB 1 DB 1

MBX 3MBX 2MBX 1

サーバー 2 台の故障に耐える構成サーバー 4 台、 DB 3 コピー

ミラーリング監視サーバー

アクティブ データベース

パッシブ データベース

24

MBX 4MBX 3MBX 2MBX 1 MBX 5 MBX 6

DB 2

DB 3

DB 4

DB 6

DB 1DB 1DB 1DB 1

DB 2DB 2

DB 3

DB 4

DB 5

DB 3

DB 4

DB 5 DB 5

DB 6

DB 2

DB 4

DB 3

DB 5

DB 6 DB 6

サーバー 3 台の故障に耐える構成サーバー 6 台、 DB 4 コピー

ミラーリング監視サーバー

アクティブ データベース

パッシブ データベース

25

運用要件の反映

バックアップ製品の選択 →要件が先か、バックアップ製品が先か ?バックアップ製品の特長把握 →パッシブ DB からバックアップが可能な製品、

ストレージの機能を制御できる製品

バックアップ方法の選択 → 2 次媒体への保管が必要か、 D2D で良いか ?リカバリ →リカバリできる粒度と方法を要件と合わせる

DB 単位・ MBX 単位・アイテム単位

26

サイジングの注意点 /1アクティブ / パッシブ による必要 CPU リソースの理解

パッシブ DB は アクティブ DB の 15% の CPU リソースを要求パッシブ DB 1 つにつき、アクティブ DB に 10% の CPU リソースを追加障害発生後の最大リソースを想定する

1 日にメールボックスあたりで送受信されるメッセージ

アクティブ DB もしくは

スタンドアロン (MHz)パッシブ DB

(MHz)

50 1 0.15100 2 0.30150 3 0.45200 4 0.60~ ~ ~

500 10 1.50

27

サイジングの注意点 /2

CPU

縮退運転時 (= 最大リソース ) を考慮する

A PA A PP A

待機 DB処理用(15%)

コピー処理用(10%)

28

最小構成の DAG/1マルチロール × 2負荷分散機構の外出し、 FSW

負荷分散装置

AD サイト

DC/DNS

DAGHUBCASMBX

HUBCASMBX

複製

複製

アクティブ データベース

パッシブ データベース

29

最小構成の DAG/2シングル ロール or コンバインド ロール + MBX仮想化によるロールの分散、外部負荷分散装置不要

DC/DNS

AD サイト

HUB

MBX

CAS

DAG

NLB

HUB

MBX

CAS

30

中規模 DAG多重度増により複数台故障の耐性

DC/DNSHUB CAS アレイ

ミラーリング監視サーバー

MBX

DAG

MBX MBX MBX

アクティブ データベース

パッシブ データベース

AD サイト

31

災害対策システムプライマリ サイト単体、サイト間での冗長化切り替えは手動

WAN

プライマリ データセンター セカンダリ データセンター

DC/DNS DC/DNS

DAG 1

HUB CAS アレイ

MBX MBX

ミラーリング監視サーバー

HUB CAS アレイ

MBX

32

大規模 災害対策システム各サイト単独、及びサイト間での冗長化サイト間切り替えは手動操作

HUB CAS アレイ

MBX

MBX

MBX

MBX

DAG 1 用ミラーリング監視サーバー

Active

Passive

Active

Passive

HUB CAS アレイ

MBX

MBX

MBX

MBX

DAG 2 用ミラーリング監視サーバー

Passive Passive

Active Active

WAN

DAG 1

DAG 2

DC/DNS DC/DNS

プライマリ データセンター セカンダリ データセンター

33

DAG 設計手順

Exchange Server 2010 の可用性DAG 設計ポイント

障害発生時の動作

SP1 可用性機能

参考 : バックアップ

確認項目設定方法と手順

34

DAG の設定手順

以下の項目を事前に決定しておく

項目 説明

DAG 名 DAG の名前 (仮想コンピューター名 )

ミラーリング監視サーバー監視ディレクトリ

MBX 以外の ドメイン サーバー ( 推奨 HUB)共有フォルダー (例えば c:\DAGFileShareWitnesses\ ~ )

DAG 用 IP アドレス 仮想 IP アドレス

冗長化する DB ノード上の DB で冗長化構成とするもの

ネットワーク レプリケーションに利用するネットワークを決める

35

DAG の設定手順

項目 説明

1 DAG の作成 New-DatabaseAvailabilityGroupDAG 名、 FSW の登録

2 DAG 用ネットワークの指定 Set-DatabaseAvailabilityGroup -DatabaseAvailabilityGroupIpAddresses

3 ノードの追加 Add-DatabaseAvailabilityGroupServer

4 データベース コピーの追加 Add-MailboxDatabaseCopy

36

設定画面と確認画面 /DAG 作成

37

設定画面と確認画面 /DAG 用 IP 指定

38

設定画面と確認画面 /ノード追加

39

設定画面と確認画面 /DB コピーの追加

40

設定画面と確認画面 / 参考

41

ネットワーク アダプターの設定 /1MAPI 用ネットワークを最優先にする

42

MAPI 用の構成

ネットワーク アダプターの設定 /2

43

レプリケーション用の構成

ネットワーク アダプターの設定 /3

44

障害発生時の動作

Exchange Server 2010 の可用性

DAG 設計ポイント

SP1 可用性機能

参考 : バックアップ

障害時の動作復旧手順災害対策システム

DAG 設計手順

45

アクティブ マネージャー

DAG メンバー全ての MBX サーバーで実行されるコンポーネントDB コピー間での移動、サーバー障害の検出

プライマリ アクティブ マネージャー (PAM)

スタンバイ アクティブ マネージャー (SAM)

クラスター グループを所有する ノード が役割を持つアクティブ化、パッシブ化の決定トポロジの変更通知の受信SAM の役割

PAM 以外のノードローカル データベース、 IS の障害検出PAM への情報通知

46

コピー キューと再生キュー

47

コピー キュー

再生 キュー

アクティブ DB コピーからパッシブ DB コピーへのコピー待ちのキュー数長さが 10 未満であることが優先アクティブ化条件

パッシブ DB コピーへの再生を待つキュー数長さが 50 未満であることが優先アクティブ化条件

コピー キューと再生キュー

48

DB コピーの状態が以下の 4 つの場合に、 アクティブ化するパッシブ DB コピーを優先順位

から選定同優先順位が複数ある場合、アクティブ化優先順位番号 (Activation Preference) で決定する

DB コピーの状態

Healty

DisconnectedAndHealthy

DisconnectedAndResynchronizing

SeedingSource

優先順位

コンテンツ インデックスの状態

コピー キューの長さ

再生キューの長さ

1 Healthy 10 未満 50 未満

2 Crawling 10 未満 50 未満

3 Healthy 無条件 50 未満

4 Crawling 無条件 50 未満

5 無条件 無条件 50 未満

6 Healthy 10 未満 無条件

7 Crawling 10 未満 無条件

8 Healthy 無条件 無条件

9 Crawling 無条件 無条件

コピー キューと再生キュー

49

ディスク / サーバー障害時の振舞い

1.アクティブ マネージャーによる障害の検出

2.PAM によるアクティブ化する DB の選出

3.障害の発生した DB から未コピー ログを抽出a. 消失ログが設定値 (AutoDatabaseMountDial) 以下

であればマウントされるb. 消失ログが設定値外の場合、自動的にマウントされない

AutoDatabaseMountDial 値

最良の可用性 12

良好な可用性 6

ロスレス 0

50

ディスク障害時フロー

障害の発生したデータベースから消失ログをコピー

アクティブ マネージャーが障害を検知

障害が発生したデータベースの回復

同期または再シードによりデータベース コピーを復旧

アクティブ マネージャーがアクティブ化するデータベースを選択

消失ログの許容量を確認

手動でマウント 消失ログの回復

メールボックス データベースのマウント ( 障害復旧 )

データベースに障害発生

消失ログ

MBX 1 MBX 2

DB 3

DB 2

DB 1

DB 2

DB 1

DB 3

MBX 1 MBX 2

DB 3

DB 2

DB 2DB 3

DB 1

DB 2

同期・再シード

成功

失敗 許容範囲内

許容範囲外

成功

失敗

51

DAG メンバー以外のリカバリ1. コンピューター アカウント の リセット2. OS の復旧3. ドメイン への参加4. Exchange ロール の リカバリ インストール

5. ロール アップ の適用

Setup /m:RecoverServer [/lp:LanguagePackBundle.exe]

52

DAG メンバーのリカバリ1.リカバリする サーバー に関連する DAG 情報の削除

2.前ページと同様の手順で サーバー の リカバリ3.DAG の再設定

a) DAG から DB コピーを全て削除 Remove-MailboxDatabaseCopy DB 名 \ サーバー名b) DAG からサーバーを削除 Remove-DatabaseAvailabilityGroupServer

–Identity DAG 名 –MailboxServer サーバー名 –ConfigurationOnly

a) DAG へサーバーの追加 Add-DatabaseAvailabilityGroupServer

–Identity DAG 名 –MailboxServer サーバー名b) DAG へ DB コピーの追加 Add-MailboxDatabaseCopy

–Identity DB コピー名 –MailboxServer サーバー名

53

メールボックスの復元1.データベース を一時領域に リストア2.eseutil3.回復用 DB の作成

4.DB の マウント5.メールボックス の リストア

New-MailboxDatabase – Name 回復 DB 名 – Server サーバー名 – EDBFilePath DB パス – LogFolderpath Log パス – Recovery

Restore-Mailbox –Identity ユーザー名 –RecoveryDatabase 回復 DB 名

54

DAC モード

Datacenter Activation Coordination Mode もしくはデータセンターのアクティブ化調整モード

3 MBX サーバー以上かつ複数サイトで DAG を構成する場合に設定必須

運用側サイトが復旧した場合の自動復旧を抑止し、スプリットブレインを防ぐ

SetDatabaseAvailabilityGroup –Identity DAG 名 –DatacenterActivationMode DagOnly

55

災害対策システム向け事前準備

内容 コマンド等

1 DAC モードの有効化 Set-DatabaseAvailabilityGroup-DatacenterActivationMode DagOnly

2 RPC 暗号化設定の統一 Set-RpcClientAccess

3 CasArray 設定 Set-ClientAccessArray

4 AutoDiscover 設定 Set-ClientAccessServer

5 オフライン アドレス帳設定 Set-OABVirtualDirectory

6 基本認証設定 Set-WebServerVirtualDirectory

56

サイト障害発生後の処置

プライマリ サイト停止時は、セカンダリ サイトも停止するため、手動で再開する必要があります。

内容 コマンド等

1 障害の発生したサイトの DAG メンバーに停止設定 Stop-DatabaseAvailabilityGroup

2 全 MBX サーバーのクラスター サービス停止 Stop-Service Clussvc

3 スタンバイ サイトでの DAG 再開 Restore-DatabaseAvailabilityGroup

4 DNS に登録されている HUB/CassArray の IP 変更 *** 管理ツール

57

サイト復旧後の処置

サイト間フェールバックの操作

内容 コマンド等

1 プライマリ サイトで DAG 再開 Start-DatabaseAvailabilityGroup

2 ミラーリング監視サーバー の再設定 Set-DatabaseAvailabilityGroup

3 DB コピーの再設定 Update-MailboxDatabaseCopy

4 変更した HUB/CassArray の IP 戻し *** 管理ツール

58

サイト障害フロー

障害の発生したサイトの完全停止

サイト障害を検知

アクティブ化するサイトのインフラストラクチャ正常性確認

MBX のアクティブ化

他の役割のアクティブ化

サービスのプライマリ サイトへの復元

MBX の役割のフェールバック

サイトの復元の再確立

自動で行われる処理

現象

手動で行う処理

サイトの回復

サイトに障害発生

サイト 1

サイト 2

MBXMBX

CAS アレイ

HUB

MBXCAS アレイHUB

MBX

サイト 2MBX

CAS アレイHUB

MBX

サイト 1

MBXMBX

CAS アレイHUB

フェールバック

59

SP1 可用性機能

Exchange Server 2010 の可用性

DAG 設計ポイント

参考 : バックアップ

DAG 設計手順

連続レプリケーションの強化EMC 改良追加されたスクリプト

障害発生時の動作

60

SP1 で追加される可用性関係機能

強化された連続レプリケーションファイル モード ブロック モード

Outlook のサイト超え接続ロジックの改良

新しい DAC モード

新しい、管理、監視スクリプトデータベースの冗長性チェック、サーバーメンテ

EMC インタフェースの改良DAG-IP 、監視サーバーと監視ディレクトリ

フェールオーバー性能の向上

61

連続レプリケーションの強化

複製タイミングを切り替えることでデータ ロストの可能性減少

自動的に複製モードを切り替えるファイル モード ( オリジナル )ブロック モード ( ブロック単位複製 )

切り替えプロセス1.初期状態はファイル モード2.複製先からの要求でブロック モードに切り替え3.一定期間後にファイル モードに戻る

62

ブロック モード

動作イメージファイル モード

Log 2Log 1

Log 1

Log 2

Repl

icatio

n Lo

g Bu

ffer

ESE

Log

Buff

er

Log 3 Log 3 Log 4

63

改良された EMC監視サーバー・監視ディレクトリの設定DAG 用の IP アドレス指定

RTM SP1

EMCDAGFailover

Exchange Server 2010 SP1

DEMO

65

参考 : バックアップ

Exchange Server 2010 の可用性

DAG 設計ポイント

DAG 設計手順

障害発生時の動作

ソフトウェア選択のポイントVolume Shadow Copy Serviceソフトウェア プロバイダーとハードウェア プロバイダー

SP1 可用性機能

66

情報保護機能

DAG 、時間差コピージャーナルパーソナルアーカイブ削除済みアイテム ( の復元 )リテンションポリシー、リーガルホールドバックアップ

オフライン で データ を保存できるのはバックアップ のみ

67

バックアップソフト選択のポイント

1 パッシブ DB からの バックアップ が必要か ?

2

3

リカバリ 単位の粒度を決定するDB 単位・ MBX 単位・アイテム 単位

D2D, D2T, D2D2T の決定

68

Volume Shadow

copyServices

Writer:Exchange

Server

Requester:Backup

Software

Provider:StorageSystem

VSS の仕組み

Volume Shadow Copy Services (VSS) により、

リクエスター、ライター、プロバイダーが連携VSS に準拠することで互換性維持が容易ボリューム スナップショット機能により瞬時にバックアップが完了

69

プロバイダーの違い

Hardware Provider

ストレージベンダーが提供

Software Provider

ソフトウェアベンダーが提供

ストレージ装置の資源のみ使用し SAN も活用

データの増大にアプリ性能は影響なし

ストレージ装置の機能 , 性能 , 信頼性を活用

サーバーとネットワークの資源を使用

データの増大にアプリ性能が影響を受ける

ソフトウェアの組合せによる自由度が高い

大規模 システム では Hardware Provider が効果的

VSS Provider の選択がシステムの可用性、信頼性、性能を左右

70

DataVolume

Tape Backup

Windows Server

ソフトウェアプロバイダー

ハードウェアプロバイダー

BackupVolume

ShadowCopy

Volume

業務サーバー バックアップサーバーVSS RequesterVSS WriterBackup Software

Agent SideSQL ServerExchange Server

VSS RequesterBackup Software

Server Side

Volume Shadow

Copy Service

Snapshot

Windows Server

プロバイダーの違い

71

バックアップ検証結果 1 例ハードウェア プロバイダーとソフトウェア プロバイダー による DB バックアップ 比較ハードウェア プロバイダー は、ホスト OS の負担が少ない

0.0

1.0

2.0

3.0

4.0

5.0

6.0 【% Processor Time】 ソフト VSS

ハード VSSアイドル

72

関連セッション

T1-303: Exchange Server 2010 と次世代 Exchange Online の共存

T1-306: Exchange Server のクラウド対応セキュリティ対策

T5-403: Exchange Server 2007/2010 のトラブルシュート Tips

73

関連 Hands-on Lab

H-301: Exchange Server 2010 SP1 のインストール、階層型アドレス帳 v2.0 の構成とグループ スケジュール

H-302: Exchange Server 2010 SP1 メッセージ保護とコンプライアンス対策

H-303: Exchange Server 2010 高可用性対策 (DAG の構成 )

H-304: Exchange Server 2010 2003/2007 からの移行

74

リファレンスTechNet ライブラリ /Exchange Server 2010http://technet.microsoft.com/ja-jp/library/bb 124,558.aspx

Exchange Server 2010 自習書シリーズhttp://technet.microsoft.com/ja-jp/exchange/2010/dd 775,186.aspx

Exchange Server 2010 ホワイトペーパーhttp://technet.microsoft.com/ja-jp/exchange/ff 798,019.aspx

Exchange Server 2010 導入システム構成例http://www.microsoft.com/exchange/2010/ja/jp/hardware.aspx

ご清聴ありがとうございました。

T5-402アンケートにご協力ください。

top related