ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 -...

13
- 1 - ノードとクラスタの停⽌・起動⼿順 2019 年 6 ⽉版 ノードの停⽌、再起動をする前に Data Resiliency ステータスが OK であるか確認する必要があります。 任意の CVM に nutanix ユーザでログインし、「ncli cluster get-domain-fault-tolerance-status type=node」を実⾏して 全ての項⽬の Current Fault Tolerance が 1 以上であることを確認します。 Prism 上の Data Resiliency Status が OK である事を確認します。 RF2(Replication Factor 2)の場合、⼀台のノードのみを停⽌することができます。同時に複数台のノー ドを停⽌する場合はクラスタ全体の停⽌が必要になることをご注意ください。 ノード停⽌⼿順 1 ESXi (vSphere Web Client) 1-1 vSphere Web Client を利⽤して vCenter/ESXi にログインします。 1-2 DRS が有効になっていない場合、⼿動で CVM 以外のゲスト VM をシャットダウンするか、 他のホストに移⾏します。DRS が有効になっている場合はスキップ可能です。 1-3 ホストを右クリックして、「メンテナンスモードへの切り替え」を選択します。 1-4 「メンテナンスモードの確認」画⾯が表⽰されたら「はい」をクリックします。 1-5 SSH で CVM にログインして、下記コマンドで CVM をシャットダウンします。 nutanix@cvm$ cvm_shutdown ‒P now 1-6 ホストが「メンテナンスモード」になるのを確認します。 1-7 メンテナンスモードに⼊りましたら、ホストを右クリックして、「シャットダウン」を選択します。 1-8 ホスト状態が「応答なし」になるのを確認します。 2 ESXi (vSphere Command Line) 2-1 DRS が有効になっていない場合、⼿動で CVM 以外のゲスト VM をシャットダウンするか、 他のホストに移⾏します。DRS が有効になっている場合はスキップ可能です。 2-2 ホストをメンテナンスモードに移⾏します。 nutanix@cvm$ ~/serviceability/bin/esx-enter-maintenance-mode -s <CVM IP Address> 成功に実⾏できた場合は何も返りません。 2-3 SSH で CVM にログインして、下記コマンドで CVM をシャットダウンします。 nutanix@cvm$ cvm_shutdown ‒P now 2-4 ESXi ホストをシャットダウンします。 nutanix@cvm$ ~/serviceability/bin/esx-shutdown -s <CVM IP Address>

Upload: others

Post on 08-Apr-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 1 -

ノードとクラスタの停⽌・起動⼿順 2019 年 6 ⽉版

ノードの停⽌、再起動をする前に Data Resiliency ステータスが OK であるか確認する必要があります。

・ 任意の CVM に nutanix ユーザでログインし、「ncli cluster get-domain-fault-tolerance-status type=node」を実⾏して

全ての項⽬の Current Fault Tolerance が 1 以上であることを確認します。

・ Prism 上の Data Resiliency Status が OK である事を確認します。

RF2(Replication Factor 2)の場合、⼀台のノードのみを停⽌することができます。同時に複数台のノードを停⽌する場合はクラスタ全体の停⽌が必要になることをご注意ください。 ノード停⽌⼿順 1 ESXi (vSphere Web Client)

1-1 vSphere Web Client を利⽤して vCenter/ESXi にログインします。 1-2 DRS が有効になっていない場合、⼿動で CVM 以外のゲスト VM をシャットダウンするか、 他のホストに移⾏します。DRS が有効になっている場合はスキップ可能です。 1-3 ホストを右クリックして、「メンテナンスモードへの切り替え」を選択します。 1-4 「メンテナンスモードの確認」画⾯が表⽰されたら「はい」をクリックします。 1-5 SSH で CVM にログインして、下記コマンドで CVM をシャットダウンします。 nutanix@cvm$ cvm_shutdown ‒P now 1-6 ホストが「メンテナンスモード」になるのを確認します。 1-7 メンテナンスモードに⼊りましたら、ホストを右クリックして、「シャットダウン」を選択します。 1-8 ホスト状態が「応答なし」になるのを確認します。

2 ESXi (vSphere Command Line)

2-1 DRS が有効になっていない場合、⼿動で CVM 以外のゲスト VM をシャットダウンするか、 他のホストに移⾏します。DRS が有効になっている場合はスキップ可能です。 2-2 ホストをメンテナンスモードに移⾏します。 nutanix@cvm$ ~/serviceability/bin/esx-enter-maintenance-mode -s <CVM IP Address> 成功に実⾏できた場合は何も返りません。 2-3 SSH で CVM にログインして、下記コマンドで CVM をシャットダウンします。 nutanix@cvm$ cvm_shutdown ‒P now 2-4 ESXi ホストをシャットダウンします。 nutanix@cvm$ ~/serviceability/bin/esx-shutdown -s <CVM IP Address>

Page 2: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 2 -

2-5 ESXi ホストがシャットダウンになったことを確認します。 nutanix@cvm$ ping <ESXi host IP>

3 Hyper-V ※メンテナンスモードにしないでください。

3-1 CVM 以外のゲスト VM をシャットダウンするか、他のホストに移⾏します。 3-2 SSH で CVM にログインして、下記コマンドで CVM をシャットダウンします。

nutanix@cvm$ cvm_shutdown -P now 3-3 Hyper-V ホストに Remote Desktop でログインし、PowerShell で下記コマンドを実⾏し

Hyper-V ホストをシャットダウンします。 > shutdown /i

3-4 IPMI でホストに接続して、"Remote Control">"Power Control"に移動し、ノードがシャットダウンされていることを確認します。"Host is currently off"というメッセージが表⽰されていれば、正常にシャットダウンが完了したと判断することができます。

4 AHV

4-1 CVM 以外のゲスト VM をシャットダウンするか、他のホストに移⾏します。 4-2 SSH で CVM にログインして、下記コマンドでホスト⼀覧を出⼒します。

nutanix@cvm$ acli host.list シャットダウン対象ホストの Hypervisor の IP アドレス(Hypervisor Address)を控えます。

4-3 下記コマンドでシャットダウン対象ホストをメンテナンスモードに移⾏します。 nutanix@cvm$ acli host.enter_maintenance_mode <Hypervisor Address> wait=true

4-4 下記コマンドで CVM をシャットダウンします。 nutanix@cvm$ cvm_shutdown -P now

4-5 SSH で AHV ホストにログインして、AHV ホストをシャットダウンします。 root@ahv# shutdown -h now

4-6 IPMI でホストに接続して、"Remote Control">"Power Control"に移動し、ノードがシャットダウンされていることを確認します。"Host is currently off"というメッセージが表⽰されていれば、正常にシャットダウンが完了したと判断することができます。

Page 3: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 3 -

ノード起動⼿順 1 ESXi (vSphere Web Client)

1-1 電源が⼊っていない場合、電源ボタンを押します。 1-2 vCenter/ESXi にログインします。 1-3 ESXi ホストを右クリックして、「メンテナンスモードの終了」を選択します。 1-4 CVM を右クリックして、「電源」→「パワーオン」で起動します(5 分ほど待ちます)。 1-5 ESXi ホストを右クリックして、「データストアの再スキャン」を実施して、「構成」の 「ストレージ」にデータストアが正しく表⽰されているか確認します。 1-6 全ての CVM のサービスが UP になっていることを確認します。 nutanix@cvm$ cluster status 1-7 Data Resiliency Status を確認します。(再起動後にすぐには回復しないので暫くお待ちください) ・任意の CVM に nutanix ユーザでログインし、

「ncli cluster get-domain-fault-tolerance-status type=node」を実⾏して、 全ての項⽬の Current Fault Tolerance が 1 以上であることを確認します。 ・Prism 上の Data Resiliency Status が OK に戻ったことを確認します。

2 ESXi (vSphere Command Line)

2-1 任意の CVM に SSH でログインします。 2-2 下記コマンドで起動対象ホストのメンテナンスモードを解除します。 nutanix@cvm$ ~/serviceability/bin/esx-exit-maintenance-mode -s <CVM IP> 2-3 CVM を起動します(5 分ほど待ちます)。 nutanix@cvm$ ~/serviceability/bin/esx-start-cvm -s <CVM IP> 2-4 クラスタサービスが全て UP になっているか確認します。 nutanix@cvm$ cluster status 2-5 ストレージが正しくマウントされたか確認します。 ・SSH で該当 ESXi ホストにログインします。 ・データストアの再スキャンを⾏います。 root@esx# esxcli storage core adapter rescan --all ・データストアが正しく表⽰されているか確認します。 root@esx# esxcfg-scsidevs -m | awk '{print $5}' 2-6 Data Resiliency Status を確認します。(再起動後にすぐには回復しないので暫くお待ちください) ・任意の CVM に nutanix ユーザでログインし、

「ncli cluster get-domain-fault-tolerance-status type=node」を実⾏して、 全ての項⽬の Current Fault Tolerance が 1 以上であることを確認します。

Page 4: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 4 -

・Prism 上の Data Resiliency Status が OK に戻ったことを確認します。

3 Hyper-V

3-1 電源が⼊っていない場合、電源ボタンを押します。 3-2 Remote Desktop にて Hyper-V ホストに接続し、PowerShell を起動します。 3-3 起動していない CVM のホスト名を控えます。 >Get-VM | Where {$_.Name -match 'NTNX.*CVM'} 出⼒例: ・CVM が起動している場合 NTNX-13SM35230026-C-CVM Running 2 16384 05:10:51 Opera... ・CVM が起動していない場合 NTNX-13SM35230026-C-CVM Stopped - - - Opera... 3-4 CVM を起動します(5 分ほど待ちます)。 >Start-VM -Name NTNX-*CVM 3-5 コンテナ状況を確認します。 >Get-Childitem \\shared_host_name\container_name 3-6 CVM に SSH でログインして、クラスタサービスが全て UP になっていることを確認します。 nutanix@cvm$ cluster status 3-7 Data Resiliency Status を確認します。(再起動後にすぐには回復しないので暫くお待ちください) ・任意の CVM に nutanix ユーザでログインし、

「ncli cluster get-domain-fault-tolerance-status type=node」を実⾏して、 全ての項⽬の Current Fault Tolerance が 1 以上であることを確認します。 ・Prism 上の Data Resiliency Status が OK に戻ったことを確認します。

Page 5: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 5 -

4 AHV

4-1 AHV ホストに SSH でログインします。 4-2 CVM の起動状況を確認します。 root@ahv# virsh list --all | grep CVM 4-3 CVM が running 状態ではない場合、⼿動で起動します(5 分ほど待ちます)。 root@ahv# virsh start <CVM Hostname> 4-4 CVM が起動しましたら、SSH でログインして、AHV ホストがメンテナンスモードか確認 nutanix@cvm$ acli host.get <AHV host IP> | grep node_state 出⼒例: ・メンテナンスモードである場合 node_state: "kEnteredMaintenanceMode" ・メンテナンスモードではない場合 node_state: " kAcropolisNormal" 4-5 メンテナンスモードである場合は下記コマンドで解除します。 nutanix@cvm$ acli host.exit_maintenance_mode <AHV host IP> 4-6 CVM のサービスが全て UP であることを確認します。 nutanix@cvm$ cluster status 4-7 Data Resiliency Status を確認します。(再起動後にすぐには回復しないので暫くお待ちください) ・任意の CVM に nutanix ユーザでログインし、

「ncli cluster get-domain-fault-tolerance-status type=node」を実⾏して、 全ての項⽬の Current Fault Tolerance が 1 以上であることを確認します。 ・Prism 上の Data Resiliency Status が OK に戻ったことを確認します。

Page 6: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 6 -

クラスタ全体の停⽌⼿順(ESXi) ※Hyper-V の場合、下記 KB をご参照ください。 https://portal.nutanix.com/kb/4673 ⒈ 最新の NCC へアップグレードして、ncc health_checks run_all を CVM で実施します。 内容及び対処⽅法が不明な FAIL エラーが⽣じた場合 Nutanix Support にご連絡ください。 ⒉ AFS(Acropolis File Services)または Nutanix Files を利⽤している場合、任意の CVM から FSVM をシャットダウンします。

(AOS 5.0.x から 5.5.x で利⽤している場合) nutanix@cvm$ minerva -a stop

(AOS 5.6 以降で利⽤している場合) nutanix@cvm$ afs infra.stop * ⒊ CVM 以外の全てのゲスト VM をシャットダウンします。 ⒋ Data Protection が有効になっている場合は無効するか、実⾏中のジョブがないことを確認します。 ・Metro Availability Prism→Data Protection→Table から、Active 状態の Protection Domain を Disable に設定します。 ・Async DR 下記コマンドで、実⾏中のレプリケーションがないことを確認します。 nutanix@cvm$ ncli pd ls-repl-status [None] ⒌ 任意の CVM にログインして、クラスタサービスを停⽌します。 nutanix@cvm$ cluster stop 全ての CVM から下記のような結果が出⼒されるまで待ちます。

Page 7: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 7 -

⒍ 各 CVM にログインして、CVM 及び ESXi ホストを順番にシャットダウンします。 nutanix@cvm$ sudo shutdown -P now [vSphere Client から CVM のシャットダウンをおこなう場合] 6-1 vSphere Client にログインします。 6-2 「Hosts and Clusters」から対象の CVM を右クリックし、[Power]-[Shut Down Guest OS]を選

択します。

6-3 「Confirm Guest Shut Down」にてシャットダウンの確認をしてきますので「Yes」をクリックしてシャットダウンします。

6-4 6-2 から 6-3 の操作を他の CVM に対しても同様に実施します。 6-5 ホストを右クリックして、「シャットダウン」を選択します。 6-6 ホスト状態が「応答なし」になるのを確認します。 6-7 6-5 から 6-6 の操作を他の ESXi ホストに対しても同様に実施します。

Page 8: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 8 -

[ESXi ホストからコマンドラインで CVM のシャットダウンをおこなう場合] 6-1 SSH で ESXi ホストにログインします。 6-2 以下のコマンドで CVM の Vmid を確認します。

root@esx# vim-cmd vmsvc/getallvms | grep CVM 6-3 CVM を以下のコマンドでシャットダウンします。

root@esx# vim-cmd vmsvc/power.shutdown <CVM Vmid> 6-4 6-1 から 6-3 の操作を各 ESXi ホスト上にて実施します。 6-5 ESXi ホストをシャットダウンします。

root@esx# poweroff 6-6 6-5 の操作を他の ESXi ホストに対しても同様に実施します。

Page 9: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 9 -

クラスタ全体の停⽌⼿順(AHV) ※Hyper-V の場合、下記 KB をご参照ください。 https://portal.nutanix.com/kb/4673 ⒈ 最新の NCC へアップグレードして、ncc health_checks run_all を CVM で実施します。 内容及び対処⽅法が不明な FAIL エラーが⽣じた場合 Nutanix Support にご連絡ください。 ⒉ AFS(Acropolis File Services)または Nutanix Files を利⽤している場合、任意の CVM から FSVM をシャットダウンします。

(AOS 5.0.x から 5.5.x で利⽤している場合) nutanix@cvm$ minerva -a stop

(AOS 5.6 以降で利⽤している場合) nutanix@cvm$ afs infra.stop * ⒊ CVM 以外の全てのゲスト VM をシャットダウンします。 ⒋ Data Protection が有効になっている場合は無効するか、実⾏中のジョブがないことを確認します。 ・Metro Availability Prism→Data Protection→Table から、Active 状態の Protection Domain を Disable に設定します。 ・Async DR 下記コマンドで、実⾏中のレプリケーションがないことを確認します。 nutanix@cvm$ ncli pd ls-repl-status [None] ⒌ 任意の CVM にログインして、クラスタサービスを停⽌します。 nutanix@cvm$ cluster stop 全ての CVM から下記のような結果が出⼒されるまで待ちます。

Page 10: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 10 -

⒍ 各 CVM にログインして、CVM を順番にシャットダウンします。 nutanix@cvm$ sudo shutdown -P now ※ AHV ホストからコマンドラインで CVM をシャットダウンする場合は以下を実⾏ください 6-1 AHV ホストに SSH でログインします。 6-2 以下のコマンドで CVM の名前を確認します。

root@ahv# virsh list --all | grep CVM 6-3 CVM を以下のコマンドでシャットダウンします。

root@ahv# virsh shutdown <CVM Hostname> 6-4 6-1 から 6-3 の操作を各 AHV ホスト上にて実施します。 ⒎ SSH で各 AHV ホストにログインして、AHV ホストをシャットダウンします。

root@ahv# shutdown -h now ⒏ IPMI で各ホストに接続して、"Remote Control">"Power Control"に移動し、ノードがシャットダウン

されていることを確認します。"Host is currently off"というメッセージが表⽰されていれば、正常にシャットダウンが完了したと判断することができます。

Page 11: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 11 -

クラスタ全体の起動⼿順(ESXi と AHV のみ) ※Hyper-V の場合、下記 KB をご参照ください。 https://portal.nutanix.com/kb/4673

⒈ [ノード起動⼿順]を参照して、各ノード及び CVM を起動します。 ⒉ 任意 CVM にログインして、下記コマンドでクラスタを起動します。 nutanix@cvm$ cluster start 全ての CVM から下記のような結果が出⼒されるまで待ちます。

⒊ クラスタサービスが起動されたか確認します。 nutanix@cvm$ cluster status ⒋ AFS(Acropolis File Services)または Nutanix Files を利⽤している場合、FSVM を下記コマンドで起動します。

(AOS 5.0.x から 5.5.x で利⽤している場合) nutanix@cvm$ minerva -a start

(AOS 5.6 以降で利⽤している場合) nutanix@cvm$ afs infra.start * ⒌ 各ホストのデータストアが正しく表⽰されているか確認して、ゲスト VM を起動します。 vCenter VM を先に起動したい場合、下記⼿順でお願いします。 5-1 vCenter VM が格納されるホストにログインします。 5-2 vCenter VM の VMID を確認します。(下記コマンド結果の⼀列⽬) root@HOST# vim-cmd /vmsvc/getallvms | grep <vCenter VM Name> 5-3 電源が⼊っているか確認します。 root@HOST# vim-cmd vmsvc/power.getstat <vmid>

Page 12: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 12 -

5-4 電源を⼊れて起動します。 root@HOST# vim-cmd vmsvc/power.on <vmid> 5-5 vCenter VM に接続して、他のゲスト VM を起動します。

Page 13: ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 · 2020-04-03 · - 1 - ノードとクラスタの停⽌・起動⼿順 2019年6⽉版 ノードの停⽌、再起動をする前にData

- 13 -

参考情報 Hardware Replacement Documentation - Common Procedures https://portal.nutanix.com/#/page/docs/details?targetId=Hardware-Replacement-Platform-v510:Common%20Procedures

AHV Administration Guide - Node Management https://portal.nutanix.com/#/page/docs/details?targetId=AHV-Admin-Guide-v51:Node-Management

Shutting Down an AHV Cluster for Maintenance or Relocation https://portal.nutanix.com/kb/3397

Shutting down Hyper-V cluster for maintenance or relocation https://portal.nutanix.com/kb/4673

Shutting down VMware vSphere cluster for maintenance or relocation https://portal.nutanix.com/kb/1438

Nutanix Files - Graceful Shutdown of a Nutanix Cluster https://portal.nutanix.com/kb/4429