性能管理の落とし穴と運用管理の目指すべき先とは?
TRANSCRIPT
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは? 2014 年 8 ⽉ 22 ⽇
ネットスカウトシステムズジャパン株式会社
シニアセールスエンジニア
宮澤 巧
運⽤管理のフレームワーク策定の歴史 性能管理の必要性が叫ばれてどれくらいの年⽉が経つでしょうか? 性能管理の必要性が最初に叫ばれた
のは今から 30 年ほど前の 1980 年代で、時はメインフレーム全盛の時代でした。 複雑化し始めたメイ
ンフレームや LAN、WAN の運⽤管理をわかりやすくとりまとめる為、ISO(国際標準化機構)により
FCAPS というネットワークの性能管理に特化したフレームワークが定義されました。 時を同じくして今
では業界標準となりつつ ITIL がイギリスの政府機関である CCTA によって取りまとめられました。 我々
ネットスカウトシステムズ(NetScout Systems, Inc.)がマサチューセッツ州ウエストフォードでうぶ声
をあげたのもちょうどこの頃です。
1990 年代に⼊るとシステムはクライアントサーバーモデルへと移⾏し、モザイクの公開からインターネ
ットの爆発的な普及へと繋がっていきます。 この頃になると多様化・複雑化したサービスに対してさま
ざまな運⽤管理システムが乱⽴するようになり、欧⽶の企業を中⼼に ITIL の本格的な運⽤が始まります。
⼜、ITU-T(国際電気通信連合)が TMN アーキテクチャを取りまとめたのもこの頃です。
2000 年代に⼊ると NGN を推進する中で SLA が重要視され、運⽤管理の⾼度化が求められるようになり
ます。 2007 年にリリースされた ITIL v3 では運⽤管理のビジネス指向が明確に定義されました。
混在する多数のフレームワークを有効活⽤するには? こうして振り返ってみるとその時代時代に呼応するかのように運⽤管理のフレームワークが策定されたよ
うな印象を受けます。 以下の図 1 にて上記で名前を挙げた各フレームワークの概要を⽰します。 各フ
レームワークの詳細については⽂献なども多数存在する為、ここでは割愛しますが、注意して頂きたいの
はこれらのフレームワークは実は重なる部分が⾮常に多いという点です。
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
図 1
我々ネットスカウトシステムズは 1984 年の創業以来⼀貫して性能管理製品の開発と通信事業者並びに企
業向けの性能管理のコンサルティングに従事してきました。 ⻑年の経験から我々ネットスカウトシステ
ムズが導き出した結論は⾃社の状況に合わせてこれらのフレームワークを段階的に推し進める事が最⼤限
の効果を発揮するという事です(図 2)。
図 2
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
FCAPS というのは⾔い換えればフレームワークに応じた適切なツールの選定で、性能管理のグラウンドデ
ザインを描く上で⾮常に重要です。 以下の図 3 に FCAPS の 5 つの性能管理項⽬を記します。
図 3
性能管理は FCAPS の P(Performance Management)にあたります。 性能管理は⼤きく分けて以下の
4 つに分類出来ます。
システムリソース
ネットワークリソース
エンドツーエンドリソース
ヒューマンリソース
CPU 使⽤率やメモリ使⽤率といったシステムリソースの性能管理としては SNMB MIB やエージェントを
⽤いた NMS(統合管理製品)があまりにも有名ですが、ここに⼤きな落とし⽳があります。 例えば
SNMB MIB やエージェントはその技術的な特性から分解能が粗く、ネットワークリソースやエンドツーエ
ンドリソースの性能管理には適切ではありません。 NetFlow などのサンプリングを利⽤した xFlow も同
様で、⾼精度のデータを取得するにはポーリング間隔を秒間隔にせざるを得ず、対象となるネットワーク
機器上で多くの NetFlow インターフェイスを稼働させる場合、CPU への過負荷が問題となりえます。
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
図 4
図 4 のマトリックスが⽰す通り、性能管理の実現には NMS(統合管理製品)だけでなくパケットキャプチ
ャ(据え置き)製品の導⼊が必須です。
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
ツールを駆使し運⽤管理コストの削減へ
適切なツールの選定が終わったらいよいよツールを使った実際の運⽤です。 企業が抱える運⽤管理の課
題は業種や環境によりさまざまですが、経営層が共通して最も気にしてる点は運⽤管理コストではないで
しょうか? 有⽤なツールをひと通り揃えてもそれらを使いこなさなくては宝の持ち腐れとなってしまい
ますし、ツールを導⼊した結果、運⽤負荷が増えたり、障害復旧に余計に時間を要するようでは本末転倒
になってしまいます。
図 5
パケットキャプチャ(据え置き)製品導⼊の最⼤のメリットは、障害箇所の特定の為にこれまではその都
度オンサイトエンジニアをアサインし、データセンターへの⼊管⼿続きを⾏い、エンジニアがデータセン
ターへ⼊館後データキャプチャを⾏い、パケットデータの取得後、複数⼈で数⽇かけて解析を⾏うという
⼀連の時間的制約と⼈的コストが不要になるだけでなく、ダッシュボードで障害箇所を⾒える化し、サー
ビストリアージで解析時間を短縮、プロトコルラダーで障害箇所を特定する事で MTTK(平均解析時間)
を⼤幅に短縮し、その結果 MTTR(平均復旧時間)を最⼩化し、⼈的コストを削減出来る事にあります
(図 5)。
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
図 6
図 6 は任意のサブネットが割り当てられた Data Center Seattle というロケーションにおける各種サービ
スの性能をダッシュボード機能で⽰した例。
図 7
図 7 は性能の劣化が⾒られた Authentication Services を提供するサーバーと接続クライアントの⼀覧を
表⽰するサービスディペンデンシ-。 サーバー毎の平均遅延、スローレスポンスの割合、タイムアウト
を⼀覧表⽰。
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
図 8
図 8 は性能の劣化が⾒られた Authentication Services におけるサーバー毎の遅延分布(左上)、平均遅
延(右上)、TCP フラグ(左下)、アプリケーションエラーコード(左下)を⽰すサービスモニター機能。
図 9
図 9 は性能の劣化が⾒られた Authentication Services におけるセッション毎のプロトコルラダーを表⽰
するセッション解析機能。
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
図 10
図 10 は性能の劣化が⾒られた Authentication Services における任意のセッションのパケットの詳細を
表⽰するパケット解析機能。
ダッシュボード機能
サービスモニター機能
セッション解析機能
パケット解析機能
図 11
サー
ビス
トリ
アー
ジ
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
運⽤管理の⽬指すべき先
パケットキャプチャ(据え置き)製品の導⼊によりネットワークの常時監視が可能となったら、次は障害
の予兆監視です。
図 12
図 12 が⽰すように、障害発⽣後の対応が遅れれば遅れるほどビジネスへの影響は拡⼤し、復旧に要する
時間も⼈的コストも増⼤します。 重要なのは障害の兆候を如何に早く検知するかで、早いほどビジネス
への影響は最⼩限に抑えられ、復旧に要する時間も⼈的コストも抑える事が出来ます。
図 13
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
この予兆監視を実現するのがシステムの⾃動学習機能を⽤いたベースライン機能(図 13)です。 通常、
性能の閾値となる KPI(重要業績評価指標)は正常時の性能を把握した上で⼿動で設定しますが、対象と
なるネットワークセグメントやサーバーの数が多いと、性能を把握するだけでも膨⼤な時間がかかってし
まいます。 パケットキャプチャ(据え置き)製品の持つ⾃動学習機能を⽤いる事でネットワークセグメ
ントや各種サーバー、アプリケーションの挙動をベースライン化し、システムによる⾃発的な閾値の管理
が可能となります。 ネットワークセグメントや各種サーバー、アプリケーションの挙動に変化が⾒られ
た場合、ベースラインは随時更新される為、常に最新のベースラインを持つことが可能です。
おわりに 「性能管理を強化したいのだけどどこから⼿を付けて良いかわからない」「性能管理のグラウンドデザイ
ンを描きたい」「運⽤管理をスリム化したい」等、弊社にはさまざまな声が寄せられます。 ネットスカ
ウトシステムズは 30 年に渡る性能管理製品の開発と通信事業者並びに企業向けの性能管理のコンサルテ
ィングで培った経験を元に最適なソリューションをご提供致します。
ネットスカウト・システムズ・ジャパン株式会社
〒105-6027 東京都港区⻁ノ⾨4-3-1 城⼭トラストタワー27F
TEL: 03-5403-4826
FAX: 03-5403-4646
http://www.netscout.com/
mailto:[email protected]
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
ネットスカウトシステムズ 会社概要
性能管理の落とし⽳と運⽤管理の⽬指すべき先とは?
ネットスカウト・システムズ・ジャパン株式会社
©2015 NetScout Systems, Inc. All rights reserved.
製品概要
InfiniStream
アプライアンス
据え置き型パケットキャプチャ専⽤アプライアンス
Linux ベースの強固なセキュリティ
専⽤ NIC 搭載による⾼精度なタイムスタンプを提供
モニターポートとディスク容量に応じて 5 種類から選択可
専⽤アプライアンス⼜はソフトウエアから選択可
nGeniusONE
管理サーバー
性能管理の中核をなす管理モジュール
統計並びにメタデータは通常運⽤で 1 年以上保存可(※3TB の場合)
将来的な拡張が可能な 3 種類のライセンス形態
nPFS
レイヤー1 スイッチ
TAP とスイッチのミラーポートを集約する専⽤スイッチ
トラフィックの集約・分散・複製が⾃由⾃在
⾼度なパケットスライシング機能でパケットデータを圧縮可
成⻑に合わせた投資が可能な 4 種類のラインナップ
導⼊イメージ