[a32] nonstop sql インターナル:...

35
A32: 垂直統合 垂直統合のメリットとは? - OS と統合された DBMS の実力 - OS と統合された DBMS の実力 20146202014620日本ヒューレット・パッカード株式会社 プリセールス統括本部 サーバー技術本部 © Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 敏光

Upload: insight-technology-inc

Post on 01-Dec-2014

396 views

Category:

Technology


4 download

DESCRIPTION

 

TRANSCRIPT

A32:垂直統合垂直統合のメリットとは?- OSと統合されたDBMSの実力- OSと統合されたDBMSの実力

2014年6月20日2014年6月20日

日本ヒューレット・パッカード株式会社

プリセールス統括本部 サーバー技術本部

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

原 敏光

HP NonStop SQLって何?

なにそれ?!どっかで聞いたことあるかも・・・

PostgreSQLのクラ タセ ト

ぶっちゃけ全く知らない す o

サ バ 上 稼動する

クラスタセット? 知らないっす orz

HP Integrity NonStopサーバー上で稼動する

高可用でスケーラブルな商用RDBMSです!

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 2

高可用 ケ ラ な商用 す

HP Integrity NonStopサーバーとは

40年間の実績を誇るの実績を誇るHPHPブランドの無停止型コンピューターシステムですブランドの無停止型コンピューターシステムです

2014 HP Integrity NonStop NS2400/NS2300 発表 !!2014 HP Integrity NonStop NS2400/NS2300 発表 !!2013 HP Integrity NonStop BladeSystem 56000c 発表 !!2011 HP Integrity NonStop BladeSystem 54000c 発表2008 ブレードアーキティクチャを採用HP Integrity NonStop BladeSystem NB50000c 発表2005 インテル® Itanium® プロセッサー搭載 HP Integrity NonStop NS16000 サーバー 発表

2002 HPとCompaqが合併し新生HP誕生1998 CompaqとTANDEM COMPUTERSが合併1993 NonStop Himalaya Kシリーズ 発表1979 日本タンデムコンピューターズ 設立1975 NonStop System 誕生1975 NonStop System 誕生

1974 TANDEM COMPUTERS 設立

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 3

ワ ルドワイドでのお客様ご利用状況

NonStopサーバーによるミッションクリティカルシステムワールドワイドでのお客様ご利用状況

金融サービス 通信・メディア流通・製造サービス

ヘルスケア政府・公共機関サ ビス 政府 公共機関

– ペイメントシステム: クレジット、デビット、POS、資金決済

– 為替取引、証券取引

– HLR (Home Location Register)

– インテリジェント・ネットワーク、第3世代サービス

– メッセージング

– 生産管理、製造制御

– 受発注、チケット予約

– EDI、データ集配信

– 電子患者記録

– 国防関連

– 警察、消防の緊急指示システム– メッセ ジング システム

– 全世界の ATM トランザクションの 70% を処理

全世界のクレジットカード

– 世界 大の ISP におけるメッセージングシステム

– HLR ソリューションで管理

– 世界 大規模の自動車メーカにおける生産管理システム

– 多くの世界 大級の大学付属病院を含む、200以上の病院

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 4

– 全世界のクレジットカ ドトランザクションの 2/3 を処理

– HLR ソリュ ションで管理されている端末は3億以上 – 世界規模の旅行予約シ

ステム– 国家安全保障

(参考) HP NonStopサーバーラインナップ!! NEW !!

NB56000c4core •2~4CPU /1ノード

NS2400/ NS2300

!! NEW !!

NB56000c2core

•2~16CPU /1ノード

• 大255ノード=4080CPU

•Blade Enclosure

/

• 大255ノード=1020CPU

•Rack Mount CPU

•2~16CPU /1ノード

• 大255ノード=4080CPU

•Blade Enclosure

• 新Itaniumプロセッサを搭載したハイスペックサーバー。 高のパフォーマンスを提供

ブレ ドア キテクチャの採用に

•NonStop サーバーの特長はすべて継承しつつ、 高のプライスパフォーマンスを実現した、ローエンドクラスの NonStop サーバー

• 新Itaniumプロセッサを搭載したハイスペックサーバー。高いコストパフォーマンスと拡張性を提供

ブレ ドア キテクチ の採用に•ブレードアーキテクチャの採用により、柔軟な構成と、リニアなスケーラビリティーを実現

•ブレードクラスター(FCメッシュ接続)により超大規模システムを容易に構築

エンドクラスの NonStop サ バ

•拡張性を制限し、標準コンポーネントの採用を進めたことにより

高のプライスパフォーマンスを実現。UNIX サーバと同等価格

•ブレードアーキテクチャの採用により、柔軟な構成と、リニアなスケーラビリティーを実現

•4Coreにオンラインアップグレードが 可能

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 5

より超大規模システムを容易に構築 が 可能

NonStop SQLとは

「HP NonStopサーバー上でNonStop OSと一体化して稼動するNonStop OSと 体化して稼動するANSI準拠のRDBMSです」

「リアルタイム性にすぐれデータの一貫性を保障するデ タの 貫性を保障するミッションクリティカル用途に 適なDBMSです」© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

DBMSです」

他DBMSでは実現できないことがHP NonStop SQLでは実現可能です

HP NonStop SQLの4大特徴他DBMSでは実現できないことがHP NonStop SQLでは実現可能です

24時間×365日 絶対的な高可用 スケールアウトが容易なDB• NonStopサーバーHWとNonStop OSが実現する高い可用性をそのまま受け継いだNonStop SQL

•1台のサーバのみで、他では実現できない可用性を提供

• NonStopサーバーの特徴であるシェアード・ナッシング・コンセプトを活かした超並列データベース

• HWリソースを足せば足しただけ直線的に性能の増加が期待できる

運用負荷が軽減→TCO削減立す バを 台 が 能

安心のサポート体制ま• 乱立するDB/周辺サーバを1台にコンソリが可能

• バージョンUP時は上位コンパチをhpが保証

• HW増設・交換、DBバックアップや再編成などほぼすべての作業がオンライン中に可能

• HWからOS、DBMS、JVMやFrameworkまで、すべてHPによる1社サポートを実現

• 問題発生時の切り分けや原因追求がスムースに

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 7

直線的拡張性 「スケールアウト可能なDB」HWリソースの追加で容易にパフォーマンス増強HWリソ スの追加で容易にパフォ マンス増強

他DBMS では NonStop SQLでは

• クラスター構成の場合 サーバーを増設するとクラスタウェア • 共有要素のないシェアードナッシングがコンセプトなので• クラスタ 構成の場合、サ バ を増設するとクラスタウェア

や、共有DISKなどでボトルネックがおきすい

• HWリソースを追加しても性能は頭打ちになりがち

• DBサーバーをスケールアウトさせるのは難しい

• 共有要素のないシェア ドナッシングがコンセプトなので、HWリソースを追加すれば線形に性能がえられる

• 処理増にはスケールアウトで対応できるので、キャパシティープランや投資計画が容易。スモールスタートでトランザクションの伸びに応じて柔軟に増設可能

ServerServer Server Server

• 性能を出すためにはスケールアップか、別のクラスタセットを立てて対応せざるをえない

eクションの伸びに応じて柔軟に増設可能

• HW増設もサービスを止めることなくオンラインで可能

Server Server Server e

Add-onServer

Add-on

DB DB DB

HW Add on

Perf

orm

anc

スケールしないCluster OS

DB

HW Add on

Perf

orm

anc

ServerNet

OSDB

OSDB

スケールアウト

OSDB

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 8

HW Add-on HW Add-on

複数サーバー構成 1台のサーバー

他者DBクラスタ 構成と 同等性能 同等処理条件で拡張性のベンチマ クを行 た

(参考)他DBとのスケーラビリティー比較他者DBクラスター構成と、同等性能、同等処理条件で拡張性のベンチマークを行った結果、NonStop SQLはメンバー(Blade CPU)追加に応じてリニアに性能が伸びました

Oracle RAC Scalability< HIGH Load >

10,000

12,000

14,000

Throughput (TPS)

Oracle RAC vs SQL/MX Scalability< HIGH Load >

10,000

12,000

14,000

Throughput (TPS)他DB クラスター NonStop SQL

4,000

6,000

8,000

直線的に伸びない

サチュレーション4,000

6,000

8,000

他DB

0

2,000

1 2 3 4

# of Nodes ( Each 2 CPU)

1node 2node 3node 4node

0

2,000

1 2 3 4

# of Nodes ( Each 2 CPU)

2CPU 4CPU 6CPU 8CPU

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 9

1node(4core)

2node(8core)

3node(12core)

4node(16core)

2CPU(4core)

4CPU(8core)

6CPU(12core)

8CPU(16core)

他DBMSとのダウンタイムの比較

データベース可用性に関する実績

<あるDBMSの User Groupの調査結果>

他DBMSとのダウンタイムの比較

• 1年間のうちに、ユーザーの 50% は4時間以上のシステム停止を経験

うち 12% は24時間以上の業務影響

<N St サ バ 継続性>

• そのうち、12% は24時間以上の業務影響

<NonStop サーバー継続性>• NonStop SQL のシステム可用性は、年間99.999%以上• 27年間サービス無停止の顧客事例も

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 10

高可用性 「サービスは継続できる」システム構成の違いでアベイラビリティーに差が

• NonStopサーバーのSW無停止性がDBMS内に実装• HA構成やクラスタリングによる可用性

ノ ド障害時にはフェルオ バ やクラスタ 再構成

他DBMS では NonStop SQLでは

システム構成の違いでアベイラビリティ に差が

• 障害の起きたプロセッサーのDBエンジン(DAM)は数秒のうちに他プロセッサーにて処理を継続(Takeover)

• プロセッサー障害時でも業務処理は続行

• ノード障害時にはフェルオーバーやクラスター再構成や、データベース・リカバリーが行われる

• 障害復旧中は数分レベルで全業務停止を伴う

プロセ サ プロセ サ プロセ サ プロセ サプロセッサー

OLTP

CRM

Batch

プロセッサー

OLTP

CRM

Batch

プロセッサー

OLTP

CRM

Batch

プロセッサー

OLTP

CRM

Batch

ストレージ製品

FC SwitchBatch

DAM

Batch

DAM

Batch

DAM

Batch

DAM

ServerNetDAM

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 11

全業務停止シングルデータベース

NonStop OSに組み込まれたソフトウ ア冗長化機能

HP NonStopサーバー無停止実現のアーキテクチャーNonStop OSに組み込まれたソフトウェア冗長化機能

プロセスペア技術による基本ソフトウェアの無停止化

CPU 0 CPU 1 CPU 2 CPU 3

PrimaryBackup PrimaryBackup

• フェイルオーバー(再起動)ではなく、テイクオーバー(処理継続)がコンセプト

• NonStop OS や、基幹ミドルウェアは、すべてプロセスペアにて実装

Primary Backup

Primary Backup Primary Backup

セスペアにて実装

• 2CPUに、2プロセスがペアとして存在する

• 実稼動するのは、Primaryプロセスのみ

• Backupプロセスは継続に必要となる情報をPrimaryプロセスから定期的に受信

CPU 0 CPU 1 CPU 2 CPU 3

CPU障害

OSレベルでの実装により即時・確実に障害を検出

Primaryプロセスから定期的に受信

• 論理的には、1プロセスとして扱える

• Primaryプロセスの異常終了や、CPUダウンが起きると、自動的にBackupがPrimaryに昇格して、ダウン直前の状態から処理を継続実行する

Primary

Primary

Primary

PrimaryBackup

Primary Backup

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 12

ウン直前の状態から処理を継続実行する

• データの整合性もトランザクション保護製品により、自動的に一貫性を保持

Primary

NonStop SQLの容易な管理サーバ管理の負荷を究極的にコンソリデーション

他DBMSでは HP NonStop SQLでは

DB Server#1 DB Server#2 DB Server#3

サ バ管理の負荷を究極的にコンソリデ ション

ALL IN ONE!

DB Server

DB Server#1 DB Server#2 DB Server#3

FC Switch × 2共有Storage#1 共有Storage#2Storage 管理

Server同期

Storage

Batch Server

Backup Server

同期

DB Server#4 DB Server#5 Backup Server

•1台のサーバーで比類なき可用性を実現•1台のデータベースサーバーで複数業務の混在が可能•ログ監視も1台、SW管理も1台が対象

•DBサーバーは ×業務数 ×HA構成と多数に•仮想化でコンソリしてもログやSW管理対象は多数

Batch Server#1 Batch Server#2 Batch 制御 Server

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 13

•クラスタウェア等の煩雑な設定は不要•仮想化でコンソリしてもログやSW管理対象は多数•現用/待機管理や、クラスタの設定などタスクは複雑

HP NonStop SQLOS統合により実現している付加価値OS統合により実現している付加価値

「優先度制御機能」

「データの保護 – Lost Write防止」

「トランザクション制御負荷の 適化」

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

HP NonStop SQLOS統合により実現している付加価値OS統合により実現している付加価値

「優先度制御機能」

「データの保護 – Lost Write防止」

「トランザクション制御負荷の 適化」

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

統合DBを容易に構築 ~優先度制御機能多種多様なデータベース処理 管理作業の混在を容易にします

他DBMSでは NonStop SQLでは

Server プロセッサ プロセッサ プロセッサ プロセッサ

多種多様なデ タベ ス処理、管理作業の混在を容易にします

OS

• 複数業務からの要求を1つのDBサーバーで混在させると、互いに

悪影響をおよぼす

• OLTPはBatchなどが同時に動くとレ

データベース

OLTP 分析 Batch

OSデータベース

Batch分析

OLTP 19012050

要求に与えた優先度が、DISKアクセスにま

で引き継がれる

競合は などが同時に動くとレ

スポンスを担保できない

• 優先度をつけたとしてもDISKアクセスまでは制御できない

Server ServerServer

シングル・データベース

高優先度のデ タアクセスは 他のアクセスによるシステ

OSDB

OLTP

OSDB

OSDB

分析 Batch• 業務が複数ある場合には、業務ご

とにサーバーとデータベースを

別々に構築

• データベース間をどう連携するか考慮が必

• 高優先度のデータアクセスは、他のアクセスによるシステ

ム高負荷時にもレスポンスを維持

• 1台のサーバー、シングルDBで複数業務の混在が可能

• 同じ鮮度のデータが誰からも共有できる「統合DB」の構築が

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 16

の考慮が必要

• 統合DBの構築は難しい

が容易に可能

“古くて新しい” 技術的な課題があります

複合処理の効率的稼働のための要件古くて新しい 技術的な課題があります

1. 高優先度のDBアクセスは、低優先度のDBアクセスより常に優先的に処理される必要があります必要があります

− CPU時間に加えI/Oバンド幅を高優先度の処理に優先的に割り当てることが必要です

2. 低優先度の処理も、高優先度の処理がない状況では100%のシステム性能を活用できるべきです

− 使用可能なリソース制限枠を設ける方式では不十分です

高率的な複合処理システムを実現するには、プロセスのディスパッチ、システムリソースの制御を司るOSとの緊密な統合が必要です高率的な複合処理システムを実現するには、プロセスのディスパッチ、システムリソースの制御を司るOSとの緊密な統合が必要です

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 17

システムリソ スの制御を司るOSとの緊密な統合が必要です。システムリソ スの制御を司るOSとの緊密な統合が必要です。

単純なプロセス優先度では解決できない複数の課題があります

複合処理 適化の主な課題単純なプロセス優先度では解決できない複数の課題があります

< CPUリソースの割り当て問題 >1. プロセス優先度の逆転

< I/Oリソースの割り当て問題 >2. 過剰な先読みI/Oの発生

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 18

単純なプロセス優先度では解決できない複数の課題があります

1. プロセス優先度の逆転問題単純なプロセス優先度では解決できない複数の課題があります

問題①

pri=50のプロセスへのサービス実行がpri=220の

プロセス優先度、もしくはデータソース優先度

OLTP BATCH pri 50のプロセスへのサ ビス実行がpri 220のDAMで実行されることで優先度が逆転し、pri=180のプロセスの実行を妨げる

問題②

OLTP優先度高pri=180

優先度低pri=50

問題①問題②

問題②

同一のDAMにリクエストが届く場合、実行順が単純なFIFOではpri=180のプロセスへのサービスを優先処理することができない

DAM: Data Access Manager論理ディスク毎に起動されるDBエンジン機能とDisk I/O

DAM優先度高pri=220

DAM優先度高pri=220

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 19

論理ディスク毎に起動されるDBエンジン機能とDisk I/O機能を内包するNonStop SQL中核プロセス論理

ディスク論理

ディスク

単純なプロセス優先度では解決できない複数の課題があります

1. プロセス優先度の逆転問題 – NonStop SQLでの解決単純なプロセス優先度では解決できない複数の課題があります

解決①

プロセスディスパッチを制御するReady Listへの

プロセス優先度、もしくはデータソース優先度

OLTP BATCHDAMの登録にリクエスト優先度を用いる

定期的に(1ブロック処理毎など)Ready Listをチェックし、処理中のリクエスト優先度より高い優先度のプロセスが待っている場合、自発的にCPU

解決①DAMをリク スト解決②

OLTP優先度高pri=180

優先度低pri=50

先度のプロセスが待っている場合、自発的にCPUをリリースする

解決②

DAMをリクエスト

優先度でディスパッチし、高優先度リクエスト到着をチェック

解決②優先度順の

リクエストキューを実装

50

DAMが管理するリクエストキューはクライアントプロセスの優先度順で管理する

高い優先度リクエストに抜かれる度に優先度は1つ加算され キュー内の長時間滞留を防止

DAM優先度高

pri=50 (220)

DAM 優先度高pri=180 (220)

180

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 20

つ加算され、キュ 内の長時間滞留を防止論理

ディスク論理

ディスク

単純なプロセス優先度では解決できない複数の課題があります

2. 過剰な先読みI/Oの発生問題と解決単純なプロセス優先度では解決できない複数の課題があります

• 多量データのスキャン等を高速化するため、多数の先読みディスクI/Oがキューイングされます

CPUブレードキューイング先読みディスクI/Oがキ イングされます

• 低優先度のプロセスから過剰な先読みI/Oが発生すると、高優先度のサービスのためのI/Oが遅延します OLTP

優先度高pri=180

BATCH優先度低

pri=50

キュ イングI/O情報

• DAMがCPU内のキューイングI/O状況をチェックできDAM

優先度高pri=50 (220)

DAM 優先度高

pri=180 (220)

DAM優先度高

pri=100 (220)

る制御メモリを実装

• 高優先度のI/O発生時はキューイング数を抑止し、

過剰なキューイング要求発生時には優先度に従っ論理論理

pri 180 (220)

論理

制御された先読み

I/O

制御された先読み

I/O

制御された先読み

I/O

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 21

たWAITを入れます論理

ディスク論理

ディスク

論理ディスク

HW OS DBMSの統合により 適なソリ ションを提供

複合処理 適化機能実装のポイントHW, OS, DBMSの統合により 適なソリューションを提供

1. OSの実装するプロセス間通信が、プロセス優先度を確実にDAMに伝達され 優先度順リク ストキ を実装にDAMに伝達され、優先度順リクエストキューを実装

2. OSのディスパチャーに機能を実装することで、高優先度のリクエスト処理に優先的にCPUリソースを配分

3 DAMがリクエストをチェックする間隔は、HW機種、DBMS3. DAMがリクエストをチェックする間隔は、HW機種、DBMSバージョン毎に 適化されることで、 小のオーバーヘッドで 高の効果を実現

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 22

HP NonStop SQLOS統合により実現している付加価値OS統合により実現している付加価値

「優先度制御機能」

「データの保護 – Lost Write防止」

「トランザクション制御負荷の 適化」

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

Lost WriteディスクへのWrite処理がDBMSからは完了に見えながら完了していない状態ディスクへのWrite処理がDBMSからは完了に見えながら完了していない状態

Writeデータを失う原因の所在により、以下の2つのケースがあります。

< 狭義のL t W it >< 狭義のLost Write >OS、デバイスドライバ、コントローラの不備で、CPUがWrite完了通知を受けたにも関わらず、ディスクへのWriteが完了していない状況が発生する問題

< 広義のLost Write >DBMS等がWriteしたデータが、SW障害やHW障害により完全なWriteがされていないのにWrite完了通知がなされること

いずれもデータ損失を招く重大な問題の原因になり得る事象です。

HP NonStopサーバーは、HDD, デバイスドライバー, OS, DBMSをHP NonStopサーバーは、HDD, デバイスドライバー, OS, DBMSを

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 24

HP NonStopサ バ は、HDD, デバイスドライバ , OS, DBMSを

統合して製品開発を行うことで、データ損失のリスクを回避しています。

HP NonStopサ バ は、HDD, デバイスドライバ , OS, DBMSを

統合して製品開発を行うことで、データ損失のリスクを回避しています。

HP NonStop OSの提供するLost Write防止機能確実なディスクへのWrite実行 : 狭義のLost Writeへの対応確実なディスク のWrite実行 : 狭義のLost Write の対応

汎用OSでは、OSそのもの、デバイスドライバー、もしくはコントローラの不備により、DBMSからのWrite要求に完了を通知していながら、実際にはWriteが完了していない状況が発生することがあります。

その状況下で障害が発生するとデ タ整合性が破れ デ タ損失につながる危険性がありますその状況下で障害が発生するとデータ整合性が破れ、データ損失につながる危険性があります。

HP NonStopサーバーは、HDD、コントローラ、デバイスドライバー、OSを統合して製品開発を行っており、必要な際には確実にHDD内までデータを書き込む機能を実現しており、このようなデータ破損のリスクはありませんはありません。

DBMS DBMS

< Lost Write防止機能無し> < HP NonStopサーバー >

ドライバーO S

Write命令 Write完了

ドライバー (Disk Process)

NonStop OS

Write命令 Write完了

コントロ ラ ントロ ラ

確実なデータフラッシュSCSI命令の発行

コントローラはキャッシュを持たずHDDからの応答をそのまま通知

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 25 ?遅延Write

○確実なWrite Write完了

コントローラ コントローラ の応答をそのまま通知

HDDの書き込み完了応答を待ってWrite完了

HDD故障によるLost Write(書き込みデータ喪失)への対応HDDの稀な故障状態によるLost Writeの発生: 広義のLost WriteHDDの稀な故障状態によるLost Writeの発生: 広義のLost Write

HDDのインターフェースは稼働しているが、メディアに障害が発生する稀な故障においては、ドライバーからのWrite要求にHDDが完了を通知していながら、実際にはWriteが完了していない(一部もしくは全データがWriteされていない)状況が発生することがありますは全デ タがWriteされていない)状況が発生することがあります。

そのような障害が発生すると、片系ディスクのデータは破損していながらCPUはそれを検知せず、そのデータを後続の処理で使用してしまう危険性があります。

NonStopサーバーは このようなケースを含め 2段階の堅牢なチェックサム機能を適用することでNonStopサーバーは、このようなケースを含め、2段階の堅牢なチェックサム機能を適用することでデータ破損を確実に検知し、データ整合性を保証する機能を提供しています。(詳細後述)

DBMS

ドライバー (Disk Process)NonStop OS

Write命令 Write完了

命令コントローラ

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 26

Write命令 Write完了

I/F チップ

?HW障害 (一過性 or 恒久的)

HDD故障によるLost Write(書き込みデータ喪失)防止機能全ディスクファイルに2段階のチェックサムを適用

NonStop OSのファイルシステムは、堅牢性、データ保全性を第一に設計されています。

データ破損検知のため全ディスクファイル(プログラム、テキストファイル等を含む全て)に、通常のブロック内チェックサムに加え ブロック単位のチェックサムをファイル中の専用領域(チェックサムブロッロック内チェックサムに加え、ブロック単位のチェックサムをファイル中の専用領域(チェックサムブロック)に保持し、READ実行時に毎回チェックを行います。これにより、HP NonStopサーバーではブロックデータ全体のLost、ブロックデータの一部破損の両方を確実に検知します。

デ スクプ セス機能の動作を以下に記述します

1. ディスクからデータブロックをREADする

2. ディスクプロセスはREAD時にチェックサムを

再計算しデータ破損を確実に検出

1. データREAD2. チェックサム

データ破損検出

3. ミラーディスクデータREAD

ディスクプロセス

再計算しデ タ破損を確実に検出

3. ディスクプロセスはミラーディスクから再度READ4. ミラーディスクのデータが正常な場合、それを

アプリケーションに返し、プライマリーディスクの破損デ タブロックを上書きして修復を実行

破損検出

4. データ修復

I/Oパス分離、シリアルWRITE機

能を備えたミラーディスク

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 27

破損データブロックを上書きして修復を実行チェックサムブロック・ セクターチェックサムを 格納

する専用領域・ブロックデータの喪失を検出

ブロック内チェックサム・ ブロックデータの

一部破損を検出

HP NonStop SQLOS統合により実現している付加価値OS統合により実現している付加価値

「優先度制御機能」

「データの保護 – Lost Write防止」

「トランザクション制御負荷の 適化」

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

HP NonStop SQLの実装OSとの統合によりオーバーヘッドを限界まで削減OSとの統合によりオーバーヘッドを限界まで削減

CPU間通信にHWベースの高速通信機能を採用HP ServerNet™− HP ServerNet™

• DMAベースのASIC実装により低遅延を実現

• チェックサムによるデータ保護機能を内蔵

• ネットワーク型接続によりブレード数に応じた通信帯域を提供

• TCP/IP通信と比較し80%以上CPU負荷を低減 ※1

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 29

< HP ServerNet ASIC >※1 … メッセージ長4KB、弊社社内性能試験結果より

HP NonStop SQLの実装OSとの統合によりオ バ ヘッドを限界まで削減OSとの統合によりオーバーヘッドを限界まで削減

トランザクション制御機能をOSに統合

ザ ブ プ− トランザクション管理テーブルの更新機能をインタラプト処理内に実装

プロセスディスパ チのオ バ ヘ ドを削減• プロセスディスパッチのオーバーヘッドを削減

• カーネルモードとユーザーモードのスイッチオーバーヘッドを削減を削減

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 30

OSレベルでのトランザクション管理実装例フェーズ1 : コミット要求フェーズ トランザクションフ ズ1 : ミット要求フ ズ

コーディネータ

CPU宛て特殊ServerNetパケット

トランザクション全体でコミットOK

全CPUで同期されたトランザクション制御テーブルを保持

Trx 101 Act CPU 0,1,2

Trx 100 Act

ServerNet

特殊パケットで返信完了!

コミット準備!

コミット準備!

完了!

ブルを保持

ServerNet割り込み ンドラ

ServerNet割り込みハンドラ

同時実行トランザクション数が多い時は、複数パケットを単一パケットに詰めて送信

割り込みハンドラ割り込みハンドラ割り込みハンドラ

制御テーブルを更新

Trx 101 CPU 0,1,2

Trx 100 ActTrx 101

Act

Act CPU 0,1,2

Trx 100 ActプロセスWAKE

システムで1つのログファ

に詰めて送信(待ち時間を自動で調節)

データ

DBMSTrx 101: ph1

DBMSTrx 101

制御テーブルを参照し処理実行

データ

DBMSTrx 10:

Redo/Undoログバッファ

システムで1つのログファイル

ログディスクプロセス

ログディスクプロセスWALフラッシュ

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 31

データ Redo/Undoログ

Redo/Undoログバッファ

-B-P

WALフラッシュ

まとめ - HP NonStop SQL !!以下のようなお悩みをお持ちのお客様以下のようなお悩みをお持ちのお客様

従来のDBMSと一味違う「HP NonStop SQL」をぜひご検討ください!

DBサ バ の可用性に不安DBサーバーの可用性に不安

DBがスケールアウトしない

DB運用に工数がかかりすぎる

マルチベンダ環境でサポートに難マルチベンダ環境でサポ トに難

万全なデータ保護機能を探している

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 32

DB統合の実現に懸念

N St SQL & インメモリ テクノロジ セッション

Check out our other sessions !!!NonStop SQL & インメモリーテクノロジーセッション

6月20日 14:00~14:50 Room D NonStop SQL月 p Q

「そのデータベース 5年後大丈夫ですか」日本ヒューレット・パッカード 後藤 宏

6月20日 1 00 1 0 R A インメ リ6月20日 15:00~15:50 Room A インメモリー

「HDDからインメモリーテクノジーへ」日本ヒューレット・パッカード 三宅祐典

6月20日 16:00~16:50 Room D インメモリー

「インメモリーデータベース徹底比較」日本ヒュ レット パッカ ド 小森 博之

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 33

日本ヒューレット・パッカード 小森 博之

ご清聴ありがとうございましたご清聴ありがとうございました。

© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

原 敏光プリセールス統括本部サーバー技術本部サーバー技術二部

[email protected]直通 050 3138 0879 携帯 090 8309 2834直通 050 3138 0879 携帯 090 8309 2834FAX 03 5628 2698

日本ヒューレット・パッカード株式会社本社〒136‐8711〒136‐8711東京都江東区大島2‐2‐1

Thank you!© Copyright 2014 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.

T n y !