sqlとnosqlを選ぶ必要はない! · もうsqlとnosqlを選ぶ必要はない!...

1
もうSQLNoSQLを選ぶ必要はない!? 両者を備えたスケールアウトデータベース GridDB NoSQLベンチマーク YSCB (Yahoo! Cloud Serving Benchmark) NewSQLベンチマーク TCP-H 出典:株式会社フィックスターズ 「GridDBとCassandraのパフォーマンスとスケーラビリティ」 (2017年8月23日) ノード数にほぼ比例して処理能力が向上 長時間運用においても安定したパフォーマンス 低レイテンシーで遅延せずに高速処理 スループットでCassandraを圧倒 0 10 20 30 40 50 60 70 80 90 100 PostgreSQL 1234応答時間 GrdDB TPC-H (SF-100) 登録時間 0 10 20 30 40 50 60 70 80 90 100 PostgreSQL 1234応答時間 GrdDB TPC-H (SF-100) 検索時間 オープンソース・コミュニティ オープンソースソフトウェアとして公開 https://github.com/griddb/ デベロッパーサイトを用意 https://gridb.net/ 特長 代表的な実現技術 IoT データモデルはキー・コンテナ。 コンテナ内でのデータ一貫性を保証 時系列データ管理する特別な機能 過去データをコールド保存する⾧期アーカ イブ機能 キーコンテナ型データモデル NoSQL型でよく採用されているキー・バリューを拡張 時間順にレコードが格納される時系列コンテナ 時系列レコードを圧縮する機能や期限解放する機能を装備 順序に関係無くレコードが格納されるコレクションコンテナ コンテナ内でのデータ一貫性を保証 長期アーカイブ技術 適切に容量を抑えつつ、⾧期間データを保存効率の良い アーカイブ処理 データの複製をノード間で自動的に実行 ノードに障害があっても縮退してサービス 継続 数秒から数十秒の切替時間 自律データ再配置技術 明示的なマスターノードを必要としない自律制御によるクラスタ管理 ノード間でデータ配置を自動決定。クライアントとノードの間に位置する管理ノードや仲介ノードを排除 通信やデータ変換処理などのコストが削減され、高いパフォーマンスとデータの一貫性を同時に実現 単一障害点になりやすい管理ノードがクラスタ内 に存在しないために、さらに耐障害性が向上 ノード過半数を占めたサブクラスタのみがサービス 可能となるクオーラムポリシーによりスプリットブレイン を完全排除 少ないサーバ台数で初期投資を抑制 負荷や容量の増大に合わせたサーバ 増設が可能 自律データ再配置により、高い拡張性 を実現 NewSQL (=NoSQL+SQL) メモリを主、ストレージを従とした ハイブリッド型インメモリDB メモリやディスクの排他処理や同期待ちを 極力排除 SQLにおける分散並列処理 デュアルインターフェース SQL (ANCI-92) インタフェース コンテナ(テーブル)RDBのリレーションとみなしてアクセス 巨大コンテナをノード間に分散 (テーブルパーティショニング) ジョインなど複数テーブルに対するSQL − JDBC/ODBCドライバー NoSQL (キー・バリュー型) インターフェイスSQL 高可用、高スループット指向のKVS キーコンテナに対するCRUD − Java/C/Python/Rubyドライバー (ADDA : Autonomous Data Distribution Algorithm) データ登録などには高速な NoSQL (KVS) インターフェース、分析や他システムとの連携には 有用な機能が多い SQLインターフェース を使うことで、双方の長所を有効活用可能 キーコンテナ型 − PostgreSQL 9.6 GridDB AE 4.0 − CPU8-core Intel® Xeon® ES-2620 v4 2.10GHz − Memory64GB − HDDSAS 12TB − OSCentOS 7 with kernel 3.10.0-514.el7.x86_64 − Network1Gb Ethernet − DatasetTPC-H (SF 100), Q1-Q8 高速な登録処理 SQLのスケールアウト効果

Upload: others

Post on 27-May-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SQLとNoSQLを選ぶ必要はない! · もうSQLとNoSQLを選ぶ必要はない! ~両者を備えたスケールアウトデータベースGridDB ~ NoSQLベンチマーク

もうSQLとNoSQLを選ぶ必要はない!? ~ 両者を備えたスケールアウトデータベース GridDB ~

NoSQLベンチマークYSCB (Yahoo! Cloud Serving Benchmark)

NewSQLベンチマークTCP-H

出典:株式会社フィックスターズ 「GridDBとCassandraのパフォーマンスとスケーラビリティ」 (2017年8月23日)

ノード数にほぼ比例して処理能力が向上 長時間運用においても安定したパフォーマンス

低レイテンシーで遅延せずに高速処理スループットでCassandraを圧倒

0

10

20

30

40

50

60

70

80

90

100

PostgreSQL 1台 2台 3台 4台

応答時間

GrdDB

TPC-H (SF-100) 登録時間

0

10

20

30

40

50

60

70

80

90

100

PostgreSQL 1台 2台 3台 4台

応答時間

GrdDB

TPC-H (SF-100) 検索時間

オープンソース・コミュニティオープンソースソフトウェアとして公開https://github.com/griddb/

デベロッパーサイトを用意https://gridb.net/

特長 代表的な実現技術

IoT

指向モデル

データモデルはキー・コンテナ。

コンテナ内でのデータ一貫性を保証

時系列データ管理する特別な機能

過去データをコールド保存する⾧期アーカ

イブ機能

キーコンテナ型データモデル

NoSQL型でよく採用されているキー・バリューを拡張

時間順にレコードが格納される時系列コンテナ

時系列レコードを圧縮する機能や期限解放する機能を装備

順序に関係無くレコードが格納されるコレクションコンテナ

コンテナ内でのデータ一貫性を保証

長期アーカイブ技術

適切に容量を抑えつつ、⾧期間データを保存効率の良い

アーカイブ処理

高い信頼性と

可用性

データの複製をノード間で自動的に実行

ノードに障害があっても縮退してサービス

継続

数秒から数十秒の切替時間

自律データ再配置技術

明示的なマスターノードを必要としない自律制御によるクラスタ管理

ノード間でデータ配置を自動決定。クライアントとノードの間に位置する管理ノードや仲介ノードを排除

通信やデータ変換処理などのコストが削減され、高いパフォーマンスとデータの一貫性を同時に実現

単一障害点になりやすい管理ノードがクラスタ内

に存在しないために、さらに耐障害性が向上

ノード過半数を占めたサブクラスタのみがサービス

可能となるクオーラムポリシーによりスプリットブレイン

を完全排除

高い拡張性

少ないサーバ台数で初期投資を抑制

負荷や容量の増大に合わせたサーバ

増設が可能

自律データ再配置により、高い拡張性

を実現

高性能なN

ew

SQ

L

(=N

oS

QL+

SQ

L)

メモリを主、ストレージを従とした

ハイブリッド型インメモリDB

メモリやディスクの排他処理や同期待ちを

極力排除

SQLにおける分散並列処理

デュアルインターフェース

SQL (ANCI-92) インタフェース

− コンテナ(テーブル)をRDBのリレーションとみなしてアクセス

巨大コンテナをノード間に分散 (テーブルパーティショニング)

− ジョインなど複数テーブルに対するSQL

− JDBC/ODBCドライバー

NoSQL (キー・バリュー型) インターフェイスSQL

− 高可用、高スループット指向のKVS

− キーコンテナに対するCRUD

− Java/C/Python/Rubyドライバー

(ADDA : Autonomous Data Distribution Algorithm)

データ登録などには高速な NoSQL (KVS) インターフェース、分析や他システムとの連携には有用な機能が多い SQLインターフェース を使うことで、双方の長所を有効活用可能

キーコンテナ型

− PostgreSQL 9.6

− GridDB AE 4.0

− CPU:8-core Intel® Xeon® ES-2620 v4 2.10GHz

− Memory:64GB

− HDD:SAS 12TB

− OS:CentOS 7 with kernel 3.10.0-514.el7.x86_64

− Network:1Gb Ethernet

− Dataset:TPC-H (SF 100), Q1-Q8

高速な登録処理 SQLのスケールアウト効果