バックアップソフトウェア netbackuptm hadoopデータの ......ul4286-d1da-i netbackup...

2
Hadoopデータのバックアップ Hadoopは様々な業種においてビッグデータ蓄積基盤を提供し、データ分析を支援します。 バックアップソフトウェア NetBackup TM NetBackup は Hadoop環境のビッグデータを保護し、コスト低減やリスク対策を支援します。 分析済み/利用頻度の低いデータは Hadoop内に保持せず、安価な ディスク/テープへバックアップ。 Hadoop内のデータ肥大化も回避できます。 保管が必要なファイル/フォルダを 自動バックアップ 長期保管にテープも利用できます テープ媒体を外部保管してコスト低減 バックアップ容量は必要最小限 NetBackupの重複排除機能を利用 大容量データを低コストで保管 Hadoop NetBackup サーバ 操作ミス/不具合/誤更新などによって 破損したHadoopのデータを復旧。 ※ランサムウェアなどマルウェアによって 破壊されたデータも復旧できます。 ファイル/フォルダ単位で復旧 GUI操作で復旧 任意のバックアップ時点のデータを復旧 破損したデータのみを、短時間で復旧 災害発生時もデータを保全(災害対策) Hadoop NetBackup サーバ NetBackup サーバ 保管が必要なデータを災害から守るため、 遠隔地へ自動的に二次バックアップ 遠隔地への転送量は必要最小限 NetBackupの重複排除機能(AIR)を利用 バックアップ 実施日 通常のバックアップ フル フル フル 増分 増分 増分 フル フル (初回) フル バックアップ 実施日 フル アクセラレータ フル+増分を組み合わせた バックアップ運用は不要。 高速なフルバックアップを 繰り返す、シンプルな運用 従来のバックアップ運用 で課題となっていた、長 時間かかる定期的なフル バックアップ処理が不要 大容量データの全体(フル)バックアップには時間がかかります。 追加/更新されたデータのみを繰り返しバックアップすることで転送量が減り、 バックアップ時間を短縮できます。 NetBackupの重複排除機能 (アクセラレータ)を利用 大容量データのバックアップ時間短縮 ※ バックアップ性能はお客様環境に依存します。全ての環境で同等の性能効果が得られることを保証するものではありません。 NetBackupによるHadoopデータのバックアップ 格納データの肥大化 によるディスク容量 圧迫 データ肥大化で ディスク容量圧迫 万が一の災害発生 時にデータが消失 災害発生時の データ損失 操作ミス/不具合等によ る論理的なデータ破損 マルウェア感染などに よるデータ破壊 誤更新 / ウィルス 等によるデータ損失 利用されなくなった データ、長期保管の データの保管コスト が高い 大容量データの 保管コストが高い Hadoopにおけるビッグデータ管理の問題点

Upload: others

Post on 06-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • HadoopデータのバックアップHadoopは様々な業種においてビッグデータ蓄積基盤を提供し、データ分析を支援します。

    バックアップソフトウェア NetBackupTM

    NetBackup は Hadoop環境のビッグデータを保護し、コスト低減やリスク対策を支援します。

    分析済み/利用頻度の低いデータはHadoop内に保持せず、安価なディスク/テープへバックアップ。Hadoop内のデータ肥大化も回避できます。

    保管が必要なファイル/フォルダを自動バックアップ

    長期保管にテープも利用できます• テープ媒体を外部保管してコスト低減

    バックアップ容量は必要最小限• NetBackupの重複排除機能を利用

    大容量データを低コストで保管

    Hadoop NetBackupサーバ

    操作ミス/不具合/誤更新などによって破損したHadoopのデータを復旧。※ランサムウェアなどマルウェアによって 破壊されたデータも復旧できます。

    ファイル/フォルダ単位で復旧 GUI操作で復旧 任意のバックアップ時点のデータを復旧

    破損したデータのみを、短時間で復旧

    災害発生時もデータを保全(災害対策)

    Hadoop NetBackupサーバ

    NetBackupサーバ

    保管が必要なデータを災害から守るため、遠隔地へ自動的に二次バックアップ

    遠隔地への転送量は必要最小限• NetBackupの重複排除機能(AIR)を利用

    バックアップ実施日

    バックアップ時間

    通常のバックアップフル フル フル

    増分増分 増分フル

    フル(初回)

    フル

    バックアップ実施日

    バックアップ時間

    フル

    アクセラレータフル+増分を組み合わせたバックアップ運用は不要。高速なフルバックアップを繰り返す、シンプルな運用

    従来のバックアップ運用で課題となっていた、長時間かかる定期的なフルバックアップ処理が不要

    大容量データの全体(フル)バックアップには時間がかかります。追加/更新されたデータのみを繰り返しバックアップすることで転送量が減り、バックアップ時間を短縮できます。

    • NetBackupの重複排除機能(アクセラレータ)を利用

    大容量データのバックアップ時間短縮

    ※ バックアップ性能はお客様環境に依存します。全ての環境で同等の性能効果が得られることを保証するものではありません。

    NetBackupによるHadoopデータのバックアップ

    格納データの肥大化によるディスク容量圧迫

    データ肥大化でディスク容量圧迫

    万が一の災害発生時にデータが消失

    災害発生時のデータ損失

    操作ミス/不具合等による論理的なデータ破損

    マルウェア感染などによるデータ破壊

    誤更新 / ウィルス等によるデータ損失

    利用されなくなったデータ、長期保管のデータの保管コストが高い

    大容量データの保管コストが高い

    Hadoopにおけるビッグデータ管理の問題点

  • [NetBackup] Hadoopデータのバックアップ

    2018年4月現在日本電気株式会社 〒108-8001 東京都港区芝五丁目7番1号 (NEC本社ビル)

    NEC プラットフォームソリューション事業部ソフトウェアお問い合わせ

    お問い合わせは、下記へ

    〒108-8424 東京都港区芝五丁目33番8号(第一田町ビル)TEL:03(3798)7177

    ●本資料に記載されている会社名、製品名は各社の登録商標または商標です。●この資料の内容は2018年4月現在のものです。●製品内容については予告無く変更する場合があります。●お使いのシステムの環境、およびご利用方法によっては記載以外の制限が発生する場合もございますので、あらかじめご了承ください。●本資料の内容は改良のため予告なしに仕様・デザインを変更することがありますのでご了承ください。●この資料の一部、または全部を複写、転載、複製、引用することは禁じられています。

    【受付時間】9:00~12:00 13:00~17:00 月曜日~金曜日(祝日・NEC所定の休日を除く)

    URL:http://jpn.nec.com/backup/netbackup/

    バックアップ運用イメージ

    運用例:(1) 日々の更新データをバックアップ保管・NetBackup重複排除バックアップ(アクセラレータ)で、Hadoop大容量データを短時間でバックアップ

    (2) データを自動転送して遠隔地で保管(二次バックアップ)・災害対策として、バックアップデータを遠隔地のNetBackupサーバに自動転送(NetBackup AIR機能)

    (2ʼ) 倉庫等でオフサイトでテープを保管し、安価に長期保管

    NetBackupサーバ

    LAN(NFSマウント)

    テープ搬出

    キャビネット倉庫など

    (1)日々の更新データを バックアップ保管

    (2ʼ)オフサイトでテープ保管 (安価な長期保管)

    ※ 日々の最新データは一定期間 バックアップして保護

    ※ 可搬性あるテープでバックアップデータ を外部保管

    NetBackupサーバ

    遠隔サイト(災害対策)(2)データを自動転送して 遠隔地で保管

    ※ 上記運用は一例です。各製品の仕様、動作要件については、弊社営業までお問い合わせください。

    バックアップシステム構成例

    ※ NetBackupのみの製品構成例です。正式な見積もりは、別途、弊社営業までご連絡ください。※ NetBackupサーバの実搭載CPU数が2~3個、Hadoopデータの合計バックアップ対象容量が3TB以下の場合の製品構成例です。

    ● NetBackupライセンス/インストールメディア型番 品名

    UL4286-D22-I NetBackup Server v8.0/8.1 for Linux Tier 2

    UL4286-D15-I NetBackup Standard Client v8.0/8.1

    UL4286-D1DA-I NetBackup Data Protection Optimization Option v8.0/8.1 ( 1 FRONT END TBYTE - SPECIAL VERSION )

    UL1086-D33 NetBackup v8.1 DVD Media Kit (NEC-Jpn)

    数量

    1

    1

    3

    1

    ※ Hadoopデータのバックアップは、Hadoop の NFS Gateway 機能を利用します。

    ・NameNode には、NFS Gateway をインストール、NetBackupサーバ(バックアップサーバ)には、NFSクライアントをインストールします。・NameNode が NFS サーバとして、NetBackupサーバがNFSクライアントとして動作します。・Hadoop 環境にあるファイルやディレクトリを、NetBackupサーバに NFSマウントします。

    ※ Append-Only(ランダムWriteは不可)のため、NFS Gateway に、一時的に書き込むための領域が必要です。

    NFS Gatewayをインストールし、NFSサーバを構築

    NFSサーバとして動作

    NFSクライアントとして動作

    HDFS

    Data Node Name Node

    Hadoop

    (NetBackupサーバ)バックアップサーバNetBackup Server 8.1

    Linux

    1Gbps-LAN

    Data Node

    Name NodeNFSクライアントとして動作NFSサーバとして動作

    HDFS

    Hadoop※ NetBackupサーバのOSは一例です。他OSの利用やサポート OS/バージョンについては弊社営業までご相談ください。