ビッグデータと -...

45
Windows Azure ITライブラリー pdf 100冊) http://itlib1.sakura.ne.jp/ ビッグデータと 一般社団法人 情報処理学会 正会員 腰山 信一 [email protected]

Upload: others

Post on 26-Sep-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

Windows Azure

ITライブラリー (pdf 100冊)http://itlib1.sakura.ne.jp/

ビッグデータと

一般社団法人

情報処理学会 正会員

腰山 信一

[email protected]

Page 2: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

本資料の関連資料は下記をクリックして

PDF一覧からお入り下さい。

ITライブラリー (pdf 100冊)

http://itlib1.sakura.ne.jp/

目次番号 454番 880番 他

2

Page 3: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

データ爆発とどまるところを知らない

3

Page 4: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ライフログ

画像・動画

Webサイト

携帯電話の出荷数国内:3328万台全世界:約13億台GPSデータ

センシングログ

スマートメーター(利用履歴)

非接触IC-R/W

音声

ユーザー数5億人以上全世界1日に3億のつぶやき

ソーシャルメディア(投稿情報/人間関係)

ユーザー数10億人以上1日に10TBずつ増加

1日86万件以上の投稿

ビッグデータ

文字

2015年の世界のデータ量1.8ゼッタバイト

(1.8兆GB)

(閲覧履歴)

POS・自販機・各種カード(購買履歴)RFID(無線ICタグ)

電話・コールセンター(通話履歴)

4

Page 5: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ビッグデータ

収集・蓄積等が可能・容易になる多種多量のデータ(ビッグデータ)を活用することにより、異変の察知や近未来の予測等を通じ、利用者個々のニーズに即したサービスの提供、業務運営の効率化や新産業の創出等が可能。

5

Page 6: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ソーシャルメディアデータ

ソーシャルメディアにおいて参加者が書き込むプロフィールコメント等

6

Page 7: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

カスタマーデータ CRMシステムにおいて管理等されるDM等販促データ、会員カードデータ等

7

Page 8: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

オフィスデータ

業務の各システムや、グループウエアから提供される膨大なデータ群

CRM

Flat Files

Legacy Systems

8

Page 9: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

マルチメディアデータ

Web上の配信サイト等において提供等される音声、動画等

9

Page 10: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

Websiteデータ

ECサイトやブログ等において蓄積等される購入履歴、ブログエントリー等のデータ

10

Page 11: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

センサーデータ

GPS、ICカードやRFID等において検知等される位置、乗車履歴、温度、加速度等のセンサーデータ。

11

Page 12: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ログデータ

Web Server等において自動的に生成等されるアクセスログ、エラーログ等のデータ

12

Page 13: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

オペレーションデータ

販売管理等の業務システムにおいて生成等されるPOS

データ、取引明細等のデータ

13

Page 14: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

センサー単体の活用

百葉箱

体温計

ATM 自動水洗 エアコン、冷蔵庫 人感センサ付照明

水道、ガス、電力メータ

自動改札、ETCゲート

14

Page 15: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ネットワークで情報収集

交通渋滞情報配信(カーナビ等)

車両運行支援

アメダス

震度情報ネットワーク・システム

土砂災害警戒システム河川情報システム15

Page 16: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

情報分析、情報配信、自動制御

在庫管理・補充員派遣(自動販売機等)

工場・プラント制御(製造業・農業)

異常監視・対策(トンネル)交通管制(信号機、標示板等)

端末情報管理(スマートフォン等)

ファームウェア更新(自動車、家電等)

16

Page 17: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

M2M通信サービス(例)

自動販売機、エレベーター、プラント設備、橋梁等の様々な領域において、M2M通信(Machine to Machine通信:人が介在せず、ネットワークに繋がれた機器同士が相互に情報交換等を行う機器間通信)サービスを提供。

17

Page 18: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ライフログ

付加情報

関係性・分析情報

他者との関係(絆)・評判・信用情報

提供・利用することに応じて記録される情報

利用履歴分析など

行動情報

利用履歴

購買履歴、移動履歴ロケーション、写真

基本属性

住所、クレジットカード番号、趣味、所属企業、役職

IDコード(識別子/クレデンシャル)

提供・利用する上で必要な情報

付加情報

関係性・分析情報

他物との関係・性能情報

トラッキング履歴分析など

行動情報

利用履歴

機械・器具、車両・信号など

の動作トラッキング履歴、

IDコード

(識別子/クレデンシャル)製造番号などID / パスワードなど

動植物データ

日記、つぶやき

基本属性

製造年月日、製造場所製造環境、など

天候など環境データ

センシングログ

(マシン)

18

Page 19: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

Big Data のビジネス活用への課題

19

Page 20: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

2割

20

Page 21: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

21

Page 22: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

2割

22

Page 23: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

Big Data のビジネス活用へのアプローチ

23

Page 24: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

24

Page 25: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

25

Page 26: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

CEP

26

Page 27: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

27

Page 28: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ソーシャル メディア & 調査研究データ

システム、デバイス、センサー 等

100111

28

CEP

Page 29: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

Windows Azure におけるBig Data 活用基盤

29

Page 30: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

Hadoop connector for

Hadoop on

SQL Server

/ Parallel Data Warehouse

Hadoop on

社内の Big Data(構造化データ)

StreamInsight 2.0

ERP CRM LOB

PowerView

Analysis Services Reporting Services

SQL StreamInsight

Integration Services

30

社外の Big Data (非構造化データ)

Page 31: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

31

Page 32: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ベネ

フィ

ット

重要

な特

Fast Track for

DellParallel Data Warehouse

HPEnterprise Data Warehouse

Dell QuickstartData Warehouse

HPBusiness Data Warehouse

32

Page 33: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

StreamInsight 2.0 SQL StreamInsight

ベネ

フィ

ット

重要

な特

33

Page 34: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ベネ

フィ

ット

重要

な特

34

Page 35: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

Windows Azureは Apache Hadoop™ をベースとした Windows Server 及びWindows Azure Platform 向けのディストリビューションを強化。

これらをデータ ウェアハウス ソリューションと統合することによって、エンタープライズ 領域における Hadoop の積極的活用。

Windows Azureにおける Big Data へのアプローチ

➢ エンドユーザー、IT プロ、開発者に Hadoop に対する幅広いアクセスを提供

➢ 高いパフォーマンス、容易な管理性、堅牢なセキュリティを備えた、Enterprise 向け Hadoop ディストリビューションの提供

➢ PowerPivot for Excel や PowerView による使いやすさの提供

➢ SQL Server 及び SQL Server Parallel Data Warehouse 用のHadoop connector を無償で提供

➢ Hadoop をベースとした Windows Server 及び Windows Azure Platform向けのディストリビューション

35

Page 36: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

36

Page 37: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ベネ

フィ

ット

重要

な特

Excel 向けの Hive アドイン

Hadoop 上の非定型データの参照と分析に操作に習熟したアプリケーションを利用

37

Page 38: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ベネ

フィ

ット

重要

な特

Hive ODBC ドライバが Hadoop とSQL Server Analysis Services,PowerPivot, Power View を統合

セルフサービス型 BI ツールを使ったOLAP 分析サービスの活用

38

Page 39: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ベネ

フィ

ット

重要

な特

39

Page 40: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ソーシャル メディアサイトの公開済データの積極活用モデルの確立

ベネ

フィ

ット

重要

な特

40

Page 41: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ベネ

フィ

ット

重要

な特

JavaScript によるMapReduceプログラミング

簡素化されたプログラミング

JS

サポート対象の全てのデバイスのWeb ブラウザから、JavaScript で作成された Hadoop ジョブ を展開

簡素化されたMapReduce ジョブ の展開

41

Page 42: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

ベネ

フィ

ット

重要

な特

42

Page 43: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

BI ツール:迅速、広範、安価に展開できる Big Data ソリューション

容易なオペレーション

セルフ サービス モバイル

分析と結果の予測

リアルタイム

共同作業を支援

共有と統治新しい発見と推奨 変換とクレンジング

データ ウェアハウス:ソース横断的な統合によるデータ価値の向上

非構造化データ

100111

リレーショナル データ マルチ ディメンジョン ストリーミング データ

プラットフォーム:構造と管理モデルに依存しないデータ分析の基盤

マー

ケッ

トプ

レイ

ス:

社外

デー

タを

併用

した

分析

自然

科学

デー

タ市

場調

査デ

ータ

学術

研究

デー

43

Page 44: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse

本資料の関連資料は下記をクリックして

PDF一覧からお入り下さい。

ITライブラリー (pdf 100冊)

http://itlib1.sakura.ne.jp/

目次番号 454番 880番 他

44

Page 45: ビッグデータと - itlib1.sakura.ne.jpitlib1.sakura.ne.jp/test380/pdfichuran/0454/0454-2-BigData-and-Windows... · Hadoop connector for Hadoop on SQL Server / Parallel Data Warehouse