azureでデータ解析

63
クククククククククク JAZUG クク , クククククク JAZUG クク : ククク

Upload: tsubasa-yoshino

Post on 07-Aug-2015

46 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Azureでデータ解析

クラウドとデータ解析JAZUG 信州 , 松本上陸記念!

JAZUG 信州 : 吉野翼

Page 2: Azureでデータ解析

免責事項 このセッションは , 所属する企業 , 団体とは , 一切関係ありません

Page 3: Azureでデータ解析

自己紹介 吉野翼

株式会社エスキュービズムテクノロジー

Azure しなのコアメンバー

@papemk2

http://blog.qaramell.com

C#, Xaml, Azure, Xbox

Page 4: Azureでデータ解析

このセッションについて Azure でデータ解析する方法を知ってもらう

Azure で IoT をやるための足掛かり ( になればいいな )

Page 5: Azureでデータ解析

Internet of Things

Page 6: Azureでデータ解析
Page 7: Azureでデータ解析

Internet of Things IoT の定義とは ...

◦ 単純にインターネットに繋がったら…?

◦ センシングしてクラウドにデータ集約したら…?

◦ インターネットを経由してデバイス・センサーがやりとりしたら…?

Page 8: Azureでデータ解析

Before

Page 9: Azureでデータ解析
Page 10: Azureでデータ解析

After

Page 11: Azureでデータ解析
Page 12: Azureでデータ解析
Page 13: Azureでデータ解析

2018 年 : 全世界 180 億デバイスがインターネットと接続

2018 年の世界人口 : 約 75 億人

180 億 / 75 億 == 2.4

Page 14: Azureでデータ解析

全人類が平均 2.4 個の Web につながるデバイスを持つ

Page 15: Azureでデータ解析
Page 16: Azureでデータ解析

爆発的に増えるデバイス・センサー

爆発的に増えるデータ

爆発的に増えないリソース

Page 17: Azureでデータ解析

このビッグデータどうするの…?

Page 18: Azureでデータ解析

現状 爆発的に増えるデータにどう対応するか

データは , 常に増え続ける◦ 迅速なスケールに対応する◦ できるだけ無駄の少ない運用◦ 柔軟なスケール求

データを迅速に解析して金に換えたい◦ リアルタイムな分析

Tsubasa Yoshino
大量のデータがわかりやすい画像
Tsubasa Yoshino
データが吹っ飛んだ絶望感を感じる画像
Page 19: Azureでデータ解析

既存のリアルタイム分析処理の問題 とにかく構築が複雑

システムのスケール問題

フォールトトレランス構築

監視・運用コストが非常に高い

Page 20: Azureでデータ解析

金さえあれば何も要らない

Page 21: Azureでデータ解析
Page 22: Azureでデータ解析

今回紹介するもの

Page 23: Azureでデータ解析
Page 24: Azureでデータ解析

Event Hub 大量なデータの取り込み基盤

イベント収集の入り口

イベントストリームの生成

Event Hub で受けて Stream Analytics に流す

Page 25: Azureでデータ解析

Event Hub

Page 26: Azureでデータ解析

想定されるシナリオ インターネットに繋がった車

モバイルデバイスのトラッキング

トラフィック監視

各種センサーからのデータ収集

ウェアラブルからの身体情報収集

Page 27: Azureでデータ解析

想定されるシナリオ

Page 28: Azureでデータ解析

Event Hub の特徴 イベントの順序の維持

大量のデータ取り込みのための適切な容量の提供

AMQP, HTTP により大量のプラットフォームのサポート

高スループット : 1s あたり数百万件のイベントのストリーミング配信◦ 受信 : 1MB/s or 1000 イベント◦ 送信 : 2MB/s

Page 29: Azureでデータ解析

EventHub の特徴 メッセージを複数クライアントで同時処理

◦ 永続化しつつ分析するとか

データ保持期間中なら何度もイベントを呼べる

キューで管理

First in First out

一定の保存期間ののち古いものから削除◦ 期間中は , 明示的に削除不可

Page 30: Azureでデータ解析

パーティション Event Hub のデータ保存先

◦ 8 ~ 32 個で構成◦ 32 個以上パーティションを作りたい場合は , Service Busチームに連絡しよう

それぞれが独立◦ 基本的にラウンドロビン型

◦ イベントの明示的な削除は不可

◦ 明示的に特定パーティションに データを渡すのはバッドプラクティス

Page 31: Azureでデータ解析
Page 32: Azureでデータ解析

Stream Analytics リアルタイムなイベント処理

データのリアルタイム解析

センサ類の解析と相性抜群

SQL ライクなクエリで操作可能

Page 33: Azureでデータ解析

Stream Analytics 複数の入力ソースをまとめて使用可能

出力先も種類がたくさん

ユニット単位でスケール◦ 1ユニット 1MB/s◦ 48ユニットまでは , 自由に使用可◦ それ以上は , メールを送ろう

Page 34: Azureでデータ解析

特徴 クエリ錬成でデータ加工

くっつけたり計算したり絞ったり

SELECT

FROM

WHERE

JOIN

ORDER BY

Etc…

Page 35: Azureでデータ解析

Stream Analytics でデータを加工したり永続化したり

データの食わせ方さえどうにかなればいい

Page 36: Azureでデータ解析

Page 37: Azureでデータ解析

データを取り込んだら分析がしたい!

Page 38: Azureでデータ解析

データを取り込んだら分析がしたい!

と , 思うゴーファーであった

Page 39: Azureでデータ解析
Page 40: Azureでデータ解析
Page 41: Azureでデータ解析

グラフってどうやってパソコンで作るの???

学校で方眼紙に書いたことならあるよ!

Page 42: Azureでデータ解析

ん?

Page 43: Azureでデータ解析

方眼紙?

Page 44: Azureでデータ解析
Page 45: Azureでデータ解析

男は黙って Excel だ!

Page 46: Azureでデータ解析

そんなあなたに朗報です

Page 47: Azureでデータ解析

そんなツールあります

Page 48: Azureでデータ解析
Page 49: Azureでデータ解析
Page 50: Azureでデータ解析
Page 51: Azureでデータ解析

PowerBI Excel でビッグデータ分析

Excel を持っていなくても OK

Stream Analytics の出力先として使用可能

Excel の素早く簡単な可視化をビッグデータ解析に提供

いろいろなソースを食える

Page 52: Azureでデータ解析
Page 53: Azureでデータ解析

コンセプト ビッグデータをビジネスに役立てる

ビジネスに関わる全社員がデータを活用する

現場の人間が自らデータを扱える

Tsubasa Yoshino
ビジネス系の画像に差し替える
Page 54: Azureでデータ解析

今まで

Page 55: Azureでデータ解析

これから

Page 56: Azureでデータ解析

これから

Page 57: Azureでデータ解析

特徴 さまざまなデータソースからデータを流し込める

業務に役立つことがすぐにできる

今日からみんなデータサイエンティスト

Page 58: Azureでデータ解析
Page 59: Azureでデータ解析
Page 60: Azureでデータ解析

GitHub のリポジトリを解析してみる

Microsoft の dotnet リポジトリ

Page 61: Azureでデータ解析
Page 62: Azureでデータ解析

まとめ 誰もがビッグデータを扱う時代がすぐそこ

Azure で手軽にデータ解析ができるようになる◦ まずは , 手軽に始めてみよう◦ PaaS で足りなくなったら , IaaS なりもっとパワーを求めよう◦ 最初からパワーを求めても持て余す

データと睨めっこするのは , 今も昔もとても大事◦ データを見て知見を得るのは , まだ人間のほうが強い◦ データ加工の時間を効率化 → 睨めっこする時間が増やせる

Page 63: Azureでデータ解析