利益はデータベースの中にあった!

26
利益はデータベースの中にあった! by Infiniteloop Masaru Yamagishi at OpenIL vol.2 2014/06/20

Upload: infiniteloop

Post on 24-May-2015

931 views

Category:

Technology


4 download

DESCRIPTION

2014年6月20日に開催された勉強会 OpenIL Vol2内で使用されたスライド資料。

TRANSCRIPT

Page 1: 利益はデータベースの中にあった!

利益はデータベースの中にあった!

by Infiniteloop Masaru Yamagishi at OpenIL vol.2 2014/06/20

Page 2: 利益はデータベースの中にあった!

Masaru Yamagishi(capy)

プログラミングは趣味(でした)

小4- : HTML/CSS

中3- : C/C#(XNA Framework)

高1- : 自宅Linuxサーバ(現在はsakura VPS)

最近 : HTML5/CSS3/javascript

現実 : PHP

小樽商科大学で演劇・UX研究をたしなむ

2年半のニート生活(9割Steam)

現在 : 株式会社Infiniteloop 勤務(2014/03-)

ここに家のデスクの画像

Page 3: 利益はデータベースの中にあった!
Page 4: 利益はデータベースの中にあった!

↑イマココ

モンラパン↓

Page 5: 利益はデータベースの中にあった!

本日のお題

データ分析とは何か

データ分析が利益に繋がるワケ

Page 6: 利益はデータベースの中にあった!

何故データ分析?

Page 7: 利益はデータベースの中にあった!

2,000,000,000,000,000,000,000

2011年の1年間に地球上で生成・複製されたデジタルデータ量(byte)

Page 8: 利益はデータベースの中にあった!

サービスのビッグデータ

Wikipedia

Twitter

amazon

facebook

Google

Page 9: 利益はデータベースの中にあった!

ビッグデータ(総務省)

http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html

Page 10: 利益はデータベースの中にあった!

ビッグデータが持つ 3V 特性

Volume : 物理量

データの総量

Variety : 多様性

業務に利用されているリレーショナルDBなどに保存されている構造化データ

テキスト/音声/画像

スマートフォンのセンサーデータ

NFC/カメラ映像

Velocity : 頻度

リアルタイムのデータの増加

Page 11: 利益はデータベースの中にあった!

何故「今」データ分析?

Page 12: 利益はデータベースの中にあった!

何故「今」データ分析?

一昔前 現在

• 高いデータ保管のコスト• HDD : $5 / 1GB(2000年,参考値)

• ハードウェアメンテナンス• 保管場所• etc…

• 低い分析マシンの性能• 大量データの分析はスパコン任せ

• 低コストでほぼ無制限にデータ保管• HDD : $0.04 / 1GB(2014年,参考値)

• クラウドでハードウェアを気にしない

• クラウドで大規模並列処理

Page 13: 利益はデータベースの中にあった!

本日のお題

データ分析とは何か

データ分析が利益に繋がるワケ

Page 14: 利益はデータベースの中にあった!

データ分析?

Page 15: 利益はデータベースの中にあった!

Pentaho

Jaspersoft データマイニング

統計学

ビッグデータ

KPI

KGI

データウェアハウス

データマート

mongodb

Amazon S3

RDB

ビジネスインテリジェンス

マーケティング

アクセスログ

意思決定

アンケート

Excel

Access

標準偏差

機械学習

相加平均

相乗平均

成長率

AU

ARPPU 継続率コンバージョン率

回帰分析

ロジスティクス回帰

正規分布

度数分布

多変量解析

Hadoop

Page 16: 利益はデータベースの中にあった!

データ分析の定義(っぽいもの)

データの分析は、有用な情報を見つけたり、改善案を提案したり、意思決定に役立たせたりという目

的のために、データを詳しく調べ、綺麗にし、変換して、モデリングする手法のことである。

原文) Analysis of data is a process of inspecting, cleaning, transforming, and modeling data

with the goal of discovering useful information, suggesting conclusions, and supporting

decision making.

From Wikipedia(Data_analysis)

Page 17: 利益はデータベースの中にあった!

データ分析の難易度

簡単なもの

Excelで数百行のcsvデータを使ってグラフやピボットテーブルを作って分析

難しいもの

統計学を利用してデータマイニング、仮説検定などを行う

Page 18: 利益はデータベースの中にあった!

データ分析の対象

Page 19: 利益はデータベースの中にあった!

データ分析の手順

目的設定

データ収集

データ加工

データ分析

対策立案

達成評価

収集と加工が大事!

Page 20: 利益はデータベースの中にあった!

本日のお題

データ分析とは何か

データ分析が利益に繋がるワケ

Page 21: 利益はデータベースの中にあった!

因果関係の解明

未来の予測

Page 22: 利益はデータベースの中にあった!

因果関係の解明

1. 利益が伸びていない原因の調査 ユーザーが増えない

課金率が低い

ARPPU※が増えない

2. 利益が伸びている原因の調査 どんなユーザーが課金しているか

どんな要素に対して課金しているか

どんなキャンペーンで課金しているか

※ ARPPU(Average Revenue Per Paid User) : 課金者ごとの平均課金額。

Page 23: 利益はデータベースの中にあった!

未来の予測

現在

Page 24: 利益はデータベースの中にあった!

未来の予測

現在

施策成功

Page 25: 利益はデータベースの中にあった!

本日のまとめ

★ データ分析とは

1. データ内に潜む因果関係を解明すること

2. 過去のデータから未来を予測すること

★ データ分析が利益に繋がる理由とは

1.解明した因果関係によって、利益減少/向上の原因となる要素を改善出来るから

2.予測値と実績値の比較によって、施策が成功したかどうか判断出来るから

Page 26: 利益はデータベースの中にあった!

以上

ご清聴ありがとうございました