利益はデータベースの中にあった!
DESCRIPTION
2014年6月20日に開催された勉強会 OpenIL Vol2内で使用されたスライド資料。TRANSCRIPT
利益はデータベースの中にあった!
by Infiniteloop Masaru Yamagishi at OpenIL vol.2 2014/06/20
Masaru Yamagishi(capy)
プログラミングは趣味(でした)
小4- : HTML/CSS
中3- : C/C#(XNA Framework)
高1- : 自宅Linuxサーバ(現在はsakura VPS)
最近 : HTML5/CSS3/javascript
現実 : PHP
小樽商科大学で演劇・UX研究をたしなむ
2年半のニート生活(9割Steam)
現在 : 株式会社Infiniteloop 勤務(2014/03-)
ここに家のデスクの画像
↑イマココ
モンラパン↓
本日のお題
データ分析とは何か
データ分析が利益に繋がるワケ
何故データ分析?
2,000,000,000,000,000,000,000
2011年の1年間に地球上で生成・複製されたデジタルデータ量(byte)
サービスのビッグデータ
Wikipedia
amazon
ビッグデータ(総務省)
http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h24/html/nc121410.html
ビッグデータが持つ 3V 特性
Volume : 物理量
データの総量
Variety : 多様性
業務に利用されているリレーショナルDBなどに保存されている構造化データ
テキスト/音声/画像
スマートフォンのセンサーデータ
NFC/カメラ映像
…
Velocity : 頻度
リアルタイムのデータの増加
何故「今」データ分析?
何故「今」データ分析?
一昔前 現在
• 高いデータ保管のコスト• HDD : $5 / 1GB(2000年,参考値)
• ハードウェアメンテナンス• 保管場所• etc…
• 低い分析マシンの性能• 大量データの分析はスパコン任せ
• 低コストでほぼ無制限にデータ保管• HDD : $0.04 / 1GB(2014年,参考値)
• クラウドでハードウェアを気にしない
• クラウドで大規模並列処理
本日のお題
データ分析とは何か
データ分析が利益に繋がるワケ
データ分析?
Pentaho
Jaspersoft データマイニング
統計学
ビッグデータ
KPI
KGI
データウェアハウス
データマート
mongodb
Amazon S3
RDB
ビジネスインテリジェンス
マーケティング
アクセスログ
意思決定
アンケート
Excel
Access
標準偏差
機械学習
相加平均
相乗平均
成長率
AU
ARPPU 継続率コンバージョン率
回帰分析
ロジスティクス回帰
正規分布
度数分布
多変量解析
Hadoop
データ分析の定義(っぽいもの)
データの分析は、有用な情報を見つけたり、改善案を提案したり、意思決定に役立たせたりという目
的のために、データを詳しく調べ、綺麗にし、変換して、モデリングする手法のことである。
原文) Analysis of data is a process of inspecting, cleaning, transforming, and modeling data
with the goal of discovering useful information, suggesting conclusions, and supporting
decision making.
From Wikipedia(Data_analysis)
データ分析の難易度
簡単なもの
Excelで数百行のcsvデータを使ってグラフやピボットテーブルを作って分析
難しいもの
統計学を利用してデータマイニング、仮説検定などを行う
データ分析の対象
データ分析の手順
目的設定
データ収集
データ加工
データ分析
対策立案
達成評価
収集と加工が大事!
本日のお題
データ分析とは何か
データ分析が利益に繋がるワケ
因果関係の解明
未来の予測
因果関係の解明
1. 利益が伸びていない原因の調査 ユーザーが増えない
課金率が低い
ARPPU※が増えない
2. 利益が伸びている原因の調査 どんなユーザーが課金しているか
どんな要素に対して課金しているか
どんなキャンペーンで課金しているか
※ ARPPU(Average Revenue Per Paid User) : 課金者ごとの平均課金額。
未来の予測
現在
?
?
未来の予測
現在
施策成功
本日のまとめ
★ データ分析とは
1. データ内に潜む因果関係を解明すること
2. 過去のデータから未来を予測すること
★ データ分析が利益に繋がる理由とは
1.解明した因果関係によって、利益減少/向上の原因となる要素を改善出来るから
2.予測値と実績値の比較によって、施策が成功したかどうか判断出来るから
以上
ご清聴ありがとうございました