googleアナリティクスプレミアム+big...
TRANSCRIPT
Google アナリティクスプレミアム+
Big Queryで実践する
カスタマージャーニー分析
株式会社イー・エージェンシー
0
本セミナーの構成
BigQuery連携で提供されるローデータの価値
BigQuery連携によるリマーケティングの実践
BigQuery連携を拡張する外部サービス
Google アナリティクスが進む方向
質疑応答
1
BigQuery連携で 提供されるローデータの価値
2
ローデータと集計データ
ローデータ – 「生ログ」とも呼び、加工されていないデータを示す
– ビジネス上のイベントの記録とも表現できる • アンケート票、売上伝票、会員登録用紙、などを入力しただけの状態
– 量が多いと全体に目を通すのが困難
集計データ – ローデータを特定の切り口で集計(カウント・合計等)
• アンケート票をQ1の回答でカウント、売上伝票を商品名で集計、など
– 対象となるデータの全容がわかりやすい
– 集計データから別の集計データを求めることが困難
3
Webサーバのログファイル
アクセス解析で「ローデータ」というとWebサーバのログファイルを示すことが多い。
Webサーバには、ユーザからのコンテンツの要求をログ(履歴)としてサーバに残しておくことができる。
4
Webブラウザ Webサーバ
コンテンツを要求
コンテンツ配信 閲覧履歴
アクセス日時や要求されたコンテンツなどを記録
Webサーバ(Apache)のログ(Combined Log Format)の内容
202.221.6.8 - - [19/Oct/2012:06:40:36 +0000] "GET /index.html HTTP/1.1" 200 1330
"http://search.yahoo.co.jp/q=XXX" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1..."
IPアドレス 認証情報 アクセス日時 要求されたコンテンツ 転送データ量
参照元URL ユーザーエージェント
Googleアナリティクス(GA)などのビーコン式のアクセス解析ツールは、JavaScript等を用いて計測専用のサーバにコンテンツの閲覧履歴を送信する。
Webブラウザ Webサーバ
コンテンツを要求
コンテンツ配信
Googleアナリティクス 計測サーバ
画像(ビーコン)の 要求
閲覧履歴
ビーコンによるアクセス情報の収集
5
画像リクエストによるアクセス解析手法をビーコン(タグ)方式と呼ぶ。
送信する画像リクエストをビーコン・トラッキングピクセル・空GIFなどと呼ぶ。
Google アナリティクスに送信するビーコンのURLのパラメータ仕様
www.google-analytics.com/collect ?v=1 // バージョン. &tid=UA-XXXX-Y // GoogleアナリティクスのプロパティID &cid=555 // ユーザの識別子. &t=pageview // ヒットタイプ(ページ閲覧の計測) &dh=mydemo.com // ホスト名 &dp=/home // ページのパス(とクエリーストリング) &dt=homepage // ページのタイトル
Measurement Protocolに従ったURL例
開発者はGoogle アナリティクスのサーバに ユーザの行動を直接送信することが可能となる。
WebサイトもモバイルアプリSDKも、Measurement Protocolで 規定された仕様に従ってビーコン(画像要求)を送信している。
Measurement Protocol とは
6
GAでは、参照元やURLをはじめ、イベント計測やeコマース計測など100を超える情報がブラウザから送信される。
GAが送信する情報(例)
7
GAが送信する情報(例)
8
GAのレポート画面では「日付」「URL」「キャンペーン」といった切り口で集計(解析)された結果が提供される。
集計データを提供するGA
9
GAの集計データでは調べられないことも多々ある。 – 集計結果の件数が大量に存在する場合
– 予め用意された集計条件以外での切り口
– フィルタ・コンバージョン・コンテンツグループ等の事前設定を変更した集計結果
– 長期間にわたって複数のセッションを跨いだ状態での集計結果
– 他のデータソースと後から連結して集計した結果
BigQueryとは – Google社が提供するクラウド型のビッグデータ処理サービス
– システム構築は不要で、利用した分だけ料金が発生なので経済的
– 1兆行以上の大規模なデータ分析にも対応するハイパフォーマンス
– データの集計にSQLが利用できる
Googleのビッグデータソリューション
10
Google アナリティクスプレミアムの機能としてGAのローデータがBigQueryを介して提供され、集計データ以上の情報が解析に利用できる
GAのローデータを提供するBigQuery連携
11
セッション情報 日付・時刻 参照元/キーワード カスタム変数 ビジターID etc…. ヒット情報 ページ イベント トランザクション
GA → BigQuery GAレポートU/I
GAが用意していない切り口での解析 – コンテンツのアトリビューション分析ができる
– コンバージョンフローを自由なページ設定で実現できる
– サイト内バナーのクリック後の行動が追跡できる
個のレベルでユーザの行動を追跡 – Cookieと会員番号を紐づけることで、複数にわたって発生したセッションをユーザの
一連の行動として計測できる。
– 非サンプリング状態で集計すれば、ユーザ数が多くても精度を維持できる。
– 1年を超える長い期間を対象としたアトリビューション分析が可能
– コンバージョン後のユーザ行動も追跡できる
外部データとの自由な連携 – 顧客属性・購買履歴といった情報を後からアクセス解析に追加できる
– コンテンツの作者やカテゴリーといった付随情報を後から加えて解析できる
– 会員登録後の購入金額などコンバージョン結果を後から付与して解析できる
GAの限界を超えるローデータ解析
12
オフライン行動もBigQueryに蓄積できれば、ユーザの接触から申込までの行動を長期間にわたって追跡することができる。
カスタマージャーニーマップの作成
13
広告を見る
(View Thru) 広告クリック
(Click Thru) サイト回遊 C V
OFFLINE& LTV
参照元
認知する 接触する 検討する オンラインで
申し込む オフラインで
申し込む・続ける
スマホ P C タブレット
性別
年齢
趣味趣向
過去の行動条件
オーガニック
ソーシャル
ディスプレイ
リスティング
キャンペーン
プレースメント
クリエイティブ
DSP
ディスプレイ
リスティング
第三者配信 スマホ 閲覧
P C 閲覧
タブレット 閲覧
スマホ C V
P C C V
タブレット C V
オフライン C V
LTV データ
外部データ
BigQueryで捕捉できるユーザ行動
複雑・多様化するインターネット環境において、ユーザは複数の広告に接触してから意思決定を行うことを考慮して効果検証に取り組む必要がある。
コンバージョンに至るまでの広告接触
14
9月23日 コンバージョン
ノーリファラー ノー
リファラー
実際のユーザの広告接触
9月23日 9月19日 コンバージョン
ノー リファラー
9月15日 9月11日
メール Google
オーガニック
ディスプレイ ソーシャル
今までの広告効果の考え方
ラストクリックだけで成果を分配するのではなく、コンバージョンに貢献した全てのチャネルを考慮して評価することが、広告予算の最適化につながる。
アトリビューション効果の評価
15
チャネル コンバージョン数
終点価値
オーガニック 103 ¥945,000
ディスプレイ広告 73 ¥645,750
ソーシャルメディア 30 ¥157,500
チャネル アシスト アシスト価値 ラスト
クリック
アシスト
÷ ラスト
オーガニック 105 ¥992,250 103 1.02
ディスプレイ広告 152 ¥1,162,350 73 2.08
ソーシャルメディア 104 ¥530,250 30 3.47
アシスト効果まで確認
ラストクリックだけの場合 ?
Android Web iOS フィーチャーフォン
POS端末 スマートデバイス スマートテレビ 自動販売機
オムニチャネルでのユーザ行動の把握
16
Measurement Protocolを利用すれば、Webサイトからスマフォアプリ・スマートデバイスでの行動やオフラインでの購買活動までを網羅的に収集し、それらをBigQueryで活用することができる。
BigQueryをデータ解析の中心(ハブ)に位置付けることで、他のシステムからGAのローデータが利活用できるようになる。
データハブとしてのBigQuery
17
Google アナリティクス
顧客データ etc. (CRM, ERP)
SELECT CONCAT(LPAD(STRING(HOUR(SEC_TO_TIMESTAMP(visitStartTime))), 2, '0'), FLOOR(MINUTE(SEC_TO_TIMESTAMP(visitStartTime)) / 15) AS quarter_hour, COUNT(visitId) AS numberVisits
SQLクエリー データウェアハウス
レポーティング ツールとの連携 BIツール
セッションデータ ヒットデータ
BigQuery連携による リマーケティングの実践
18
GAのリマーケティングとスマートリスト
19
リマーケティング(広告) – サイトに訪問したユーザを対象にして広告を配信することで、無差別に広告
を表示させるよりも高いコンバージョンが期待できる
– 更に効率を上げるなら、「商品詳細ページを見た」「カートに商品を入れた」といったユーザの絞り込みが必要となる
– リマーケティング対象のユーザ群をリマーケティング(リマケ)リストと呼ぶ
スマートリスト – GAが広告主に代わって最適なリマーケティングリストを作成する機能
– 位置・ブラウザの種別・参照元・セッション滞在時間・ページ深度などGAが収集した情報を元に、機械学習を使ってコンバージョンの確度が高いユーザを見つけ出す。
– 機械学習のパターンは多数のWebサイトで稼働するよう汎用性が高く、個々のサイトの実態を考慮していない。
BigQueryを使ったリマケリストの作成
20
BigQueryのローデータがあれば、サイトの特性を考慮し、外部データを取り込んだ状態でリマケリストが作成できる
Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014
※日本語による注釈は講師
オンラインで 会員登録
顧客DBに登録
BigQueryで ローデータと 顧客情報を連結
統計解析ソフトで確率スコアリストを作成
リマケリストを広告ネットワークに送信
コンバージョンしたユーザ
コンバージョンユーザに似た行動パターンのユーザに広告を露出
①
② ③
⑤ ローデータの収集
④ ⑥
⑦
対象ユーザに広告を配信 ⑧
予測とは?
21
2変量の関係性が線形であった場合、その関係性は、Y=aX+bという一次方程式の形で表すことができる。
このとき、aとbが明らかとなれば、Xの値によって未知のYが計算できる
⇒ 予測に必要なのは、正しくXを設定し、aとbを精度よく推定すること = 数式になったものを「予測モデル」と呼ぶ
Y軸:子の身長(cm)
X軸:両親の平均身長(cm)
Y=aX+b
予測
予測の実際: 予測モデルの作成
22
ある会員があるサービスをコンバージョンする確率を予測する場合・・・
予測するもの 考えられる要因
広告Aクリック有無
サービスCV確率
コンテンツA閲覧回数
他サービスCV回数
最終CVからの日数
モデル化(サービスCV確率=0.05*広告Aクリック有無+0.008*閲覧回数+・・・)し、 各会員に当てはめて確率計算(スコアリング)
・・・
予測を利用した広告配信リストの作成
23
予測モデル構築できれば、当該サービスの広告に対する反応率が顧客個別に算出できる。
その反応確率降順のリストを作成し、上位から広告配信を行えばROIの改善が期待できる。
広告配信でターゲティング可能な会員
問題: あるサービスの広告をどのターゲットに配信するか
反応確率を付与したターゲティングリスト
予測モデルで反応確率計算 ⇒ 確率降順のリストを作成
ローデータを利用した反応率予測
24
BigQueryに蓄積されたユーザのサイト内行動と広告測定データを結合して解析することで、より効率なターゲティング広告の配信が可能となる。
サイト内行動データ
• サイト内ページ閲覧回数
• 期間内の閲覧頻度
• 最新閲覧日からの期間
• ・・・ 広告測定データ
• 広告クリック数
• 期間内のクリック頻度
• 最新クリック日からの期間
• ・・・
※上記を、キャンペーンごと、広告種別ごとなど、様々なレベルで集計。
ロジスティック回帰分析
下記の式に基づき、CV確率の 予測を行う。
Y= α + β1X1 + … + βnXn
• Y を目的変数(CV予測確率)、Xnを、Google Analyticsによるサイト内行動データや、広告データなどの説明変数として、回帰モデルを構築
• ロジスティック回帰分析により、変数によらない切片α、および、各説明変数の回帰係数βnを算出
分析 確率スコアリスト
CV確率のスコアリスト作成
ロジスティック回帰により、CV確率を各ユーザに付与する ことができます。
CV確率の高い順に広告出稿を行うことで、全体的な広告効果を保ったまま、広告出稿のコスト削減が可能となる。
データ
順位 ユーザーID CV確率
1 AAA 0.88
2 BBB 0.86
… … …
10000 CCC 0.25
… … …
上位のみに広告出稿
確率スコアリスト作成のイメージ
25
コンバージョンしたユーザのレコードから作成した予測モデルを未コンバージョンユーザに当てはめ、コンバージョンする確率を予測する。
Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014
※日本語による注釈は講師
オンラインデータ オフラインデータ
コンバージョンしたユーザ
コンバージョンしてないユーザ
予測モデルを作成
確率スコアリストをグラフで表現
26
ユーザごとに算出されたコンバージョンの確率をグラフで表現した結果
予測モデルによって80%のユーザにリーチする数を減らすことができる
80%の効果を得るための 対象ユーザ数
カーブの下の面積の大きさでモデルの精度を評価
予測モデルがない場合の対象ユーザ数
Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014
※日本語による注釈はと着色は講師
BigQuery連携を拡張する 外部サービス
27
データセラーDMP - Intimate Merger
28
データセラーDMP - Intimate Merger
29
データセラーDMP - Intimate Merger
30
データセラーDMPとの連携により、類推した匿名ユーザの属性情報をBigQueryに蓄積することが可能となる。
類推された 属性データ
BigQueryの検索結果
デバイス推定技術 - AdTruth
31
デバイス推定技術 - AdTruth
32
デバイス推定技術 - AdTruth
33
ソーシャルログイン - GIGYA
34
ソーシャルログイン - GIGYA
35
ソーシャルログイン - GIGYA
36
Google アナリティクス プレミアムが提供する価値
37
デジタルマーケティングプラットフォームがカバーする範囲
38
マーケティング全般の 施策
マーケティング全般の 分析
デジタル広告の 施策
デジタル広告の 分析
デジタルマーケティングプラットフォームとしてのGoogleアナリティクスプレミアム
Performance キャンペーンやマーケティングの ROI を総合的に分析評価できるプラットフォーム
Action 分析結果から、ターゲットユーザーに対するアクションにつながるプラットフォーム
39
イーエージェンシーは Googleアナリティクスプレミアムの
導入について、
豊富な実績数を有します。
サイト規模としては、 数億~数十億強のPVクラスのサイト様をサポート。
また、弊社経由でのプレミアム適応サポートサイト数は、
合計で約700サイトにのぼります(2014/7時点)
おもてなしを科学する
今回の出会いを頂戴しまして、誠に有難うございました。
Googleアナリティクスプレミアムをきっかけとしながら、
貴社のビジネスに貢献できるよう、
尽力してまいる所存です。
ご検討の程、何卒宜しくお願い申し上げます。
質疑応答