adtruthが生み出すgoogle アナリティクス プレミアムの新しい活用方法 第3部

34
AdTruthが生み出す Google アナリティクス プレミアムの 新しい活用方法 株式会社イー・エージェンシー

Upload: sumio-ebisawa

Post on 20-Jul-2015

395 views

Category:

Data & Analytics


0 download

TRANSCRIPT

AdTruthが生み出す

Google アナリティクス プレミアムの

新しい活用方法

株式会社イー・エージェンシー

■Page 1 Copyright© e-agency Inc. All right reserved.

本セミナーの構成

AdTruthがもたらすメリット

ローデータの活用による新しいアクセス解析手法

(活用例)BigQuery連携によるリマーケティングの実践

最後に

質疑応答

AdTruthがもたらすメリット

■Page 3 Copyright© e-agency Inc. All right reserved.

Cookieによるユーザの識別

Cookieを利用することで、だれにどのコンテンツを配信したかをアクセスログに残しておくことができる。

端末その1

端末その2

Webサーバ コンテンツ

A,B,Cを要求

A B C

D E

F

コンテンツ D,E,Fを要求

アクセスログ

時間 ユーザID コンテンツ

10:00 111 Aを送信

10:11 222 Dを送信

10:13 111 Bを送信

10:15 111 Cを送信

10:21 222 Eを送信

10:55 222 Fを送信

Cookie: 111

Cookie: 222

• 訪問を開始したページ、ゴールまで到着したユーザ(ブラウザ)が判別できるので、精度の高いアクセス解析が実現可能となる。

• 訪問開始ページはAとD • Fにアクセスしたのは222

cookie「id:111」を送信

■Page 4 Copyright© e-agency Inc. All right reserved.

アクセス解析における「ユーザ」の定義

「ユーザ」≠「人」ではない – アクセス解析ツールの多くはCookieを利用

– 会員番号やメールアドレスなどと違って人に紐づかない

– パソコン・ブラウザを変えると別のユーザとなる

「ユーザ」≠「デバイス」でもない – Googleアナリティクスは1st Party Cookieでユーザを判別

– ドメインを跨いでCookieの値を共有するのが困難

– 3rd Party Cookieは拒否・定期的に削除されることが多い

• iOS版のSafariではデフォルト拒否

– スマフォ環境ではユーザ識別(の保存)方法が複数存在する

• Cookie / IDFA / Android ID / アプリやOS内の記録領域、など

■Page 5 Copyright© e-agency Inc. All right reserved.

スマフォアプリの開発方法

ネイティブコードによる開発 – iOSならObjective-C、AndroidならJavaなどOS毎の言語を利用

– スマフォOSが提供するAPIにアクセスする

– ゲームなど応答速度が求められる場合、カメラなどのハードウェアを利用する場合に用いられる

HTML5(+JavaScript + CSS)による開発 – WebView呼ばれるアプリに埋め込んだブラウザが、ローカルもし

くはサーバにあるHTMLファイルを読み込んで表示する

– HTML5(+JavaScript + CSS)などWebサイトと同じ言語による開発環境を利用

– ニュース記事など更新が多いコンテンツの場合に利用

■Page 6 Copyright© e-agency Inc. All right reserved.

1つのスマフォで3人のユーザ 標準ブラウザやスマフォアプリ(ネイティブ・WebView)がそれぞれユーザ識別子を生成するので、それぞれが別人と認識される。

標準ブラウザ スマフォアプリ

Webサイトのドメインでの Cookie → 1人

ネイティブアプリの ユーザ識別子 → 1人

WebViewアプリの ユーザ識別子 → 1人

■Page 7 Copyright© e-agency Inc. All right reserved.

AdTruthが全てを解決?

Google アナリティクスで、どのように活用するのか?

■Page 8 Copyright© e-agency Inc. All right reserved.

AdTruthの識別子を計測

カスタムディメンションを利用 – Google アナリティクスでAdTruthの識別子を計測する。

AdTruth ID ページ PV数

07f1c683500913b399d0374de96c2bdb /sports/baseball.html 1

fc3966e814e8b3562d17cc156926d01e /music/pops.html 1

a5c4350488e16aa65b0c3ab805f3332e /company/about.html 1

c4cbc0625c11f0b4015d637a209e271c /products/camera.html 1

1827030b6279525fec01858cd833e5a0 /furniture/desk.html 1

bd9f5886e6515eb7137f7a45d7f879a6 /books/cooking.html 1

27442b808cd8ab54f1ab4ef298940f47 /hobby/flower.html 1

– 分析者はAdTruthの識別子をみたいわけではない。

– この結果をさらに集計することで有益な分析結果が得られるが、サンプリングやダウンロード件数の限界を考えると大規模サイトでは実用的ではない。

■Page 9 Copyright© e-agency Inc. All right reserved.

AdTruthをGAのユーザ識別に利用

ユーザID統合 – Cookie(デバイス)を、「ユーザ」という上位階層で統合

– 1人のユーザが複数のデバイスを利用するという考え方

– ここにAdTruthの識別子を使ったら、会員番号による統合ができなくなる。

AdTruth ID

ga('create', 'UA-XXXX-Y', {

'storage': 'none',

'clientId': '35009a79-1a05-49d7-b876-2b884d0f825b'

});

Cookieの代替え – Google アナリティクスでは、ユーザ識別用のCookieを自分で発行することが

できる。(独自cidの利用)

https://developers.google.com/analytics/devguides/collection/analyticsjs/domains

– 永続性が低いAdTruthの識別子だと再訪の判別やアトリビューション分析に支障がでる

– DoubleClick Cookieと紐づかないのでGDNのリマーケティングに支障がでる

AdTruth ID

■Page 10 Copyright© e-agency Inc. All right reserved.

AdTruthはGAに使えない?

AdTruthの識別子をカスタムディメンションで計測しても、分析者が求めたい解析結果が簡単に得られない。

AdTruthの識別子はユーザの識別には使えない

AdTruthの識別子をGAのCookieの代替に使うデメリットが多すぎる。

全く使う余地がないかと言えば、そういうわけではない

■Page 11 Copyright© e-agency Inc. All right reserved.

効率的な識別子の使い方

ユーザ識別子に求められること – 横断性: ドメイン・ブラウザ・デバイスを跨っても共有できること

– 永続性: 生成された値が継続的に利用できること

– 信頼性: 識別子の揺るぎや重複が発生しないこと

– 普遍性: 異なる環境でも同じ手法が使えること

それぞれの手法のメリット・デメリット 会員番号などユーザに紐づく情報は確実だが、利用できる場合が限られる

アプリに限定すればAndroid IDやIDFAが使える

対象サイト内での永続的なブラウザ識別は1st Party Cookieが強い

短期間のクロスドメイン・デバイス判定はAdTruthが得意

■Page 12 Copyright© e-agency Inc. All right reserved.

Cookieを超えた分析の実現

Cookieでユーザ(デバイス)を識別するGAでは、複数デバイスが利用される現在のユーザ行動を捕捉しきれない。

解析の精度を上げるには、収集したログ(行動履歴)を、複数の識別子を適切に使ってユーザを再判定しなおした上で集計しなおす必要がある。

アクセス解析の限界を 超えるには?

ローデータの活用による 新しいアクセス解析手法

■Page 14 Copyright© e-agency Inc. All right reserved.

■Page 15 Copyright© e-agency Inc. All right reserved.

GAのレポート画面では「日付」「URL」「キャンペーン」といった切り口で集計(解析)された結果が提供される。

集計データを提供するGA

GAの集計データでは調べられないことも多々ある。 – 集計結果の件数が大量に存在する場合

– 予め用意された集計条件以外での切り口

– フィルタ・コンバージョン・コンテンツグループ等の事前設定を変更した集計結果

– 長期間にわたって複数のセッションを跨いだ状態での集計結果

– 他のデータソースと後から連結して集計した結果

■Page 16 Copyright© e-agency Inc. All right reserved.

GAが用意していない切り口での解析 – コンテンツのアトリビューション分析ができる

– コンバージョンフローを自由なページ設定で実現できる

– サイト内バナーのクリック後の行動が追跡できる

個のレベルでユーザの行動を追跡 – Cookieと会員番号を紐づけることで、複数にわたって発生したセッションをユーザの

一連の行動として計測できる。

– 非サンプリング状態で集計すれば、ユーザ数が多くても精度を維持できる。

– 1年を超える長い期間を対象としたアトリビューション分析が可能

– コンバージョン後のユーザ行動も追跡できる

外部データとの自由な連携 – 顧客属性・購買履歴といった情報を後からアクセス解析に追加できる

– コンテンツの作者やカテゴリーといった付随情報を後から加えて解析できる

– 会員登録後の購入金額などコンバージョン結果を後から付与して解析できる

GAの限界を超えるローデータ解析

■Page 17 Copyright© e-agency Inc. All right reserved.

BigQueryとは – Google社が提供するクラウド型のビッグデータ処理サービス

– システム構築は不要で、利用した分だけ料金が発生なので経済的

– 1兆行以上の大規模なデータ分析にも対応するハイパフォーマンス

– データの集計にSQLが利用できる

Googleのビッグデータソリューション

■Page 18 Copyright© e-agency Inc. All right reserved.

Google アナリティクスプレミアムの機能としてGAのローデータがBigQueryを介して提供され、集計データ以上の情報が解析に利用できる

GAのローデータを提供するBigQuery連携

セッション情報 日付・時刻 参照元/キーワード カスタム変数 ビジターID etc…. ヒット情報 ページ イベント トランザクション

GA → BigQuery GAレポートU/I

■Page 19 Copyright© e-agency Inc. All right reserved.

■Page 20 Copyright© e-agency Inc. All right reserved.

BigQueryをデータ解析の中心(ハブ)に位置付けることで、他のシステムからGAのローデータが利活用できるようになる。

データハブとしてのBigQuery

Google アナリティクス

顧客データ etc. (CRM, ERP)

SELECT CONCAT(LPAD(STRING(HOUR(SEC_TO_TIMESTAMP(visitStartTime))), 2, '0'), FLOOR(MINUTE(SEC_TO_TIMESTAMP(visitStartTime)) / 15) AS quarter_hour, COUNT(visitId) AS numberVisits

SQLクエリー データウェアハウス

レポーティング ツールとの連携 BIツール

セッションデータ ヒットデータ

(活用例) BigQuery連携による

リマーケティングの実践

■Page 22 Copyright© e-agency Inc. All right reserved.

GAのリマーケティングとスマートリスト

リマーケティング(広告) – サイトに訪問したユーザを対象にして広告を配信することで、無差別に広告

を表示させるよりも高いコンバージョンが期待できる

– 更に効率を上げるなら、「商品詳細ページを見た」「カートに商品を入れた」といったユーザの絞り込みが必要となる

– リマーケティング対象のユーザ群をリマーケティング(リマケ)リストと呼ぶ

スマートリスト – GAが広告主に代わって最適なリマーケティングリストを作成する機能

– 位置・ブラウザの種別・参照元・セッション滞在時間・ページ深度などGAが収集した情報を元に、機械学習を使ってコンバージョンの確度が高いユーザを見つけ出す。

– 機械学習のパターンは多数のWebサイトで稼働するよう汎用性が高く、個々のサイトの実態を考慮していない。

■Page 23 Copyright© e-agency Inc. All right reserved.

BigQueryを使ったリマケリストの作成

BigQueryのローデータがあれば、サイトの特性を考慮し、外部データを取り込んだ状態でリマケリストが作成できる

Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014

※日本語による注釈は講師

オンラインで 会員登録

顧客DBに登録

BigQueryで ローデータと 顧客情報を連結

統計解析ソフトで確率スコアリストを作成

リマケリストを広告ネットワークに送信

コンバージョンしたユーザ

コンバージョンユーザに似た行動パターンのユーザに広告を露出

② ③

⑤ ローデータの収集

④ ⑥

対象ユーザに広告を配信 ⑧

■Page 24 Copyright© e-agency Inc. All right reserved.

予測とは?

2変量の関係性が線形であった場合、その関係性は、Y=aX+bという一次方程式の形で表すことができる。

このとき、aとbが明らかとなれば、Xの値によって未知のYが計算できる

⇒ 予測に必要なのは、正しくXを設定し、aとbを精度よく推定すること = 数式になったものを「予測モデル」と呼ぶ

Y軸:子の身長(cm)

X軸:両親の平均身長(cm)

Y=aX+b

予測

■Page 25 Copyright© e-agency Inc. All right reserved.

予測の実際: 予測モデルの作成 ある会員があるサービスをコンバージョンする確率を予測する場合・・・

予測するもの 考えられる要因

広告Aクリック有無

サービスCV確率

コンテンツA閲覧回数

他サービスCV回数

最終CVからの日数

モデル化(サービスCV確率=0.05*広告Aクリック有無+0.008*閲覧回数+・・・)し、 各会員に当てはめて確率計算(スコアリング)

・・・

■Page 26 Copyright© e-agency Inc. All right reserved.

予測を利用した広告配信リストの作成 予測モデル構築できれば、当該サービスの広告に対する反応率が顧客個別に

算出できる。

その反応確率降順のリストを作成し、上位から広告配信を行えばROIの改善が期待できる。

広告配信でターゲティング可能な会員

問題: あるサービスの広告をどのターゲットに配信するか

反応確率を付与したターゲティングリスト

予測モデルで反応確率計算 ⇒ 確率降順のリストを作成

■Page 27 Copyright© e-agency Inc. All right reserved.

ローデータを利用した反応率予測 BigQueryに蓄積されたユーザのサイト内行動と広告測定データを結合して解析

することで、より効率なターゲティング広告の配信が可能となる。

サイト内行動データ

• サイト内ページ閲覧回数

• 期間内の閲覧頻度

• 最新閲覧日からの期間

• ・・・ 広告測定データ

• 広告クリック数

• 期間内のクリック頻度

• 最新クリック日からの期間

• ・・・

※上記を、キャンペーンごと、広告種別ごとなど、様々なレベルで集計。

ロジスティック回帰分析

下記の式に基づき、CV確率の 予測を行う。

Y= α + β1X1 + … + βnXn

• Y を目的変数(CV予測確率)、Xnを、Google Analyticsによるサイト内行動データや、広告データなどの説明変数として、回帰モデルを構築

• ロジスティック回帰分析により、変数によらない切片α、および、各説明変数の回帰係数βnを算出

分析 確率スコアリスト

CV確率のスコアリスト作成

ロジスティック回帰により、CV確率を各ユーザに付与する ことができます。

CV確率の高い順に広告出稿を行うことで、全体的な広告効果を保ったまま、広告出稿のコスト削減が可能となる。

データ

順位 ユーザーID CV確率

1 AAA 0.88

2 BBB 0.86

… … …

10000 CCC 0.25

… … …

上位のみに広告出稿

■Page 28 Copyright© e-agency Inc. All right reserved.

確率スコアリスト作成のイメージ コンバージョンしたユーザのレコードから作成した予測モデルを未コンバージョン

ユーザに当てはめ、コンバージョンする確率を予測する。

Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014

※日本語による注釈は講師

オンラインデータ オフラインデータ

コンバージョンしたユーザ

コンバージョンしてないユーザ

予測モデルを作成

■Page 29 Copyright© e-agency Inc. All right reserved.

確率スコアリストをグラフで表現 ユーザごとに算出されたコンバージョンの確率をグラフで表現した結果

予測モデルによって80%のユーザにリーチする数を減らすことができる

80%の効果を得るための 対象ユーザ数

カーブの下の面積の大きさでモデルの精度を評価

予測モデルがない場合の対象ユーザ数

Predictive analysis using Google Analytics Premium and BigQuery Yutaka Koga, gTech-Ads Platform Specialist team, Nov 6, 2014

※日本語による注釈はと着色は講師

最後に

■Page 31 Copyright© e-agency Inc. All right reserved.

イーエージェンシーは Googleアナリティクスプレミアムの

導入について、

豊富な実績数を有します。

サイト規模としては、 数億~数十億強のPVクラスのサイト様をサポート。

また、弊社経由でのプレミアム適応サポートサイト数は、

合計で約700サイトにのぼります(2014/7時点)

おもてなしを科学する

今回の出会いを頂戴しまして、誠に有難うございました。

Googleアナリティクスプレミアムをきっかけとしながら、

貴社のビジネスに貢献できるよう、

尽力してまいる所存です。

ご検討の程、何卒宜しくお願い申し上げます。

質疑応答