tokyo webmining37 マルコフ連鎖モデルによるアトリビューション分析_岡川
TRANSCRIPT
マルコフ連鎖モデルによる アトリビューション分析
岡川宏之
2014/6/21
第37回 TokyoWebmining
1
自己紹介
• 岡川 宏之/Hiroyuki Okagawa
• 1980年11月生まれ 33才
• Twitter: hokagawa
• 経歴 – 素粒子物理学/弦理論@大学院
– 半導体フラッシュメモリエンジニア@総合電機メーカー
– データアナリスト@インターネット広告代理店
2
目次
• インターネット広告の特徴 • 広告の評価方法
– 従来の広告評価 – アトリビューションを考慮した広告評価
• 様々なアトリビューション分析モデル • 成果配分モデルの紹介 • マルコフ連鎖モデルの紹介
– データ集計 – アトリビューションマップによる可視化 – モデルの作り方 – 予算ポートフォリオの方法 – 母関数表現
• まとめ (全19ページ)
3
インターネット広告の特徴 その1
4
検索連動型広告 ディスプレイ広告 ビデオ 広告
レコメンド バナー
SNS
純広告
※一例
インターネット広告には色々な出稿の形態とプラットホームがある。
インターネット広告の特徴 その2
ユーザーは購入に至る前に、色々な広告に接触する。
※Google検索連動型広告とYoutubeビデオ広告を出稿している場合の例 5
従来の広告評価
ユーザーが購入直前に接触した広告にのみ成果ポイントを付与
Googleに合計3ポイント付与 └直接評価と呼ばれる方式 6
アトリビューションを考慮した広告評価 ユーザーが購入直前に接触した広告以前の広告にも
“何らかの方法”で評価を与える方法
Youtubeビデオ広告にも何らかの評価を行う。 7
色々なアトリビューション分析
成果配分モデル ベイジアンネットワークモデル
マルコフ連鎖モデル ※本日の内容
次項以降で実際に作ります。
ボルツマンウェイトモデル
※その他にも、色々な文脈でアトリビューションという言葉が使われています。 8
成果配分モデルとは
ユーザーが購買に至るまでに接触した広告に対して、 成果ポイントを割り振る評価モデル
※集計方法と説明がシンプルで分かり易く、現場では施策につなげやすいことがメリット
※配分されたスコアは”アトリビューションスコア”と呼ばれています。
1/3 + 1/3 + 1/3 = 1
9
参考: 成果配分モデルの詳細
に対応固定均等配分
初回重視
ラスト重視
リビューションスコアで接触した広告のアト
からの距離
広告接触回数
初回重みラスト重み
初回重みラスト重み
初回重みラスト重み
,,1
:
1,0,:
0,1,:
exp1
exp
2
LL
xAS
x
xxAS
x
xLxx
CVx
L
L
x
123
5.1
13exp
5.1
23exp
5.1
13exp
5.1
1exp
1.5,3
ASASAS
x
xAS
DL
ラスト重視
アトリビューションスコアの集計ルール 集計例(上記パスの場合)
X=1 X=2 X=3
※上記はexpを使ったが関数形は特に定型はない。 10
マルコフ連鎖モデル データ集計
1
2
0
1 1 3
3 0 0
0 0 0
0.25 0.25 0.50
1.00 0 0
0 0 0
k
M MP Ml
初期接触ベクトル 推移行列 推移確率行列
広告間の推移を2点間のペアに分解して集計する。
11
アトリビューションマップによる可視化
25%
25%
50%
100%
0%
0%
1
2
初期接触ベクトルと推移確率行列を可視化
※このデータを元に、マルコフ連鎖の数学的なモデルを作る(次項より) 12
モデルの作り方 作戦
0次項 広告に1回接触したユーザーのCV数
1次項 広告に2回接触したユーザーのCV数
2次項 広告に3回接触したユーザーのCV数
3次項 広告に4回接触したユーザーのCV数
.
.
.
N次項 広告にN+1回接触したユーザーのCV数
広告接触回数別でユーザーのCV数を予測して、 最後に全て足し算して、全オーダーでCV数の予測する。
13
モデルの作り方 0次項
1k 1l
2l2k
lklklkCV T
22110
11lk
22lk+)
=
=
14
モデルの作り方 1次項
1k 1l
2l2k
1k
2l
1l
2k
11P
22P
12P
21P
1111 lPk
2222 lPk
2121 lPk
1212 lPk+)
=
=
=
=
lPklPklPklPklPkCV T
22221212212111111 15
モデルの作り方 全次数 (モデル完成)
lPkCV NT
N
lPI
Ik
lPPIk
lPklPklkCV
T
T
NTTT
TOTAL
2
¥100
¥50
¥0
C
CPI
IkCOST T
TOTAL
0次と1次の結果から、N次の結果を推測して、 全次数を足し算すると答えが出る。
N次のCV数 全オーダー合算のCV数
全オーダー合算のコスト クリック単価ベクトル
※全オーダーでのコストも同様のロジックで導出可能 16
予算ポートフォリオの方法
rlrMPI
IrkrCV
T
TOTAL
rCrMPI
IrkrCOST
T
TOTAL
22
11
kr
krrk
33232131
23212121
13212111
MrMrM
MrMrM
MrMrM
rM
jijijij rMrMM
iiii rkrkk
1
2
1
r
r
r
予算TOTALrCOST
TOTALr
rCVr
max最適値
数理最適化法で解く条件
変数rを導入して、初期接触ベクトルkと推移行列Mを変化させて、合計コストとCVに対して条件をつけて組合せ最適化する。
変数ベクトル 初期接触ベクトル 推移行列
※出稿量を調整する変数
17
母関数表現
jijij
iii
n i
n
A
iiiiiiiii
CPM
CkK
lM
KClPPPkZn
Annn
exp)(
exp)(
)(1
1)(exp)(
0 }{
1
11132211
??
1
1
1
1
)1(
1
0
n
TOTAL
TOTAL
X
CP
kCOSTX
lP
kCVX
0
)(
)(
nn
ZX
母関数Zを定義して、それの微分の回数で CVやコストが計算できる。
18
まとめ
19
• インターネット広告分野のアトリビューション分析のためのマルコフ連鎖モデルを構成できた。
• 広告間の相互作用を考慮して、予算ポートフォリオシミュレーションができる。つまり、本件のマルコフ連鎖モデルは予測モデルである。
• マルコフ連鎖モデルの母関数表現ができた。高次の項の意味は?
• 他分野への応用は?