posデータに基づく 価格最適化システム pricetech2010/10/13 · j.johnston,...
TRANSCRIPT
-
POSデータに基づく
価格最適化システム PriceTech
2010年10月13日- わかみず会 -
森本 晧夫
-
1. 価格に関する特売の分析
2. 分析結果の利用① 価格とPI値② 価格帯と価格③ 特売効果④ 特売商品の組合せ
3. POSデータによる顧客プロファイリング① 相関ルールについて② パターン分析について
-
PI値:来店顧客1,000人当りの販売数量
POSデータを使って、価格弾力性を分析検証してみる。
PI値
来店客数
粗利
価格
買物をする人の意識は、以下の3種類に分類できる。「得したな」「まあ、こんなもん」「ちょっと失敗」
出典 ⇒ 澤田求,鈴木隆祐(2001),『チラシで読む日本経済』,光文社新書
⇒ 特価、「と」⇒ 安価、「ま」⇒ 定価、「ち」
1. 価格に関する特売の分析
-
牛乳
0
20
40
60
80
100
120
140
160
165 170 175 180 185 190 195 200
単価
数量PI値
牛乳
0
20
40
60
80
100
120
140
160
165 170 175 180 185 190 195 200
単価
数量PI値
特売分析 ― 価格効果はあるか ―
(1)価格効果はある
価格を下げれば多く売れる。
(2)価格許容限界がある
ある価格以下にしないと価格効果はない。
-
牛乳
0
20
40
60
80
100
120
140
160
165 170 175 180 185 190 195 200
単価
数量PI値
胡瓜
0
50
100
150
200
250
300
350
25 30 35 40 45 50 55 60
単価
PI値
(3)価格感度がある
ある一定範囲の価格では価格効果は同じ。
(4)特売効果は持続しない
毎日同じ商品を特売しても効果がない。
178 179177
連続した3日間
① 6月9日(土)
② 6月11日(月)
③ 6月14日(木)④ 6月12日(火)⑤ 6月13日(水)
特売分析 ― 価格効果はあるか ―
(プロスペクト理論)
-
牛乳
0
20
40
60
80
100
120
140
160
165 170 175 180 185 190 195 200
単価
数量PI値
牛乳
0
20
40
60
80
100
120
140
160
165 170 175 180 185 190 195 200
単価
数量PI値
(5)増客効果はない
一つの商品を値引しても来店数は増えない。
(6)1回の買物量は増えない
価格を下げても1回の買物量は増えない。
3,500
4,000
4,500
5,000
5,500
6,000
6,500
7,000
165 170 175 180 185 190 195 200
単価
来店
客数
特売価格 168円購買点数 10.1点/バスケ購買金額 1,695円/バスケ
値引価格 178円購買点数 12.6点/バスケ購買金額 2,264円/バスケ
通常価格 198円購買点数 13.5点/バスケ購買金額 2,443円/バスケ
特売分析 ― 価格効果はあるか ―
-
玉子
0
50
100
150
200
250
170 180 190 200 210 220 230 240 250
単価
数量
PI値
(7)特売により増えるのは来店頻度
特売に合わせて来店している人がいる。
特売に強い関心のある人
最安値の玉子だけを
購買している人を抽出来店回数 10回/月購買金額 1.4万円/月
特売に全く関心のない人
最高値の玉子だけを
購買している人を抽出来店回数 8回/月購買金額 1.2万円/月
1.2倍
以上より
・ある価格以下にしないと価格効果はない
一定範囲の価格では価格効果は同じ
⇒ 適切な特売価格がある
・毎日同じ商品を特売しても効果がない
⇒ 全部の商品を毎日特売する必要はない
・特売に合わせて来店している人がいる
⇒ 毎日組み合せを変えて特売する
「得したな」商品 (安い)
「まあ、こんなもん」商品 (他店と同じ)
「ちょっと失敗」商品 (高い)
25% 5%
特売分析 ― 価格効果はあるか ―
-
① 価格とPI値
特売分析の(1)と(2)価格効果がある商品を見つけ出し、価格許容限界を分析する。
単価と数量(PI値)の関係を折れ線近似する。
単回帰モデル
ebb ++= xy 10 を単回帰モデルという。
の期待値 の表す直線 を回帰直線という。y Y xY 10 bb +=
与えられた 個のデータから と の推定値を最小二乗法によって求める。n0b 1b
2. 分析結果の利用
-
最小二乗法
残差の2乗和 が最小になるように と を定める。2102 )()( i
ii
iiie xyYyS bb --=-= åå 0b 1b
0))((2
0)(2
210
1
210
0
=---=¶¶
=---=¶¶
å
å
iiii
e
iii
e
xyxS
xyS
bbb
bbb
10 ,bb で偏微分してゼロとおくと
これを整理して
ååå
ååå
=+
=+
iii
ii
ii
ii
ii
i
yxxx
yx
210
10 1
bb
bb
åååå -=÷øö
çèæ -
=+
ii
iii
ii
ii xyyxxxx
yx2
1
10
b
bb
となる。これを正規方程式という。答えは、
( )22
2
2 ååå
å
++=
-=
iii
ii
iixx
xxxx
xxS( )( )
yxnyxnyx
yyxxS
ii
i
iiixy
+-=
--=
å
å
2
xySS
xx
xy
10
1
bb
b
-=
=
-
( ) ( )
( ) ( ){ }
( ) ( )( ) ( )
xxyyxx
xyyy
xxxyyy
iii
ii
ii
iii
iii
iiie
SSSS
S
SSS
xxxxyyyy
xxyy
xyYyS
1
2
211
2211
2
21
210
2
2
2
b
bb
bb
b
bb
-=-=
+-=
-+----=
---=
--=-=
ååå
å
åå 単価が4種類以上あるデータの折れ線決定
×
×
×
×
×× ×
×
×
・・・ ・・・1p 2p ip np
min'',,,,
1,,2
2211
2222
11111
®++=Þ+=Þ
-=
eeeeebXyppebXypp
ni
ni
i
に対して
となる を求める。i
J.Johnston, Econometric Methods, McGraw-Hill, 1963邦訳「計量経済学の方法」上・下、 東洋経済新報社、 236頁
G.C.Chow, Test of Equality between Sets of Coefficients in Two Linear Regressions, Economettrica, vol.28, pp.591-605, 1960F.M.Fisher, Test of Equality between Sets of Coefficients in Two Linear Regressions:An Expository Notes, Economettrica, vol.38, pp.361-366, 1970
経済活動の構造的変化を推定する。 ⇒ Step Wise Chow Test
-
21
21
aabbx
--
-=
11 bxay +=
22 bxay +=1y2y
3y
得 まぁ ちょっとx
y4y
得、まぁ、ちょっと、の分類をどうするか?
xyy ,, 41 は基準になるか?
② 価格帯と価格
商品別に (3) 価格感度、を推定する。
-
売上高( )は、数量と価格の関数となる。そこで、与えられた価格帯で売上高を最大にする価格を求める。数量と価格の関係は、一般に単調減少関数と考えてよい?
21
.max
pxpbaxy
yxstosubs
££+=
=
s
・・・ ①
・・・ ②
・・・ ③
これは解析的に解ける。
aasbbx
sbxax
baxxs
24
02
2
+±-=
=-+
+=
③の制約がなければ、判別式が零のとき は最大となる。s
-
2*
1 2.1 p
abxp £-=£
*2.2 xp £
2*.3 px £
maxyxs =
1p
1p
1p
2p
2p
2p
*x
baxy +=
-
単価と数量の関係11 bxay +=
22 bxay +=
価格幅(range)
lx ux21
21
aabbx
--
-=
特売価格帯(zone)
lx ux
得
まぁちょっと
tx mx
ly
uy
tymy
-
単価と数量は単調には減少しない。
lx ux
tx
mx
maxyxs =
maxyxs =
lx uxtx mx
価格帯の中で最適価格がある。価格の設定
-
総売上高を最大にして、商品数を特売日に均等に割当てるiを商品の添え字、jを特売日の添え字、k∈{ と,ま,ち }を価格種別とする。Pikを商品別単位売上高とする。単位売上高=価格×PI値Njを特売日別来店客数とする。商品別「と」価格の特売日数=bi、特売日別「と」価格の商品数=djとする。xijk∈{ 0,1 }を商品iの価格種別kを特売日jに割当てるための変数とする。
③ 特売効果
商品別の価格変動グラフを見ると (4) 特売効果は持続しない。ことが多い。価格と来店客数、レシート分析、顧客分析によると、(5) 増客効果、(6) 買い物量の増加、は期待できず、(7) 来店頻度は増加するようである。
ⓐのために制約はrankが1落ちる。整数計画法で解くより、良いアルゴリズムを考える
(問題)
目的関数 Σk,i,j Nj・Pik・xijk → max制約
Σj xijと = bi , for iΣi xijと = dj , for jΣk xijk = 1 , for i,jΣi bi = Σj dj ・・・ ⓐ
④ 特売商品の組合せ
IE PriceTech admintestわかみず初夏
-
3. POSデータによる顧客プロファイリング
association analysis (market basket analysis)アソシエーション分析、相関分析、バスケット分析、併売分析とも言う。
アソシエーション分析は、事象発生の関連を分析する。アソシエーション=ルールを抽出するのが目的である。ルール抽出(rule extraction)、ルールマイニング(rule mining)、ルール発見(rule discovery)とも言う。
{ } f¹= miiiI ,,, 21
DT j =IT j Ì
アイテム :トランザクション :全トランザクション :
・・・ 商品・・・ レシート・・・ POSデータ
( ) { }DTX
X iÍ
=sup
アイテム集合 の支持度(support) は、アイテム集合 を含むトランザクションの割合と定義する。XX
アイテムの集合 と があって を満たすものを相関ルール と言う。相関ルール は、トランザクションがアイテム集合 を含むならば、アイテム集合 も含む、と読む。
YX ÞX Y ff =Ç̹ YXIYX ,,YX Þ X Y
-
( ) ( ) ( ){ }D
TYXYXYX i
ÍÈ=È=Þ supsup
相関ルール の支持度は、アイテム集合 を含むトランザクションの割合である。YX Þ YX È
( ) ( )( )( ){ }{ }i
i
TXTYX
XYXYXconf
ÍÍÈ
=È
=Þsup
sup
( ) ( )( )( )
( ) ( )( ){ }
{ } { }iii
TYTXDTYX
YXYX
YYXconfYXlift
Í×Í×ÍÈ
=×È
=Þ
=Þsupsup
supsup
相関ルール の確信度(confidence) は、アイテム集合 と の相関の強さである。アイテム集合 を含むトランザクションのうちアイテム集合 を含むトランザクションの割合である。
YX Þ X YYX ÈX
相関ルール の改善度(improve、lift up) は、 が によって改善されたかどうかを判定する。アイテム集合 を含むトランザクションのうち を含むトランザクションの割合が全集合に適用されたとき の支持度がどのくらい改善されるのかを見る。
YX ÞYX È
XYX
Y
-
R.Agrawal、T.Imielinski、A.Swami :「Mining Associations between Sets of Items in Massive Databases」、Proc. of the ACM-SIGMOD 1993 Int’l Conference on Management of Data、Washington D.C. 、May 1993
apriori algorithmの提案最小support(支持度、サポート) と最小confidence(確信度、信頼度)指定して、rule(アソシエーション、相関)を高速に計算する手法である。
R.Agarawal、R.Srikant:「Fast algorithm for mining association rules in largedatabase」proc.VLDB. pp487-499, Morgan Kaufmann(1994).Rakesh Agrawal
1980年代後半は、Bell研 → 1990年代初めにIBM Almadin Research Center → 現在は、MicroSoft
相関ルールの意味づけや高速アルゴリズムについて、最近も研究が活発に行われているようである。次のURLも最近の研究状況の一端を覗ける入口になるのではないか。
http://www.ar.sanken.osaka-u.ac.jp/~motoda/papers/or02_okada.pdf
-
同時併買データ
分析期間、店舗群で抽出されたレシート明細データに対して、任意の商品iとターゲット商品tの相関計算をする。レシートに関する購買の割合である。
全レシート枚数支持度 = 商品tと商品iを一緒に買う確率=
商品tと商品i をともに含むレシート枚数
該当率 = 商品tと一緒に商品iを買う確率=商品t と商品i をともに含むレシート枚数
商品tを含むレシート枚数
確信度 = 商品iを買ったレシートが商品tを買う確率=商品t と商品i をともに含むレシート枚数
商品iを含むレシート枚数
改善度 = 商品iと全顧客に対する商品tを買う確率の比=商品tを含むレシート枚数/全レシート枚数
確信度
肉類の併買モデル
-
期間併買データ
分析期間、店舗群で抽出し、顧客番号が付与されたレシート明細データに対して、任意の商品iとターゲット商品tの相関計算をする。レシートの顧客別集計に関する購買の割合である。
全顧客数支持度 = 商品tと商品iを一緒に買う確率=
商品tと商品i をともに含む顧客数
該当率 = 商品tと一緒に商品iを買う確率=商品t と商品i をともに含む顧客数
商品tを含む顧客数
確信度 = 商品iを買ったレシートが商品tを買う確率=商品t と商品i をともに含む顧客数
商品iを含む顧客数
改善度 = 商品iと全顧客に対する商品tを買う確率の比=商品tを含む顧客数/全顧客数
確信度
IE お気に入り 228/702併買 併買分析ログイン min 併買分析表
-
課題
多数の商品の中で商品群を同定する語(連続した文字列)を見つけたい。辞書を使わず、少ない語数、抽出した語に意味を付与する。
豚肉の切落し
例題で導出された語はそれぞれ導出商品名を指すと同時に一部の語は他の商品名を指し示している。
商品名(長さL)から連続する文字列(長さl=2,・・・,L)を導出して、その性格を調べてみる。
牛肉、肉の、の切、切落、落し牛肉の、肉の切、の切落、切落し牛肉の切、肉の切落、の切落し牛肉の切落、肉の切落し牛肉の切落し
豚肉、肉の、の煮、煮物豚肉の、肉の煮、の煮物豚肉の煮、肉の煮物豚肉の煮物
豚肉、肉の、の切、切落、落し豚肉の、肉の切、の切落、切落し豚肉の切、肉の切落、の切落し豚肉の切落、肉の切落し豚肉の切落し
例題
牛肉の切落し
豚肉の煮物
-
落し切落
切落し
の切
の切落
の切落し
肉の
肉の切
肉の切落
肉の切落し
豚肉
豚肉の
豚肉の切
豚肉の切落
豚肉の切落し
牛肉の
牛肉の切
牛肉の切落
牛肉の切落し
牛肉
の切落
の切落し
の切
切落し
切落 落し
肉の切
肉の切落
肉の切落し
肉の
煮物の煮肉の豚肉
の煮物肉の煮豚肉の
肉の煮物豚肉の煮
豚肉の煮物
-
語句を導出する過程を木構造で表現する。右方向に開始文字位置を増やし、上下方向は上から語句の文字長の降順にしている。○は導出された語句を表す。矢印は、左の子が最後の文字をひとつ、右の子は最初の文字をひとつ削って導出することを示す。木を一段下がる毎に1文字短くなり、右に行くと開始位置が1文字右に移動する。
A B
C
関アジのたたき 近海アジの塩焼 関アジの塩焼
-
A B
C
関アジのたたき 近海アジの塩焼 関アジの塩焼
アジの塩焼
アルゴリズム概略
語句を導出しながら木を構成する。導出済みの木をなぞって同じ節が見つかったら登録済みの部分木の根である。なぞっている商品と導出中の商品は、この節の語句で同定される。
-
おわり