posデータに基づく 価格最適化システム pricetech2010/10/13  · j.johnston,...

26
POSデータに基づく 価格最適化システム PriceTech 20101013わかみず会 - 森本 晧夫

Upload: others

Post on 22-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

  • POSデータに基づく

    価格最適化システム PriceTech

    2010年10月13日- わかみず会 -

    森本 晧夫

  • 1. 価格に関する特売の分析

    2. 分析結果の利用① 価格とPI値② 価格帯と価格③ 特売効果④ 特売商品の組合せ

    3. POSデータによる顧客プロファイリング① 相関ルールについて② パターン分析について

  • PI値:来店顧客1,000人当りの販売数量

    POSデータを使って、価格弾力性を分析検証してみる。

    PI値

    来店客数

    粗利

    価格

    買物をする人の意識は、以下の3種類に分類できる。「得したな」「まあ、こんなもん」「ちょっと失敗」

    出典 ⇒ 澤田求,鈴木隆祐(2001),『チラシで読む日本経済』,光文社新書

    ⇒ 特価、「と」⇒ 安価、「ま」⇒ 定価、「ち」

    1. 価格に関する特売の分析

  • 牛乳

    0

    20

    40

    60

    80

    100

    120

    140

    160

    165 170 175 180 185 190 195 200

    単価

    数量PI値

    牛乳

    0

    20

    40

    60

    80

    100

    120

    140

    160

    165 170 175 180 185 190 195 200

    単価

    数量PI値

    特売分析 ― 価格効果はあるか ―

    (1)価格効果はある

    価格を下げれば多く売れる。

    (2)価格許容限界がある

    ある価格以下にしないと価格効果はない。

  • 牛乳

    0

    20

    40

    60

    80

    100

    120

    140

    160

    165 170 175 180 185 190 195 200

    単価

    数量PI値

    胡瓜

    0

    50

    100

    150

    200

    250

    300

    350

    25 30 35 40 45 50 55 60

    単価

    PI値

    (3)価格感度がある

    ある一定範囲の価格では価格効果は同じ。

    (4)特売効果は持続しない

    毎日同じ商品を特売しても効果がない。

    178 179177

    連続した3日間

    ① 6月9日(土)

    ② 6月11日(月)

    ③ 6月14日(木)④ 6月12日(火)⑤ 6月13日(水)

    特売分析 ― 価格効果はあるか ―

    (プロスペクト理論)

  • 牛乳

    0

    20

    40

    60

    80

    100

    120

    140

    160

    165 170 175 180 185 190 195 200

    単価

    数量PI値

    牛乳

    0

    20

    40

    60

    80

    100

    120

    140

    160

    165 170 175 180 185 190 195 200

    単価

    数量PI値

    (5)増客効果はない

    一つの商品を値引しても来店数は増えない。

    (6)1回の買物量は増えない

    価格を下げても1回の買物量は増えない。

    3,500

    4,000

    4,500

    5,000

    5,500

    6,000

    6,500

    7,000

    165 170 175 180 185 190 195 200

    単価

    来店

    客数

    特売価格 168円購買点数 10.1点/バスケ購買金額 1,695円/バスケ

    値引価格 178円購買点数 12.6点/バスケ購買金額 2,264円/バスケ

    通常価格 198円購買点数 13.5点/バスケ購買金額 2,443円/バスケ

    特売分析 ― 価格効果はあるか ―

  • 玉子

    0

    50

    100

    150

    200

    250

    170 180 190 200 210 220 230 240 250

    単価

    数量

    PI値

    (7)特売により増えるのは来店頻度

    特売に合わせて来店している人がいる。

    特売に強い関心のある人

    最安値の玉子だけを

    購買している人を抽出来店回数 10回/月購買金額 1.4万円/月

    特売に全く関心のない人

    最高値の玉子だけを

    購買している人を抽出来店回数 8回/月購買金額 1.2万円/月

    1.2倍

    以上より

    ・ある価格以下にしないと価格効果はない

    一定範囲の価格では価格効果は同じ

    ⇒ 適切な特売価格がある

    ・毎日同じ商品を特売しても効果がない

    ⇒ 全部の商品を毎日特売する必要はない

    ・特売に合わせて来店している人がいる

    ⇒ 毎日組み合せを変えて特売する

    「得したな」商品 (安い)

    「まあ、こんなもん」商品 (他店と同じ)

    「ちょっと失敗」商品 (高い)

    25% 5%

    特売分析 ― 価格効果はあるか ―

  • ① 価格とPI値

    特売分析の(1)と(2)価格効果がある商品を見つけ出し、価格許容限界を分析する。

    単価と数量(PI値)の関係を折れ線近似する。

    単回帰モデル

    ebb ++= xy 10 を単回帰モデルという。

    の期待値 の表す直線 を回帰直線という。y Y xY 10 bb +=

    与えられた 個のデータから と の推定値を最小二乗法によって求める。n0b 1b

    2. 分析結果の利用

  • 最小二乗法

    残差の2乗和 が最小になるように と を定める。2102 )()( i

    ii

    iiie xyYyS bb --=-= åå 0b 1b

    0))((2

    0)(2

    210

    1

    210

    0

    =---=¶¶

    =---=¶¶

    å

    å

    iiii

    e

    iii

    e

    xyxS

    xyS

    bbb

    bbb

    10 ,bb で偏微分してゼロとおくと

    これを整理して

    ååå

    ååå

    =+

    =+

    iii

    ii

    ii

    ii

    ii

    i

    yxxx

    yx

    210

    10 1

    bb

    bb

    åååå -=÷øö

    çèæ -

    =+

    ii

    iii

    ii

    ii xyyxxxx

    yx2

    1

    10

    b

    bb

    となる。これを正規方程式という。答えは、

    ( )22

    2

    2 ååå

    å

    ++=

    -=

    iii

    ii

    iixx

    xxxx

    xxS( )( )

    yxnyxnyx

    yyxxS

    ii

    i

    iiixy

    +-=

    --=

    å

    å

    2

    xySS

    xx

    xy

    10

    1

    bb

    b

    -=

    =

  • ( ) ( )

    ( ) ( ){ }

    ( ) ( )( ) ( )

    xxyyxx

    xyyy

    xxxyyy

    iii

    ii

    ii

    iii

    iii

    iiie

    SSSS

    S

    SSS

    xxxxyyyy

    xxyy

    xyYyS

    1

    2

    211

    2211

    2

    21

    210

    2

    2

    2

    b

    bb

    bb

    b

    bb

    -=-=

    +-=

    -+----=

    ---=

    --=-=

    ååå

    å

    åå 単価が4種類以上あるデータの折れ線決定

    ×

    ×

    ×

    ×

    ×× ×

    ×

    ×

    ・・・ ・・・1p 2p ip np

    min'',,,,

    1,,2

    2211

    2222

    11111

    ®++=Þ+=Þ

    -=

    eeeeebXyppebXypp

    ni

    ni

    i

    に対して

    となる を求める。i

    J.Johnston, Econometric Methods, McGraw-Hill, 1963邦訳「計量経済学の方法」上・下、 東洋経済新報社、 236頁

    G.C.Chow, Test of Equality between Sets of Coefficients in Two Linear Regressions, Economettrica, vol.28, pp.591-605, 1960F.M.Fisher, Test of Equality between Sets of Coefficients in Two Linear Regressions:An Expository Notes, Economettrica, vol.38, pp.361-366, 1970

    経済活動の構造的変化を推定する。 ⇒ Step Wise Chow Test

  • 21

    21

    aabbx

    --

    -=

    11 bxay +=

    22 bxay +=1y2y

    3y

    得 まぁ ちょっとx

    y4y

    得、まぁ、ちょっと、の分類をどうするか?

    xyy ,, 41 は基準になるか?

    ② 価格帯と価格

    商品別に (3) 価格感度、を推定する。

  • 売上高( )は、数量と価格の関数となる。そこで、与えられた価格帯で売上高を最大にする価格を求める。数量と価格の関係は、一般に単調減少関数と考えてよい?

    21

    .max

    pxpbaxy

    yxstosubs

    ££+=

    =

    s

    ・・・ ①

    ・・・ ②

    ・・・ ③

    これは解析的に解ける。

    aasbbx

    sbxax

    baxxs

    24

    02

    2

    +±-=

    =-+

    +=

    ③の制約がなければ、判別式が零のとき は最大となる。s

  • 2*

    1 2.1 p

    abxp £-=£

    *2.2 xp £

    2*.3 px £

    maxyxs =

    1p

    1p

    1p

    2p

    2p

    2p

    *x

    baxy +=

  • 単価と数量の関係11 bxay +=

    22 bxay +=

    価格幅(range)

    lx ux21

    21

    aabbx

    --

    -=

    特売価格帯(zone)

    lx ux

    まぁちょっと

    tx mx

    ly

    uy

    tymy

  • 単価と数量は単調には減少しない。

    lx ux

    tx

    mx

    maxyxs =

    maxyxs =

    lx uxtx mx

    価格帯の中で最適価格がある。価格の設定

  • 総売上高を最大にして、商品数を特売日に均等に割当てるiを商品の添え字、jを特売日の添え字、k∈{ と,ま,ち }を価格種別とする。Pikを商品別単位売上高とする。単位売上高=価格×PI値Njを特売日別来店客数とする。商品別「と」価格の特売日数=bi、特売日別「と」価格の商品数=djとする。xijk∈{ 0,1 }を商品iの価格種別kを特売日jに割当てるための変数とする。

    ③ 特売効果

    商品別の価格変動グラフを見ると (4) 特売効果は持続しない。ことが多い。価格と来店客数、レシート分析、顧客分析によると、(5) 増客効果、(6) 買い物量の増加、は期待できず、(7) 来店頻度は増加するようである。

    ⓐのために制約はrankが1落ちる。整数計画法で解くより、良いアルゴリズムを考える

    (問題)

    目的関数 Σk,i,j Nj・Pik・xijk → max制約

    Σj xijと = bi , for iΣi xijと = dj , for jΣk xijk = 1 , for i,jΣi bi = Σj dj ・・・ ⓐ

    ④ 特売商品の組合せ

    IE PriceTech admintestわかみず初夏

  • 3. POSデータによる顧客プロファイリング

    association analysis (market basket analysis)アソシエーション分析、相関分析、バスケット分析、併売分析とも言う。

    アソシエーション分析は、事象発生の関連を分析する。アソシエーション=ルールを抽出するのが目的である。ルール抽出(rule extraction)、ルールマイニング(rule mining)、ルール発見(rule discovery)とも言う。

    { } f¹= miiiI ,,, 21

    DT j =IT j Ì

    アイテム :トランザクション :全トランザクション :

    ・・・ 商品・・・ レシート・・・ POSデータ

    ( ) { }DTX

    X iÍ

    =sup

    アイテム集合 の支持度(support) は、アイテム集合 を含むトランザクションの割合と定義する。XX

    アイテムの集合 と があって を満たすものを相関ルール と言う。相関ルール は、トランザクションがアイテム集合 を含むならば、アイテム集合 も含む、と読む。

    YX ÞX Y ff =Ç̹ YXIYX ,,YX Þ X Y

  • ( ) ( ) ( ){ }D

    TYXYXYX i

    ÍÈ=È=Þ supsup

    相関ルール の支持度は、アイテム集合 を含むトランザクションの割合である。YX Þ YX È

    ( ) ( )( )( ){ }{ }i

    i

    TXTYX

    XYXYXconf

    ÍÍÈ

    =Þsup

    sup

    ( ) ( )( )( )

    ( ) ( )( ){ }

    { } { }iii

    TYTXDTYX

    YXYX

    YYXconfYXlift

    Í×Í×ÍÈ

    =×È

    =Þsupsup

    supsup

    相関ルール の確信度(confidence) は、アイテム集合 と の相関の強さである。アイテム集合 を含むトランザクションのうちアイテム集合 を含むトランザクションの割合である。

    YX Þ X YYX ÈX

    相関ルール の改善度(improve、lift up) は、 が によって改善されたかどうかを判定する。アイテム集合 を含むトランザクションのうち を含むトランザクションの割合が全集合に適用されたとき の支持度がどのくらい改善されるのかを見る。

    YX ÞYX È

    XYX

    Y

  • R.Agrawal、T.Imielinski、A.Swami :「Mining Associations between Sets of Items in Massive Databases」、Proc. of the ACM-SIGMOD 1993 Int’l Conference on Management of Data、Washington D.C. 、May 1993

    apriori algorithmの提案最小support(支持度、サポート) と最小confidence(確信度、信頼度)指定して、rule(アソシエーション、相関)を高速に計算する手法である。

    R.Agarawal、R.Srikant:「Fast algorithm for mining association rules in largedatabase」proc.VLDB. pp487-499, Morgan Kaufmann(1994).Rakesh Agrawal

    1980年代後半は、Bell研 → 1990年代初めにIBM Almadin Research Center → 現在は、MicroSoft

    相関ルールの意味づけや高速アルゴリズムについて、最近も研究が活発に行われているようである。次のURLも最近の研究状況の一端を覗ける入口になるのではないか。

    http://www.ar.sanken.osaka-u.ac.jp/~motoda/papers/or02_okada.pdf

  • 同時併買データ

    分析期間、店舗群で抽出されたレシート明細データに対して、任意の商品iとターゲット商品tの相関計算をする。レシートに関する購買の割合である。

    全レシート枚数支持度 = 商品tと商品iを一緒に買う確率=

    商品tと商品i をともに含むレシート枚数

    該当率 = 商品tと一緒に商品iを買う確率=商品t と商品i をともに含むレシート枚数

    商品tを含むレシート枚数

    確信度 = 商品iを買ったレシートが商品tを買う確率=商品t と商品i をともに含むレシート枚数

    商品iを含むレシート枚数

    改善度 = 商品iと全顧客に対する商品tを買う確率の比=商品tを含むレシート枚数/全レシート枚数

    確信度

    肉類の併買モデル

  • 期間併買データ

    分析期間、店舗群で抽出し、顧客番号が付与されたレシート明細データに対して、任意の商品iとターゲット商品tの相関計算をする。レシートの顧客別集計に関する購買の割合である。

    全顧客数支持度 = 商品tと商品iを一緒に買う確率=

    商品tと商品i をともに含む顧客数

    該当率 = 商品tと一緒に商品iを買う確率=商品t と商品i をともに含む顧客数

    商品tを含む顧客数

    確信度 = 商品iを買ったレシートが商品tを買う確率=商品t と商品i をともに含む顧客数

    商品iを含む顧客数

    改善度 = 商品iと全顧客に対する商品tを買う確率の比=商品tを含む顧客数/全顧客数

    確信度

    IE お気に入り 228/702併買 併買分析ログイン min 併買分析表

  • 課題

    多数の商品の中で商品群を同定する語(連続した文字列)を見つけたい。辞書を使わず、少ない語数、抽出した語に意味を付与する。

    豚肉の切落し

    例題で導出された語はそれぞれ導出商品名を指すと同時に一部の語は他の商品名を指し示している。

    商品名(長さL)から連続する文字列(長さl=2,・・・,L)を導出して、その性格を調べてみる。

    牛肉、肉の、の切、切落、落し牛肉の、肉の切、の切落、切落し牛肉の切、肉の切落、の切落し牛肉の切落、肉の切落し牛肉の切落し

    豚肉、肉の、の煮、煮物豚肉の、肉の煮、の煮物豚肉の煮、肉の煮物豚肉の煮物

    豚肉、肉の、の切、切落、落し豚肉の、肉の切、の切落、切落し豚肉の切、肉の切落、の切落し豚肉の切落、肉の切落し豚肉の切落し

    例題

    牛肉の切落し

    豚肉の煮物

  • 落し切落

    切落し

    の切

    の切落

    の切落し

    肉の

    肉の切

    肉の切落

    肉の切落し

    豚肉

    豚肉の

    豚肉の切

    豚肉の切落

    豚肉の切落し

    牛肉の

    牛肉の切

    牛肉の切落

    牛肉の切落し

    牛肉

    の切落

    の切落し

    の切

    切落し

    切落 落し

    肉の切

    肉の切落

    肉の切落し

    肉の

    煮物の煮肉の豚肉

    の煮物肉の煮豚肉の

    肉の煮物豚肉の煮

    豚肉の煮物

  • 語句を導出する過程を木構造で表現する。右方向に開始文字位置を増やし、上下方向は上から語句の文字長の降順にしている。○は導出された語句を表す。矢印は、左の子が最後の文字をひとつ、右の子は最初の文字をひとつ削って導出することを示す。木を一段下がる毎に1文字短くなり、右に行くと開始位置が1文字右に移動する。

    A B

    C

    関アジのたたき 近海アジの塩焼 関アジの塩焼

  • A B

    C

    関アジのたたき 近海アジの塩焼 関アジの塩焼

    アジの塩焼

    アルゴリズム概略

    語句を導出しながら木を構成する。導出済みの木をなぞって同じ節が見つかったら登録済みの部分木の根である。なぞっている商品と導出中の商品は、この節の語句で同定される。

  • おわり