100人のための統計解析 和食レストラン編
DESCRIPTION
TRANSCRIPT
第2章 和食レストラン
過去3か月に来店経験ある人に対して,平日夜の利用に関するアンケートデータ(1000人分)
調査ID
年齢 性別 家族構成CM
イメージ来店回数
利用金額
定食 麺 丼 デザートサイド
メニューソフト
ドリンクお酒
5 54 女性 未婚 3 0 0 1 0 1 0 0 0 0
9 46 女性 未婚 2 0 0 1 0 0 0 0 0 0
11 27 女性 未婚 3 0 0 1 1 0 0 0 1 0
12 35 女性 未婚 3 1 2200 1 0 1 0 0 1 0
… … … … … … … … … … … … … …
908 33 男性 既婚(子供なし) 3 0 0 1 1 1 0 0 0 0
965 35 男性 既婚(子供なし) 3 6 700 1 1 1 0 0 0 1
979 46 男性 既婚(子供なし) 4 1 2000 1 1 0 0 1 0 1
987 34 男性 既婚(子供なし) 3 0 0 1 1 1 0 0 0 0
昼夜問わずメニュー注文経験
1来店あたりの典型的な利用金額
平日夜の来店回数
書籍の手法&結論
CMイメージ お酒 年齢 定食 女性
• 来店回数×利用金額 を 総利用金額 と定義し,
応答変数 として重回帰
• Rでは以下と同じ
– lm( 総利用金額 ~ 年齢 + 性別 + 既婚(子供なし) + 既婚(子供あり) + CMイメージ +
定食 + 麺 + 丼 + デザート + サイドメニュー + ソフトドリンク + アルコール, data=d)
• 結論: 総利用金額upするには,
はじめは 散布図行列
• corrplot {corrplot}
– キレイ 散布図が表示できない
• pairs {graphics}– インストール不要 相関係数出すにはカスタム必要
• ggpairs {GGally}– キレイ {ggplot2}に慣れが必要
☺ ☹
☺ ☹
☺ ☹
計算時間来店回数 × 利用金額 の
RMSE (円)
個体差なしモデル 6 min (Stan) 4607
個体差ありモデル 60 min (Stan) 1272
(参考) 重回帰 lm() < 1 s 4623
予測値(円)
誤差(円)
以降では 個体差なしモデル を紹介
結果 | 回帰係数
• 夜間に来店する確率 up:
–年齢 CMイメージ 女性 定食
• 常連度 up:
–年齢 デザート CMイメージ 女性
• 1来店あたりの利用金額 up:
–既婚(子供なし) 女性 既婚(子供あり)お酒 年齢