性別・年代別による顧客の購買行動の分析 · mは算術平均...

37
卒業研究論文 性別・年代別による顧客の購買行動の分析 学籍番号 01D8101011L 土屋 俊和 中央大学理工学部情報工学科 田口研究室 2005 3

Upload: others

Post on 20-Jun-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

卒業研究論文

性別・年代別による顧客の購買行動の分析

学籍番号 01D8101011L

土屋 俊和

中央大学理工学部情報工学科 田口研究室

2005年 3月

Page 2: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

あらまし 現在スーパーマーケットではクーポン券を配布したり,今までよりも営業時間を延長す

るなどして新しい顧客を獲得しようとしている.また,繰り返し来店してもらうと同時に,

顧客の購買行動を把握するため,ポイントカードを導入する店舗も多い.このカードのデ

ータを用いてより顧客好みの店舗を運営しようとしている.しかし顧客は多種多様な価値

観を持っているため必ずしも顧客が気に入るスーパーマーケットになっていない. そこで本研究では,某スーパーマーケットの ID 付き POS データの「性別」と「年代」に着目し,この 2 つの要因で顧客の購買行動がどのように異なるかを調べる.まず顧客全体を 2つの要因にわけ,顧客がスーパーを利用する回数,1回の買物における購入金額,購入点数,購入品の特徴などを調べる.また,繰り返しのある二元配置分散分析を用いて購

入品の値段の違いの有無を判定する. キーワード:二元配置分散分析, 検定 F

Page 3: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

目次 第 1章 はじめに.................................................................................................................. 1 第 2章 ID付き POSデータ ................................................................................................ 2 第 3章 統計学における基本事項 ......................................................................................... 4

3.1 統計学で用いるデータの種類 .............................................................................................4 3.2 記述統計学..........................................................................................................................4 3.3 母集団と標本 ......................................................................................................................5 3.4 検定 ................................................................................................................................5 F3.5 検定統計量,棄却域,有意水準 .........................................................................................6 3.6 検定の 2種の誤り...............................................................................................................6

第 4章 二元配置法 .............................................................................................................. 8

4.1 重回帰分析における偏差平方和と回帰平方和 ....................................................................8 4.2 分散分析 .............................................................................................................................8 4.3 交互作用 .............................................................................................................................8 4.4 繰り返しのある二元配置分散分析 ......................................................................................9 4.5 検定の手順........................................................................................................................10

第 5章 購買行動の分析 ..................................................................................................... 12

5.1 顧客の性別・年代別の割合...............................................................................................12 5.2 来客頻度 ...........................................................................................................................13 5.3 購入金額と購入点数 .........................................................................................................15 5.4 購入品の割合 ....................................................................................................................17 5.5 商品の値段に対する顧客の感覚 .......................................................................................20

第 6章 まとめ ................................................................................................................... 32 謝辞 ..................................................................................................................................... 33 参考文献 .............................................................................................................................. 34

Page 4: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

第 1章

はじめに スーパーマーケットに来店する要因は個々の顧客により異なる.様々な顧客を取り込む

ため,近年スーパーマーケットは深夜まで営業を行っていたり,個々のスーパーマーケッ

ト独自の商品を開発するなどして他店との差別化を図り,より集客量をあげて少しでも利

益を上げようとしている.一方,1度来店した顧客にはもう 1度来店してもらうため,ポイントカードを渡している店舗が多い.ポイントカードは顧客に割引を提供すると同時に顧

客の購買品のデータを収集している.この POSデータをもとに,より顧客が求めている商品を提供しようとしている.しかし,顧客ごとにあわせた店舗経営を行うことは難しい. そこで,本研究では ID 付き POS データを用いて,購買行動の違いがあると考えられる性別や年代から顧客がどのような購買行動をするかを分析する.そして,性別,年代別の

特徴を見出す.

1

Page 5: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

第 2章

ID付き POSデータ 本研究で用いるデータは,日本オペレーションズ・リサーチ学会マーケティング・エン

ジニアリング研究部会提供の ID付き POSデータである. POSとは Point of Salesの略で,販売時点管理などと訳される.このデータは店舗における販売商品を単品ごとに記録したものである.ID 付きになると,商品を購入した顧客の住所や年齢などもデータに加えられている.このデータの特徴は,単品ごとの販売数量を

実売価格とともに最小のタイムラグで把握できるところである. 本研究で用いるデータの内容は,次のとおりである. (1)期間 2000年 4月 21日(金)~2000年 10月 20日(金) (5月 17日(水)と 8月 21日(月)は休店日.181日営業) (2)総顧客数 14182人 (3)データ項目

①属性データ ・顧客番号

・顧客年齢 ・顧客性別 ・住所 1(都道府県名) ・住所 2(市区町村名など) ・住所 3(町村名など) ②取引データ ・購入年月日 ・ラインコード ・ライン名(商品カテゴリ大分類)

(アイス,エチケット,塩干,加工品,菓子ギフト,キッチン,牛

肉,果物,鶏肉,行楽用品,米,サニタリー,嗜好品,収納用品,

食卓用品,食品ギフト,鮮魚,洗剤ギフト,惣菜 S,卵,調味料,調理用品,乳製品,練物日配,農海産物,ハウスケア,パーツ,

パン,ビューティーアクセサリー,袋菓子,豚肉,ヘアケア,米

飯,水物日配,メイク&スキンケア,野菜,ライフ,リビング,

冷凍食品) ・クラスコード ・クラス名(商品カテゴリ小分類) ・商品コード

2

Page 6: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

・商品名 ・購入単価 ・購入点数

クラス名の中には,誤字脱字と思われる言葉や理解できない言葉がいくつか存在してい

る.

3

Page 7: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

第 3章

統計学における基本事項 3.1 統計学で用いるデータの種類 統計学で用いられるデータには大きく分けて,2つの種類がある.1つめは数量データである.数量データとは,単位のもつ特定の量的性質を計測することによって得られるデー

タのことをいう.例えば,人口の年齢や労務者の年収などがあげられる.このデータは,

データ間の大小関係を比較する際や,演算を行うときに意味のある数値となるデータであ

る. 2つめは分類データである.分類データとは,個々の単位がどのような性質をもつかを識別することにより得られるデータである.例えば,性別や血液型などがあげられる.この

データは,各分類が全体の何%であるかという比率を計算する際に用いられる. 3.2 記述統計学 数量データで構成される集団の特色や傾向を統計学を用いて表現する場合,基本統計量

と分布の2つの方法がある.基本統計量は,集団の特色や傾向をただ 1 つの値で表現する方法をいう.分布とは,集団の特色や傾向を分布表やグラフを用いて判断する方法をいう.

ここで,基本統計量を計算するための方法をいくつかあげる. (1)偏差平方和 偏差平方和は,集団に属するデータのばらつき具合を 1 つの値で表現したものである.求めた値が大きいほどばらつきが大きいことを示す.偏差とは個々のデータから平均値を

引いた値であり,それを 2 乗し,合計したものが偏差平方和の値である.計算式は次のように表す.

( )∑ −= 2mxS i

ただし はデータ LL ,,,, 21 ixxxmは算術平均

(2)分散 偏差平方和はデータの個数を考慮せずに集団の変動を把握している.したがって,デー

タの異なる 2 つの集団の変動を比較する場合,偏差平方和は適用できない.このような場合,偏差平方和をデータ数で割った分散を用いる.

( )n

mxS i∑ −=

2

(3.1)

ただし,nはデータ数

4

Page 8: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

LL ,,,, 21 ixxx はデータ mは算術平均

一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.この分散を不偏分散(標本分散)という.

( )1

2

−= ∑

nmx

S i (3.2)

3.3 母集団と標本 調査を行う場合,集団全体を調査することが不可能な場合がある.そこで,一部分を調

査し,そこから全体を把握することを考える.集団の一部分を対象とする調査を標本調査

という.集団の一部分を標本,もとの集団を母集団という.また,母集団から抽出された

標本の平均・分散などを標本統計量という.特に,この場合の分散の計算は(3.2)式を用いる. 3.4 検定 F データにおける「散らばり」の相違を検定するには,データの散布度を示す分散を用い

て検討する.この検定は分散間の差異に関するものであり,データで得られた分散間の差

異が,母集団間でも実質上の差異と認めることができるのかについて推測する検定方法で

ある.2つのデータにおける分散の相違が母集団でも認められるのか否かについて調べる検定を 検定という. F 検定では,(3.3)式を用いて 値と呼ばれる統計量を算出し, 分布(図 3.1)を利用して棄却域と採択域を分ける値を設定し,帰無仮説の採否を判断するものである.

F F F

2

2

)1()1(

bab

aba

snnsnn

F−

−= (3.3)

ただし は 値 F F

an は のデータ数 a

bn は のデータ数 b2

as は の分散 a2

bs は の分散 b

0 1 2 3 4 5 6

図 3.1 分布の例F

5

Page 9: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

3.5 検定統計量,棄却域,有意水準 検定を行う場合,まず仮説を決める.統計の仮説検定では常に,択一的な 2 つの仮説を設定し,その 1 つを帰無仮説と定める.帰無仮説とは,母平均と比較値に差がないという仮説である.これに対するもう 1 つを対立仮説と定める.対立仮説とは,母平均と比較値に差があるという仮説である. 検定される仮説を決めた後に検定の方法,判定の基準を決定する.このためにまず,仮

説を採択するか,棄却するかを判断する標本統計量を選定する.この統計量は標本観察の

結果から計算され,検定統計量という.まず検定仮説が正しいとして,この検定統計量の

分布を考える.統計的仮説検定ではこのような検定統計量の分布が前提であり検定統計量

の分布が明らかな場合のみ検定が可能である.検定統計量の分布がわかれば,その全変域

を棄却域と採択域に分割する.そして,もし観察標本から計算した検定統計量が棄却域の

範囲内であるならば検定仮説を棄却し,採択域の範囲内ならばこれを採択する.仮説が正

しいときに検定統計量が棄却域に入る確率を決めるがこれを有意水準という.有意水準の

大きさは検定者が任意に定める. 棄却域を左右両側にとる検定方法を両側検定,左右どちらか一方だけとる方法を片側検

定という.両側検定は,検定した値がある値に等しいか否かを判定するときに行う手法で

ある.一方片側検定は母数がある値より大きい,または小さいか否かを判定するときに行

う手法である. 3.6 検定の 2種の誤り 統計的仮説検定では,検定仮説を採択したときも,仮説が必ずしも間違いではないとい

えない.反対に仮説を棄却したとしても,仮説は必ずしも誤りであるというわけではない. 以上のことから,仮説検定における誤った判断には 2 つの場合がある.1つは仮説が真であるときに起こる誤りで,正しい仮説を棄却する誤りである.この誤りを第一種の誤り

といい,このような誤りをする確率をα とするとこれは有意水準にほかならない.もう 1つは仮説が間違っているときに起こる誤りで,間違った仮説を採択する誤りである.この

誤りを第二種の誤りといい,このような誤りをする確率を β とする.以上のことを表にまとめると表 3.1のようになる. この 2 種類の誤りの確率α , β はどちらも小さいほど良いが,どちらか一方を小さくしようとすると他方が大きくなるという関係になっている. そこで一般には,第一種の誤りをおかすことのほうが第二種の誤りに比べてより重大で

あるという考えに基づき,重要と思われる仮説のほうを に設定する. の確率0H 0H α の大きさを第一種,第 2種の誤りの許容できる限度に小さく抑え,通常 5%または 1%と定めて,その条件のもとで第二種の誤りの確率ができるだけ小さくなるように検定の判定点を定め

る.

6

Page 10: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

表 3.1 仮説の真偽と検定による決定の関係 検定による決定

仮説の真偽 0H を採択 0H を棄却

0H は真

0H は偽 正しい決定(確率 α−1 ) 第二種の誤り(確率 β )

第一種の誤り(確率α =有意水準) 正しい決定(確率 β−1 =検出力)

7

Page 11: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

第 4章

二元配置法 4.1 重回帰分析における偏差平方和と回帰平方和 重回帰分析とは, 個の説明変数とある目的変数 の間に式(重回帰式)をあてはめ,

目的変数の変動によってどの程度影響されるかを分析する手法である. k y

線形の場合の重回帰式を,

kk xqxqxqpy ++++= L2211 (4.1)

と表し,(4.1)式の左辺を実績値,右辺を理論値という.重回帰分析における偏差平方和とは,実績値 と平均iy yの差の 2乗和のことをいい,

( )∑ −=2

yyS iyy

と表される. 重回帰分析における回帰平方和とは,理論値 iy~ と平均 yの差の 2乗和のことをいい,

( )∑ −=2~ yyS iR

と表される. 4.2 分散分析 データの変動を因子の主効果,交互作用,誤差などの平方和に分解し,主効果および交

互作用などの要因効果が誤差に対して有意であるかを検定する方法である. 因子とは,多数のばらつきの中から特にとりあげたばらつきの原因のことを指し,水準

とは因子の各項目をいう.また,主効果とは,水準平均と全データの平均の差をいう. 4.3 交互作用 交互作用とは 2 因子が絡み合って作り出す相乗効果のことをいい,一方の因子の条件によってもう一方の因子の条件間の差が異なるとき,それらの因子の間には交互作用がある

という.繰り返しのある二元配置の分散分析では,2因子の仮説がそれぞれ棄却されるか否かの他に,交互作用が得られる.交互作用が認められるか否かはグラフを描くとわかる.

一般的に 2 つの因子 Aと Bに交互作用があれば折れ線は交差し,交互作用がなければ折れ線は平行の形態になる.

8

Page 12: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

4.4 繰り返しのある二元配置分散分析 同じ水準のデータが複数存在し,2つの因子がデータに関与していると仮定し,その因子の影響の有無を調べる分析を繰り返しのある二元配置分散分析という. 因子 Aの水準数を ,因子a Bの水準数をbと定義する.因子 A,因子 B,交互作用の変動(平方和)および,誤差変動を次の公式より求める.ただし, はデータの偏差平方和

を表す. TS

・ 因子 Aの変動 bbaA SSS −= ,

・ 因子 Bの変動 abaB SSS −= ,

・ 交互作用の変動 baabbaBA SSS ,,, −=×

・ 誤差変動 BABATE SSSSS ×−−−=

abbaS ,, :因子 Aの水準,因子 Bの水準,交互作用を変数とする重回帰分析における回帰平方和

baS , :因子 Aの水準,因子Bの水準を変数とする重回帰分析における回帰平方和

aS :因子 Aの水準を変数とする重回帰分析における回帰平方和

bS :因子Bの水準を変数とする重回帰分析における回帰平方和 次に,各平方和に対する自由度(比較の数)を考える.総平方和 の自由度は 個のデー

タが得られることから,次式より求められる. TS n

1−= nfT また の自由度 , の自由度 は,それぞれ 個, 個の各因子のカテゴリー

数の合計なので AS Af BS Bf AC BC

1−= AA Cf 1−= BB Cf

と表せ, , から交互作用の自由度は Af Bf

BABA fff ×=× と表せる. 以上の計算から得られた自由度を用い,誤差の自由度 は Ef

BABATE fffff ×−−−=

BABA ffffn ×−−−−= 1 ( )( 11 )++−= BA ffn

と表せ, , , の不偏分散は AS BS ES

A

AA f

SV = (4.2)

B

BB f

SV = (4.3)

BA

BABA f

SV×

×× = (4.4)

9

Page 13: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

E

EE f

SV = (4.5)

となる. (4.2),(4.3),(4.4)式の値と(4.5)式の値の比が F 分布に従うことが知られているので,因子 A,因子 B,交互作用の分散比は,

E

AA V

VF = (4.6)

E

BB V

VF = (4.7)

E

BABA V

VF ×× = (4.8)

となる. , , と境界値を比較して,帰無仮説が棄却されるか否かを検定する. AF BF BAF ×

繰り返しのある二元配置分散分析をまとめた表(分散分析表)を表 4.1に示す.

表 4.1 繰り返しのある二元配置分散分析の分散分析表 変動要因 平方和(変動) 自由度 分散 分散比

A (行) AS Af AV AF B (列) BS Bf BV BF

BA× (交互作用) BAS × BAf × BAV × BAF × E(誤差) ES Ef EV 合計 TS Tf

4.5 検定の手順 繰り返しのある二元配置分散分析の検定は以下の手順で行う.

1.因子仮説の設定 帰無仮説 :「因子変動は,誤差変動と等しい(因子効果はない)」 0H対立仮説 :「因子変動は,誤差変動より大きい(因子効果がある)」 1H

2.各統計量の計算

帰無仮説のもとで統計量(分散比) , , は,それぞれの自由度の 分布に

従う. AF BF BAF × F

3.有意水準α の決定,および各棄却域の計算・判定

),,( αEAA ffFF ≥ ならば帰無仮説を棄却する(因子効果がある). ),,( αEBB ffFF ≥ ならば帰無仮説を棄却する(因子効果がある).

10

Page 14: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

),,( αEBABA ffFF ×× ≥ ならば帰無仮説を棄却する(因子効果がある). 上記式を満たさない場合は,帰無仮説を棄却できない.よって因子効果はないと判断

する.

11

Page 15: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

第 5章

購買行動の分析 本章は,顧客の性別,年代に着目し,顧客の購買行動を分析し,性別,年代別独自の特

徴を見つける.まず,データを性別,年代別に分け,データから見えてくる顧客の購入パ

ターンの性別,年代別違いを分析する. 5.1 顧客の性別・年代別の割合 ID 付き POS データを性別,年代別に分ける.ただし,データ中に 122 歳および 2000歳と明記されている顧客(男性 4人,女性 49人)が存在するが,それらの顧客は実在しないので,その顧客を除いた 14,129人を対象とする.このデータを性別,年代別に分けた表を表 5.1に示す.表 5.1から,女性が多いことがわかる.また,性別ごとの顧客の年代の割合を図 5.1に示す.図 5.1より,対象としているスーパーマーケットは男女共に 40代,50代の顧客の割合をピークとして,そこから年代が上がる,下がる傾向にある.

表 5.1 データの性別・年代別人数

10~20代 30代 40代 50代 60代 70代 80代以上

男性 95 269 539 526 337 220 62 女性 826 2202 3329 2873 1680 915 256

7%

18%14%

8% 2%

10代~20代

30代

40代

26

16%

11%3% 5%

13%

女性

27%24%

50代

60代

70代

80代以上

26%

%

男性

図 5.1 性別・年代別の顧客構成比

12

Page 16: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

5.2 来客頻度 商品を購入してもらうためには,まずスーパーマーケットに来店してもらわなければな

らない.そこで,顧客が曜日ごとにどの程度来店しているかを 5.1節で述べたデータを用いて性別と年代別に特徴があるか調べる.ここで,曜日ごとに来店した性別,年代別の人数

を,性別,年代別の全顧客で割った割合を平均来客人数の割合と定義する.男性と女性の

平均来客人数の割合を図 5.2,図 5.3に示す. 図 5.2を見ると年代ごとに平均来客人数の割合が異なっている.これは,男性が曜日を特

定せずに来店していると考えられる.また休日は,50 代以下の平均来客人数の割合が増えているのに対し,高齢層(60代以上)に関しては平均来客人数の割合が減少している.50代以下の顧客が休日に増加する理由として,50 代以下の顧客は平日に働いているため,休日に来店する割合が高くなると考えられる.高齢層は来店できる曜日に制限がないため,

混雑する休日を避け,平日に買い物をする.従って平均来客人数の割合が低くなると考え

られる. 図 5.3から女性は男性と違い,どの年代を見ても平均来客人数の割合がほぼ同じである.特に火曜日は,対象としているスーパーマーケットで特売を行っているため,どの年代も

平均来客人数の割合が 1 番高くなっていると考えられる.また火曜日に買い物を済ませてしまうため,水曜日は平均来客人数の割合が低くなると考えられる.休日は 10 代から 20代を除き平均来客人数の割合が減少している.10代から 20代は学生や勤めている女性が多く平日に買い物ができないため,日曜日に平均来客人数の割合が高くなると考えられる.

9.00%

10.00%

11.00%

12.00%

13.00%

14.00%

15.00%

16.00%

17.00%

18.00%

19.00%

月曜日

火曜日

水曜日

木曜日

金曜日

土曜日

日曜日

年代

来客人数の割合

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.2 男性の曜日別平均来客人数の割合

9.00%

10.00%

11.00%

12.00%

13.00%

14.00%

15.00%

16.00%

17.00%

18.00%

19.00%

月曜日

火曜日

水曜日

木曜日

金曜日

土曜日

日曜日

年代

来客人数の割合

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.3 女性の曜日別平均来客人数の割合

13

Page 17: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次に,この来客人数の割合が毎週同じ割合かどうかを調べる.来客人数の割合における

分散値を図 5.4,図 5.5に示す. 図 5.4 より,来客人数の割合の高い 80 代以上の男性は分散値も大きい.従って 80 代以上の男性は,日にちや曜日を特定せずに来店していると考えられる. 図 5.5 より,80 代以上の女性も分散値が大きい.しかし,図 5.4 と比較すると女性の方が来客人数の割合のばらつきは小さいことが分かる. 以上のことから,男性は特売日という意識が低いが,女性は,特売日の意識が高いため

商品の価値や価格に敏感であると考えられる.理由として,女性は主婦が多いと推測でき

るため,経済的な面を考慮しなければならないことや,時間的な余裕があるので商品を比

較できることなどが挙げられる.

00.000250.00050.000750.001

0.001250.00150.001750.002

0.002250.00250.002750.003

月曜日

火曜日

水曜日

木曜日

金曜日

土曜日

日曜日

曜日

平均来客人数の割合の分散値

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.4 男性の来客人数の割合における分散値

00.000250.00050.000750.001

0.001250.00150.001750.002

0.002250.00250.002750.003

月曜日

火曜日

水曜日

木曜日

金曜日

土曜日

日曜日

曜日

平均来客人数の割合の分散値

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.5 女性の来客人数の割合における分散値

14

Page 18: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

5.3 購入金額と購入点数 来店する回数が異なれば,1回の買い物で使用する金額や購入する商品の数も異なると考えられる.そこで月ごとの売り上げを来店した顧客数で割った 1 回の買い物における平均購入金額を計算する.また,平均購入金額のグラフを図 5.6,図 5.7に示す. 図 5.6,図 5.7より,多くの年代と異なる推移をしている年代は男女共に 10代から 20代

である.図 5.6より 10代から 20代,30代の男性は,春(4月,5月),夏(6月,7月,8月),秋(9月,10月)で平均購入金額が約 300円ずつ減少する.また 40代以上において,8月は他の月と比べ平均購入金額が増える傾向にある. 図 5.7より,10代から 20代の女性は春に平均購入金額が増えている.10代から 20代を

除く年代は,どの月も同じような推移をしている.また男女共に,8月は他の月に比べ平均購入金額が増える傾向にある.

1000

1200

1400

1600

1800

2000

2200

2400

2600

2800

4月 5月 6月 7月 8月 9月 10月

1回の買い物における平均購入金額

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.6 1回の買い物における平均購入金額(男性)

1000

1200

1400

1600

1800

2000

2200

2400

2600

2800

4月 5月 6月 7月 8月 9月 10月

1回の買い物における平均購入金額

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.7 1回の買い物における平均購入金額(女性)

15

Page 19: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

また,1回の買い物における平均購入点数を図 5.8,図 5.9に示す.これらの図から男性も女性も夏から秋にかけて購入点数が減少する傾向がある. 以上のことから,10代から 20代の男性,女性と 30代の男性は季節により購入する商品を変えると考えられる.また 30 代から 60 代の顧客は家庭を持っていると推測される.そのため図 5.8,図 5.9より,購入点数が多く,家族の分まで様々な商品を購入していると考えられる.一方,高齢層は家族の人数が少なくなるため,平均購入点数が少ないと考えら

れる.

01234567891011121314

4月 5月 6月 7月 8月 9月 10月

1回の買い物における平均購入点数

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.8 1回の買い物における平均購入点数(男性)

01234567891011121314

4月 5月 6月 7月 8月 9月 10月

1回の買い物における平均購入点数

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.9 1回の買い物における平均購入点数(女性)

16

Page 20: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

5.4 購入品の割合 購入金額が異なれば,購入する商品にも性別や年代別による違いが出てくると考えられ

る.そこで本節では顧客の購入品の違いを調べる.各年代における購入品の割合を図 5.10,図 5.11に示す.また,各年代の購入品の割合の上位 5種類を表 5.2,表 5.3に示す. 表 5.2の各年代の購入商品を比較すると,10代から 20代の男性は,米飯(おにぎり,寿

司,弁当など)惣菜 S(惣菜,天ぷら,フライなど)の割合が高い.よって 20代は,調理済みですぐに食事ができる商品を購入する割合が高い. 図 5.10より,80代以上の男性は果物,乳製品,パンの購入の割合が高い.この年代もすぐに食せる商品を購入する傾向にある.一方 10 代から 20 代の男性に比べると体に良いものや,あっさりしているもの,咀嚼しやすいものを選ぶ傾向が見られる.その他の年代は,

同様の購入比率をしている. 表 5.3 より 10 代から 20 代の女性は嗜好品と袋菓子の購入の割合が高い.理由として,若い女性は学校や会社にお菓子やペットボトル飲料を持っていくことが多いからだと考え

られる.また 30代も袋菓子の購入の割合が高い.理由として,30代の女性には幼い子供がいると推測されるため子供のおやつとして購入したり,子供にせがまれてやむを得ず購入

することなどが考えられる.また図 5.10,図 5.11を比較すると,女性は男性に比べ年代別における購入の割合に差がないことが分かる.

0.000%

2.000%

4.000%

6.000%

8.000%

10.000%

12.000%

14.000%

16.000%

18.000%

アイス

エチケツト

エンカン

カコウヒン

カシギフト

キツチン

ギユウニク

クダモノ

ケイニク

コウラクヨウヒン コメ

サニタリー

シコウヒン

シユウノウヨウヒン

シヨクタクヨウヒン

シヨクヒンギフト

センギヨ

センザイギフト

ソウザイSタマゴ

チヨウミリヨウ

チヨウリヨウヒン

ニユウセイヒン

ネリモノニツパイ

ノウカイサンカンブ

ハウスケアパ-ツ パン

ビユーテイーアクセサリー

フクロガシ

ブタニク

ヘアケア

ベイハン

ミズモノニツパイ

メイク&スキンケアヤサイライフ

リビング

レイシヨク

ライン名

各年代における購入の割合

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.10 各年代における購入品の割合(男性)

17

Page 21: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

0.000%

2.000%

4.000%

6.000%

8.000%

10.000%

12.000%

14.000%

16.000%

18.000%

アイス

エチケツト

エンカン

カコウヒン

カシギフト

キツチン

ギユウニク

クダモノ

ケイニク

コウラクヨウヒン コメ

サニタリー

シコウヒン

シユウノウヨウヒン

シヨクタクヨウヒン

シヨクヒンギフト

センギヨ

センザイギフト

ソウザイSタマゴ

チヨウミリヨウ

チヨウリヨウヒン

ニユウセイヒン

ネリモノニツパイ

ノウカイサンカンブ

ハウスケアパ-ツ パン

ビユーテイーアクセサリー

フクロガシ

ブタニク

ヘアケア

ベイハン

ミズモノニツパイ

メイク&スキンケアヤサイライフ

リビング

レイシヨク

ライン名

各年代における購入の割合

10~20代

30代

40代

50代

60代

70代

80代以上

図 5.11 各年代における購入品の割合(女性)

表 5.2 男性の購入の割合の上位 5種類とその割合

10~20代 30代 40代 50代 60代 70代 80代以上

嗜好品 嗜好品 野菜 野菜 野菜 水物日配 野菜 1位

16.284% 10.604% 10.796% 12.408% 12.536% 10.571% 11.119%

米飯 野菜 嗜好品 水物日配 水物日配 野菜 パン 2位

9.780% 9.164% 9.271% 8.748% 10.609% 10.161% 8.647%

パン 袋菓子 パン パン 嗜好品 パン 水物日配 3位

8.304% 8.292% 8.013% 7.705% 8.009% 8.647% 9.213%

野菜 パン 乳製品 嗜好品 練物日配 乳製品 乳製品 4位

7.665% 8.279% 7.691% 7.109% 7.081% 6.923% 8.862%

惣菜 S 練物日配 水物日配 乳製品 パン 鮮魚 袋菓子 5位

7.242% 7.574% 7.282% 7.109% 6.929% 6.793% 7.419%

18

Page 22: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

表 5.3 女性の購入の割合の上位 5種類とその割合

10~20代 30代 40代 50代 60代 70代 80代以上

嗜好品 袋菓子 野菜 野菜 野菜 野菜 水物日配 1位

10.344% 10.341% 11.015% 12.616% 12.671% 11.106% 11.848%

野菜 野菜 嗜好品 水物日配 水物日配 水物日配 野菜 2位

9.193% 9.548% 8.226% 9.792% 10.836% 10.551% 8.984%

袋菓子 パン パン パン パン パン パン 3位

9.083% 8.877% 8.135% 7.406% 7.771% 8.740% 8.239%

乳製品 嗜好品 水物日配 練物日配 乳製品 乳製品 嗜好品 4位

8.116% 8.736% 7.934% 6.989% 7.100% 7.403% 7.013%

パン 乳製品 乳製品 乳製品 練物日配 嗜好品 乳製品 5位

7.562% 8.200% 7.729% 6.811% 6.635% 6.554% 7.057%

次に同性の中で,年代により購入の割合が大きく異なる商品を調べる.そこで,性別ご

との購入品の割合における分散値を計算し,分散値が大きい上位 5種類の商品を表 5.4に示す.また,その商品の購入の割合の高い年代と低い年代を表 5.5,表 5.6に示す. 図 5.10,表 5.5 より,男性における嗜好品,米飯は年代が上がるにつれ購入の割合が下がる傾向にある.そのため分散値が大きくなる.また,水物日配,野菜は年代が上がるに

つれ購入の割合も上がる傾向にあるため分散値が大きくなる. 女性においても同様の傾向がある.図 5.11,表 5.6 より袋菓子,嗜好品は年代が上がるにつれ購入の割合が下がるため,また水物日配,鮮魚は年代が上がるにつれ購入の割合も

上がるため,分散値が大きくなる.よって,若い年代の購入品の割合と高齢層の購入品の

割合は大きく異なることが分かる. 表 5.4 購入割合の分散値の上位 5種類

男性 女性

嗜好品 袋菓子 1位

0.00110 0.00046

米飯 水物日配 2位

0.00055 0.00032

水物日配 野菜 3位

0.00034 0.00020

野菜 嗜好品 4位

0.00026 0.00019

袋菓子 鮮魚 5位

0.00021 0.00015

19

Page 23: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

表 5.5 男性における購入の割合の高い年代と低い年代

嗜好品 米飯 水物日配 野菜 袋菓子

10~20代 10~20代 60代 60代 30代 購入の割合の高い

年代と購入の割合 16.284% 9.780% 10.609% 12.536% 8.292%80代以上 70代 10~20代 10~20代 60代 購入の割合の低い

年代と購入の割合 6.255% 2.705% 5.263% 7.665% 4.079%

表 5.6 女性における購入の割合の高い年代と低い年代

袋菓子 水物日配 野菜 嗜好品 鮮魚

30代 80代以上 60代 10~20代 60代 購入の割合の高い

年代と購入の割合 10.341% 11.695% 12.751% 10.344% 6.302%60代 10~20代 10~20代 60代 10~20代購入の割合の低い

年代と購入の割合 4.748% 6.907% 9.193% 6.266% 3.410%

5.5 商品の値段に対する顧客の感覚 5.4節では購入金額の違いから購入品の違いがあると考えた.しかし,購入品の違いだけが平均購入金額や平均購入点数に影響を与えているとは限らない.そこで,本節では平均

購入金額に影響を与えると考えられるもう 1 つの要因,商品の値段の違いを性別,年代別により分析する. 本研究では,様々な商品の中から頻繁に安売りをすると推測される商品(アイス,カッ

プ麺,マヨネーズ,醤油,パン,豆腐,米,卵,牛乳,冷凍食品)を対象とする.ただし,

同商品でも量によって値段が左右されてしまうので容量も同じ商品を選ぶ.このデータに

おいて繰り返しのある二元配置分散分析を行い,購入した商品の金額が性別,年代別によ

り異なるかを調べる.なお,本研究において有意水準は 5%とする. まずアイスにおける分散分析の結果および平均購入単価のグラフを示す.ライン名「ア

イス」のなかでクラス名「マルチ」(主に箱売りをしているアイス)のデータ 77 種類を対象とする.対象商品の価格のヒストグラムを図 5.12に示す.なお,最安値は 150円,最高値は 598円である. 表 5.7 より,性別の分散比の値が 値より小さい.よって購入品の値段について性別の

違いはない.一方,年代,交互作用の分散比の値は 値より大きい.よって購入品の値段

について年代の違いがあり,交互作用がある.図 5.13,図 5.14より,年代が上がるほど購入単価が上がる特徴は女性だけに見られる.

FF

20

Page 24: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

0

10

20

30

40

50

60

70

80

150 180 210 240 270 300 330 360 390 420 450 480 510 540 570 600 次の級

データ区間

頻度

図 5.12 アイス(マルチ)の価格のヒストグラム

表 5.7 アイスの分散分析の結果

変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 7730 60381434

性別 1 3391.09 3391.09 0.44 0.50 3.84 年代 6 869755.5 144959.2 18.84 6.86E-22 2.10 交互作用 6 137025.5 22837.58 2.96 0.0067 2.10 誤差 7717 59371262 7693.56

0

25

50

75

100

125

150

175

200

225

250

275

300

325

350

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

0

25

50

75

100

125

150

175

200

225

250

275

300

325

350

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

図 5.13 男女別平均購入単価のグラフ 図 5.14 全購入者平均購入単価のグラフ

21

Page 25: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次にカップ麺における分散分析の結果および平均購入単価のグラフを示す.ここでカッ

プ麺は量や大きさがあまり変わらないことから 133 種類すべてを対象とする.対象商品の価格のヒストグラムを図 5.15に示す.なお,最安値は 44円,最高値は 398円である. 表 5.8 より,性別と交互作用のそれぞれの分散比の値は 値よりも小さい.よって購入

品の値段について性別の違いがなく,交互作用もない.一方,年代の分散比の値は 値よ

りも大きい.よって購入品の値段について年代の違いがある.図 5.16,図 5.17 より,10代から 20代の平均購入単価がその他の年代と大きく異なる.

FF

0

15

30

45

60

75

90

60 80 100 120 140 160 180 200 220 240 260 280 300 320 340 360 380 400 次の級

データ区間

頻度

図 5.15 カップ麺の価格のヒストグラム

表 5.8 カップ麺の分散分析の結果

変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 29394 41682347 性別 1 4226.46 4226.46 2.99 0.084 3.84年代 6 72980.31 12163.38 8.59 2.35E-09 2.10交互作用 6 5183.65 863.94 0.61 0.72 2.10誤差 29381 41599957 1415.88

0

10

20

30

40

50

60

70

80

90

100

110

120

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

0

10

20

30

40

50

60

70

80

90

100

110

120

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

図 5.16 男女別平均購入単価のグラフ 図 5.17 全購入者平均購入単価のグラフ

22

Page 26: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次にマヨネーズにおける分散分析の結果および平均購入単価のグラフを示す.マヨネー

ズは一般的に使用されている 400gから 500gの商品 9種類を対象とする.対象商品の価格のヒストグラムを図 5.18に示す.なお,最安値は 77円,最高値は 368円である. 表 5.9 より,性別の分散比の値が 値より小さい.よって購入品の値段について性別の

違いはない.一方,分散比の値が 値より大きい.よって購入品の値段について年代は違

いがあり,交互作用がある.図 5.19より,女性にのみ年代が上がるにつれ平均購入単価も上がる傾向が見られる.

FF

0

1

2

3

45

6

7

8

9

10

190 200 210 220 230 240 250 260 270 280 290 300 310 320 330 340 350 360 370次の級

データ区間

頻度

図 5.18 マヨネーズの価格のヒストグラム

表 5.9 マヨネーズの分散分析の結果

変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 5785 24694861 性別 1 13.98 13.98 0.0033 0.95 3.84年代 6 207034.6 34505.76 8.15 8.46E-09 2.10交互作用 6 57555.73 9592.62 2.27 0.035 2.10誤差 5772 24430257 4232.55

0

20

40

60

80

100

120

140

160

180

200

220

240

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

0

20

40

60

80

100

120

140

160

180

200

220

240

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

図 5.19 男女別平均購入単価のグラフ 図 5.20 全購入者平均購入単価のグラフ

23

Page 27: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次に醤油における分散分析の結果および平均購入単価のグラフを示す.醤油は,一般的

に売られている 1000mlの商品 30種類を対象とする.対象商品の価格のヒストグラムを図5.21に示す.なお,最安値は 198円,最高値は 650円である. 表 5.10より性別,年代,交互作用すべての分散比の値が, 値よりも大きい.よって購

入品の値段について性別と年代それぞれに違いがあり,交互作用もある.図 5.22より性別に関して,男性が女性よりも平均的に高い商品を購入していることがわかる.また図 5.23より年代が上がるにつれ平均購入単価も上がる傾向がある.

F

01234567891011

200 230 260 290 320 350 380 410 440 470 500 530 560 590 620 650 次の級

データ区間

頻度

図 5.21 醤油の価格のヒストグラム

表 5.10 醤油の分散分析の結果 変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 3151 27733278 性別 1 77261.89 77261.89 9.26 0.0024 3.84年代 6 1287148 214524.7 25.71 5.54E-30 2.10交互作用 6 185883.5 30980.58 3.71 0.0011 2.10誤差 3138 26182985 8343.85

0

25

50

75

100

125

150

175

200

225

250

275

300

325

350

375

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

0

25

50

75

100

125

150

175

200

225

250

275

300

325

350

375

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

図 5.22 男女別平均購入単価のグラフ 図 5.23 全購入者購入単価のグラフ

24

Page 28: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次にパンにおける分散分析の結果および平均購入単価のグラフを示す.特にクラス名「食

パン」の 135g以上の商品 33種類を対象とした.対象商品の価格のヒストグラムを図 5.24に示す.なお,最安値は 50円,最高値は 414円である. 表 5.11より性別,年代,交互作用すべての分散比の値が,F 値よりも大きい.よって購入品の値段について性別と年代それぞれに違いがあり,交互作用もある.図 5.25より性別に関して,80代以上の平均購入単価が大きく異なる.図 5.26より年代別に関して,年代が上がるにつれ平均購入単価も上がる傾向がある.

0

5

10

15

20

25

30

50 70 90 110 130 150 170 190 210 230 250 270 290 310 330 350 370 390 410 430次の級

データ区間

頻度

図 5.24 食パンの価格のヒストグラム

表 5.11 食パンの分散分析の結果

変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 38443 30424005 性別 1 15233.65 15233.65 19.65 9.34E-06 3.84年代 6 531091.7 88515.28 114.16 2.8E-308 2.10交互作用 6 79840.95 13306.82 17.16 6.41E-20 2.10誤差 38430 29797839 775.38

0

10

20

30

40

50

60

70

80

90

100

110

120

130

140

150

160

170

180

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

0

10

20

30

40

50

60

70

80

90

100

110

120

130

140

150

160

170

180

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

図 5.25 男女別平均購入単価のグラフ 図 5.26 全購入者平均購入単価のグラフ

25

Page 29: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次に豆腐における分散分析の結果および平均購入単価のグラフを示す.豆腐は様々な大

きさの商品があるので,一般的な 300g から 500g の商品 32 種類を対象とする.対象商品の価格のヒストグラムを図 5.27に示す.なお,最安値は 19円,最高値は 290円である. 表 5.12より,性別の分散比の値が 値より小さい.よって購入品の値段について性別の

違いはない.一方,分散比の値が 値より大きい.よって購入品の値段について年代は違

いがあり,交互作用がある.図 5.29 より 80 代以上を除くと,年代が上がるにつれ平均購入単価も上がる.

FF

0

2

4

6

8

10

12

14

16

20 40 60 80 100 120 140 160 180 200 220 240 260 280 300 次の級

データ区間

頻度

図 5.27 豆腐の価格のヒストグラム

表 5.12 豆腐の分散分析の結果

変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 50104 61933735 性別 1 2487.07 2487.07 2.04 0.15 3.84年代 6 632171.7 105361.9 86.21 2.8E-308 2.10交互作用 6 83293.51 13882.25 11.36 9.96E-13 2.10誤差 50091 61215783 1222.09

0

10

20

30

40

50

60

70

80

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

0

10

20

30

40

50

60

70

80

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

図 5.28 男女別平均購入単価のグラフ 図 5.29 全購入者平均購入単価のグラフ

26

Page 30: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次に米における分散分析の結果および平均購入単価のグラフを示す.米は重量によって

大きく値段が変わるので 10kgの商品 6種類を対象とする.対象商品の価格のヒストグラムを図 5.30に示す.なお,最安値は 1500円,最高値は 4680円である. 表 5.13より性別,年代,交互作用すべての分散比の値が, 値よりも大きい.よって購

入品の値段について性別と年代それぞれに違いがあり,交互作用もある.図 5.31より性別に関して,70代と 80代以上の平均購入単価がそれぞれ異なる.図 5.32より年代別に関して,高齢層の平均購入単価が他の年代よりも高い.

F

0

1

2

3

4

5

6

7

8

9

1400 1600 1800 2000 2200 2400 2600 2800 3000 3200 3400 3600 3800 4000 4200 4400 4600 4800次の級

データ区間

頻度

図 5.30 米の価格のヒストグラム

表 5.13 米の分散分析の結果

変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 6495 1.46E+09 性別 1 5577166 5577166 25.12 5.52E-07 3.84年代 6 5956343 992723.8 4.47 0.00016 2.10交互作用 6 6150557 1025093 4.62 0.00011 2.10誤差 6482 1.44E+09 221993.1

0

300

600

900

1200

1500

1800

2100

2400

2700

3000

3300

3600

3900

4200

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

0

300

600

900

1200

1500

1800

2100

2400

2700

3000

3300

3600

3900

4200

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

図 5.31 男女別平均購入単価のグラフ 図 5.32 全購入者平均購入単価のグラフ

27

Page 31: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次に卵における分散分析の結果および平均購入単価のグラフを示す.卵は数によって値

段が異なるので 10 個入りの商品 17 種類を対象とした.対象商品の価格のヒストグラムを図 5.33に示す.なお,最安値は 38円,最高値は 358円である. 表 5.14より性別,年代,交互作用すべての分散比の値が, 値よりも大きい.よって購

入品の値段について性別と年代それぞれに違いがあり,交互作用もある.図 5.34より若い年代においては女性の平均購入単価が高く,高齢層においては男性の平均購入単価が高い.

図 5.35 より年代別に関して,40 代,50 代の平均購入単価が高く,年代が上がる,下がるにつれ平均購入単価が下がる傾向にある.

F

0

2

4

6

8

10

12

14

16

40 80 120 160 200 240 280 320 360 次の級

データ区間

頻度

図 5.33 卵の価格のヒストグラム 表 5.14 卵の分散分析の結果

変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 34784 1.45E+08 性別 1 74497.19 74497.19 17.97 2.25E-05 3.84年代 6 523202 87200.33 21.04 2.8E-308 2.10交互作用 6 385958.6 64326.43 15.52 7.24E-18 2.10誤差 34771 1.44E+08 4145.15

0

20

40

60

80

100

120

140

160

180

200

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

0

20

40

60

80

100

120

140

160

180

200

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

図 5.34 男女別平均購入単価のグラフ 図 5.35 全購入者平均購入単価のグラフ

28

Page 32: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

次に牛乳における分散分析の結果および平均購入単価のグラフを示す.牛乳は一般的に

購入されている1Lの商品 23種類を対象とした.対象商品の価格のヒストグラムを図 5.36に示す.なお,最安値は 64円,最高値は 298円である. 表 5.15 より性別,年代におけるそれぞれの分散比の値が, 値よりも大きい.よって,

性別と年代それぞれに違いがある.また,交互作用の分散比の値は 値より小さい.よっ

て交互作用はない.図 5.38より年代別に関して,年代が上がるにつれ平均購入単価も上がる傾向にある.

FF

0

2

4

6

8

10

12

14

16

18

60 90 120 150 180 210 240 270 300 次の級

データ区間

頻度

図 5.36 牛乳の価格のヒストグラム

表 5.15 牛乳の分散分析の結果

変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 65210 24503805 性別 1 17882.96 17882.96 47.96 4.39E-12 3.84年代 6 172307.9 28717.99 77.019 2.8E-308 2.10交互作用 6 3603.8 600.63 1.61 0.14 2.10誤差 65197 24310011 372.87

0

20

40

60

80

100

120

140

160

180

200

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

0

20

40

60

80

100

120

140

160

180

200

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

図 5.37 男女別平均購入単価のグラフ 図 5.38 全購入者平均購入単価のグラフ

29

Page 33: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

最後に冷凍食品における分散分析の結果および平均購入単価のグラフを示す.冷凍食品

も様々な商品があるのでクラス名が「オカズ」の商品 82種類を対象とする.対象商品の価格のヒストグラムを図 5.39に示す.なお,最安値は 49円,最高値は 550円である. 表 5.16より,性別と交互作用におけるそれぞれの分散比の値は 値よりも小さいので性

別の違いがなく,交互作用もない.逆に年代の分散比の値は 値よりも大きいので年代の

違いがある.図 5.41より年代が上がるにつれ,平均購入単価が若干上がる.

FF

0

15

30

45

60

75

90

50 90 130 170 210 250 290 330 370 410 450 490 530 570 次の級

データ区間

頻度

図 5.39 冷凍食品の価格のヒストグラム

表 5.16 冷凍食品の分散分析の結果 変動因 自由度 偏差平方和 不偏分散 分散比 P値 F 値 全体 36123 1.02E+08 性別 1 6750.41 6750.41 2.40 0.12 3.84年代 6 97827.52 16304.59 5.79 2.8E-308 2.10交互作用 6 32382.24 5397.04 1.92 0.074 2.10誤差 36110 1.02E+08 2817.38

0

20

40

60

80

100

120

140

160

180

200

220

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

男性

女性

0

20

40

60

80

100

120

140

160

180

200

220

10~20代

30代

40代

50代

60代

70代

80代以上

年代

平均購入単価

図 5.40 男女別平均購入単価のグラフ 図 5.41 全購入者平均購入単価のグラフ

30

Page 34: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

以上から,性別による違いがあると判定したのは 10 種類中 5 種類(醤油,食パン,米,卵,牛乳)である.違いが出たすべての商品において,男性の平均購入単価が女性の平均

購入単価よりも高い.また,交互作用があると判定したのは 10種類中 7種類(アイス,マヨネーズ,醤油,食パン,豆腐,米,卵)である.どの商品においても,男性の各年代に

おける平均購入単価の変動が大きいため交互作用が発生する.以上のことから,男性は値

段の高い商品を購入することが多いが,女性に比べそれぞれの年代において購入単価が大

きく異なることが読み取れる.また,すべての商品で年代別の違いがあると判定され,10種類中 8 種類(アイス,マヨネーズ,醤油,食パン,豆腐,米,牛乳,冷凍食品)は年代が上がるにつれ,平均購入単価も上がる.よって,若い年代は値段の安い商品を購入する

場合が多いのに対し,高齢層は値段の高い商品を購入していることが多い.

31

Page 35: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

第 6章

まとめ 本研究では,顧客の「性別」と「年代」に着眼し,顧客の購買行動や購入品の違いを調

べた.また,繰り返しのある二元配置分散分析を用いて購入する商品の値段に違いがある

かを統計学的に判断した. 性別の観点から,男性は特定の曜日を設定せずに来店し,女性よりも値段の高い商品を

購入する.これは,自分で得た給料から商品を購入するので,自分の購入したい商品を買

うという意識が強く値段の高い商品を購入すると推測される.一方,女性は特売日に来店

し,安い商品を購入する傾向がある.これは,女性の中で既婚者が多く家計のやりくりを

任されているためと推測される. 年代別の観点から,若い年代は休日に来店する割合が高く,値段の安い商品やすぐに食

べることができる商品を購入している.また,購買行動が季節により変化しやすい.逆に

高齢層は平日に来客する割合が高く,若干値段の高い商品を購入する傾向がある.これは,

経済的な余裕があるため,また少しでも体に優しい安心できる商品を購入しようという気

持ちが強いためと推測される. 今後の課題として,安売りされていると推測される商品以外の購入値段の特徴を見るこ

とが挙げられる.またこの結果から売り上げを上げるためにどのようにしたらよいかを見

出すことが必要である.

32

Page 36: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

謝辞

本研究を進めるにあたり,多くのご指導ご助言をいただいた中央大学理工学部情報工学

科の田口東教授に深く感謝の意を表します.また,多くのご指導をいただいた鳥海重喜氏,

野津誠氏,平林大季氏をはじめ,田口研究室の大学院生,学部生の皆様に心より感謝いた

します.

33

Page 37: 性別・年代別による顧客の購買行動の分析 · mは算術平均 一部分の集団から全体を推測する場合,分散を計算するときは次の(3.2)式を使う.こ

参考文献 [1] 岩淵千明,あなたにもできるデータの処理と解析,福村出版株式会社,東京,1997. [2] 菅民郎,Excelで学ぶ実験計画法 シックスシグマと重回帰分析,株式会社 オーム社,

東京,2003. [3] 関庸一,“ID付きPOSデータからの顧客行動パタンの抽出,”オペレーションズ・

リサーチ,vol.48,no.2,pp.75-82,Feb.2003. [4] 森田優三,久次智雄,新統計概論 改訂版,株式会社 日本評論社,東京,2000. [5] 作田真吾,“スーパーにおける常連客の購買行動の分析,”中央大学情報工学科卒業研

究論文,2004. [6] 土屋智美,“天候による消費者の購買行動の変化について,”中央大学情報工学科卒業

研究論文,2002.

34