輔仁大學統計資訊系專題發表
DESCRIPTION
輔仁大學統計資訊系專題發表. 資料採礦在行銷策略上之運用 以運動鞋市場為例 團隊成員 : 吳孟潔 許容溶 張琬婷 李昱慧 陳羽瑩 謝邦昌. 研究背景. 我國製鞋工業發展已久,素來有「運動鞋王國」的美稱,運動鞋市場品牌眾多,促銷活動手法創新,對消費者而言,如何選購一雙適用耐穿的好鞋成為了一門值得細心思考的學問了。因此採用 統計上 Data Mining 的分析方法 ,來完成本項研究。. 研究動機. - PowerPoint PPT PresentationTRANSCRIPT
11
輔仁大學統計資訊系專題發表輔仁大學統計資訊系專題發表
資料採礦在行銷策略上之運用資料採礦在行銷策略上之運用 以運動鞋市場為例以運動鞋市場為例
團隊成員團隊成員::吳孟潔 許容溶 張琬婷吳孟潔 許容溶 張琬婷 李昱慧 陳羽瑩 謝邦昌李昱慧 陳羽瑩 謝邦昌
22
研究背景研究背景
我國製鞋工業發展已久,素來有「運動鞋我國製鞋工業發展已久,素來有「運動鞋王國」的美稱,運動鞋市場品牌眾多,促王國」的美稱,運動鞋市場品牌眾多,促銷活動手法創新,對消費者而言,如何選銷活動手法創新,對消費者而言,如何選購一雙適用耐穿的好鞋成為了一門值得細購一雙適用耐穿的好鞋成為了一門值得細心思考的學問了。因此採用心思考的學問了。因此採用統計上統計上 DataData
MiningMining 的分析方法的分析方法,來完成本項研究。 ,來完成本項研究。
33
研究動機研究動機
利用統計上問卷調查的分析結果,來瞭解利用統計上問卷調查的分析結果,來瞭解消費者的心態,並以此擬定合適的行銷政消費者的心態,並以此擬定合適的行銷政策和組合,使各家廠商能夠善加利用這項策和組合,使各家廠商能夠善加利用這項結果在運動鞋市場上做有效生產以及能符結果在運動鞋市場上做有效生產以及能符合消費者需求的運動鞋。 合消費者需求的運動鞋。
44
研究目的研究目的
本研究既著重在探討運動鞋在市場上的行銷策本研究既著重在探討運動鞋在市場上的行銷策略,以提供廠商在生產運動鞋時可以加強改進略,以提供廠商在生產運動鞋時可以加強改進的方向。的方向。
主要的有探討方向:主要的有探討方向: 依據依據不同年齡層、不同地區、教育程度不同年齡層、不同地區、教育程度 居住地區、消費的休閒活動居住地區、消費的休閒活動 對民眾在選擇運動鞋時的影響。 對民眾在選擇運動鞋時的影響。
55
受訪者年齡受訪者年齡
受訪者包含全台灣北、中、南、東四受訪者包含全台灣北、中、南、東四個地區的消費者;而主要年齡層為個地區的消費者;而主要年齡層為 1212歲到歲到 4949 歲的男女。歲的男女。
77
為何要使用為何要使用 Data Mining﹖Data Mining﹖
現今的資料流通筆數已大到令人無法想像現今的資料流通筆數已大到令人無法想像通常會遇到下列問題:通常會遇到下列問題:
1.1. 巨量的紀錄(巨量的紀錄( casescases )()( 108-1012 bytes108-1012 bytes ))2.2.高維的資料(高維的資料( variablesvariables )()( 10-104 attributes10-104 attributes)) 3.3.蒐集到的資料只用一小部分來分析(蒐集到的資料只用一小部分來分析( 5% to 10%5% to 10%)) 4.4.收集資料的過程中,本身並不具有延伸性的探討收集資料的過程中,本身並不具有延伸性的探討 特性,以導致常常忽略其未來潛在的重要性 特性,以導致常常忽略其未來潛在的重要性 5.5. 資料的維度增加傳統分析技術的難度資料的維度增加傳統分析技術的難度
88
Data MiningData Mining與與 StatisticsStatistics 方式的比方式的比較較
資料採礦 統計方法對分析資料屬性定義清楚
必須 必須
對解決問題目標明確
必須 必須
提供分析演算法
統計分析方法、人工智慧決策樹、類神經網路
統計分析方法
模式建立 提供多種模型,可以在短時間內決定合適者
需要分析者逐分析變數重要性,模式才能建立
相關變數 可找出多個變數間之相關性
一次只能檢查一個變數對結果的影響
可以預期分析結果
不可以 可以
執行方式 不斷循環與修正的過程 可以問題為導向,相關問題通常只需分析一次
99
Data miningData mining 的優點的優點可應用在很多的領域,像是:財務、可應用在很多的領域,像是:財務、行銷、銀行、通訊、製造業等。行銷、銀行、通訊、製造業等。
可找出的特別資訊,但若對訊息加以可找出的特別資訊,但若對訊息加以瞭解,必定可以增加企業的競爭力。瞭解,必定可以增加企業的競爭力。
沒有版權問題沒有版權問題
1111
研究流程架構研究流程架構
資料庫
樣本
變數選擇
集群分析
生活型態群
判別分析
生活型態穩定群
市場區隔描述
市場區隔策略
建構市場區隔模型
企業目標
Business Understanding
Data Understanding Data Preparation Modeling
Evaluation
Deployment
CRISP-DM
1212
資料採礦過程資料採礦過程 建立運動鞋市場上之區隔模型建立運動鞋市場上之區隔模型
研究工具 研究工具 利用利用 STATISTICA 6.0STATISTICA 6.0之之 DATA MINERDATA MINER
1313
STEP ONE STEP ONE Data AcquisitionData Acquisition
本研究資料檔來自某運動鞋購買行爲的調查所得資料庫,本研究資料檔來自某運動鞋購買行爲的調查所得資料庫,資料庫之原始資料資料庫之原始資料 12124571212457 筆 。筆 。
1414
STEP TWO STEP TWO Data Preparation,Cleaning,TransformationData Preparation,Cleaning,Transformation
在原始資料中,有在原始資料中,有很多資料很多資料不完全的不完全的記錄記錄,所以採用,所以採用Data CleaningData Cleaning 來處來處理,放入欲清理之理,放入欲清理之變數,將受訪者不變數,將受訪者不願回答或未回答造願回答或未回答造成的“成的“拒答拒答”、訪”、訪問員未記錄等原因問員未記錄等原因造成的缺失值等刪造成的缺失值等刪除。最後資料庫中除。最後資料庫中僅剩下了僅剩下了 334256334256筆筆資料,作為本研資料,作為本研究對象之母體究對象之母體。。
•Data Cleaning
1616
STEP THREESTEP THREE Systematic Random Sampling Systematic Random Sampling
運用統計中抽樣的運用統計中抽樣的觀念,對觀念,對 334256334256筆紀錄進行筆紀錄進行((Systematic Random Systematic Random
Sampling)Sampling) ,給予樣本,給予樣本區間數值區間數值
K-value=100K-value=100
抽出樣本抽出樣本 33423342 筆筆進行集群分析 進行集群分析
1717
對對 334256334256 筆紀錄進行筆紀錄進行(Systematic Random Sampling)(Systematic Random Sampling)樣本區間數值,樣本區間數值, K-value=100K-value=100抽出樣本抽出樣本 33423342 筆筆
1818
STEP THREE STEP THREE Data Analysis, Modeling, Data Analysis, Modeling, Classification, forecasting Classification, forecasting
基本次數與圓餅圖分析
集群分析 k-means 與判別分析
1919
母體與樣本之結構母體與樣本之結構
Histogram: 母體居住縣市 :
0 2 4 6 8 10 12 14 16 18 20
Category
0
10000
20000
30000
40000
50000
60000
No. of obs.
Histogram: 樣本居住縣市 :
0 2 4 6 8 10 12 14 16 18 20
Category
0
100
200
300
400
500
600
No. of obs.
Histogram: 母體年齡 :
0 1 2 3
Category
0
20000
40000
60000
80000
1E5
1.2E5
1.4E5
No.
of
obs.
Histogram: 樣本年齡 :
0 1 2 3
Category
0
200
400
600
800
1000
1200
1400
No
. o
f o
bs.
樣本結構樣本結構 ((樣本代表性樣本代表性 ))
樣本
母體
母體
樣本
居住地區
年齡
2020
母體與樣本之結構母體與樣本之結構
Histogram: 母體性別 :
0 1
Category
0
200
400
600
800
1000
1200
1400
1600
1800
2000
2200
No
. o
f o
bs.
Histogram: 樣本性別 :
0 1
Category
0
200
400
600
800
1000
1200
1400
1600
1800
2000
2200
No
. o
f o
bs.
Histogram: 母體教育程度 :
0 1 2 3 4
Category
0
20000
40000
60000
80000
1E5
1.2E5
1.4E5
No
. o
f o
bs.
Histogram: 樣本教育程度 :
0 1 2 3 4
Category
0
200
400
600
800
1000
1200
1400
No. of obs.
樣本結構樣本結構 ((樣本代表性樣本代表性 ))
樣本
樣本
母體
母體
性別
教育程度
2222
判別鑑別率判別鑑別率 運用判別分析檢驗運用判別分析檢驗
分群其穩定性,得分群其穩定性,得知在經濟實用群有知在經濟實用群有3333 個被誤判至流行個被誤判至流行自我群,重視意見自我群,重視意見群以及流行自我群群以及流行自我群誤判率為誤判率為 0%0% ,,此此分群鑑別力達分群鑑別力達 99%99% ,,所以三個族群皆具所以三個族群皆具足夠穩定性足夠穩定性
•判別分析
Classification Matrix (Spreadsheet26)Rows: Observed classificationsColumns: Predicted classifications
GroupPercentCorrect重視意見群p=.02364
經濟實用群p=.37074
流行自我群p=.60563
重視意見群經濟實用群流行自我群Total
100.000079 0 097.33660 1206 33100.00000 0 202499.012679 1206 2057
2424
利用分類方程式來 建立線性判別函數
重視意見群 居住縣市
其中: 經濟實用群 購買原因 流行自我群 功能類型
判別分析之 Classification Functions
Classification Functions
Variable重視意見群p=.02364
經濟實用群p=.37074
流行自我群p=.60563
©~¦í¿¤¥«ÁʶR ì¦]¥\¯àÃþ«¬Constant
1.8011.47310.531123.3320.49750.309475.0190.55000.40602
-184.048-14.5450-3.02137
X 1
X 2
X 3
2525
Bivariate Distribution: ¸s¼Æ x ©~¦í¿¤¥«
重視意見群台灣中南部台中縣台南縣
經濟實用群台灣中北部桃竹苗和台中市
流行自我群北高直轄市
•由地區別來看母體市場區隔由地區別來看母體市場區隔
2626
Bivariate Distribution: ¸s¼Æ x ÁʶR ì¦]流行自我群重視自我喜好且偏重品牌的選擇
經濟實用群便宜又大碗是購買原則
重視意見群以意見群體的建議及經驗為意見
•由購買因素來看母體市場區隔由購買因素來看母體市場區隔
2727
Bivariate Distribution: ¸s¼Æ x ¥\¯àÃþ«¬ 經濟實用群偏愛慢跑鞋和籃球鞋
重視意見群無特殊嗜好
流行自我群慢跑鞋、籃球鞋、韻律鞋、高爾夫球鞋
此塊為其他
•由購買運動鞋種類來看由購買運動鞋種類來看母體市場區隔母體市場區隔
2828
結論與建議結論與建議 對分群之後各族群消費者行為進行描述並對分群之後各族群消費者行為進行描述並
提出提出行銷策略之建議 行銷策略之建議
流行自我群流行自我群 廠商可以利用媒體、廣告等等手法,強化廠商可以利用媒體、廣告等等手法,強化
品牌在消費者之形象,加強消費者對品牌品牌在消費者之形象,加強消費者對品牌印象,並深入了解民眾自我喜好程度,推印象,並深入了解民眾自我喜好程度,推出各樣外型、功能等主打商品 出各樣外型、功能等主打商品
2929
經濟實用群經濟實用群 廠商可加強品牌在消費者知覺之實用性、廠商可加強品牌在消費者知覺之實用性、功能性及性質,同時著重運動鞋外觀之設功能性及性質,同時著重運動鞋外觀之設計,並搭配價格之促銷手法,帶給消費者計,並搭配價格之促銷手法,帶給消費者一雙擁有流行外表且有特殊功能之運動鞋。一雙擁有流行外表且有特殊功能之運動鞋。 重視意見群重視意見群
廠商可強調促銷手法,如:買一送一、特廠商可強調促銷手法,如:買一送一、特價等等,且促銷商品亦為民眾主要特定功價等等,且促銷商品亦為民眾主要特定功能及款式;亦此外,可加強商品品質,增能及款式;亦此外,可加強商品品質,增加品牌商品在消費者心中之地位。 加品牌商品在消費者心中之地位。
3030
研究貢獻研究貢獻本研究本研究根據資料採礦技術配合軟體根據資料採礦技術配合軟體
1.1.建構出一市場區隔模型來提供運動鞋廠商快速建構出一市場區隔模型來提供運動鞋廠商快速處理大量的顧客資料處理大量的顧客資料
2.2.軟體的使用加速清理資料遺失、不完整的部份,軟體的使用加速清理資料遺失、不完整的部份,直接快速的了解資料的基本特性,辨識資料的質直接快速的了解資料的基本特性,辨識資料的質量量
3.3.以以 CRISP-DMCRISP-DM 之過程建立企業作資料採礦的模之過程建立企業作資料採礦的模型,可以有效的運用在各種企業資料中,加快分型,可以有效的運用在各種企業資料中,加快分析資料的速度,減少成本提高可信度析資料的速度,減少成本提高可信度
4.4. 了解目標市場之消費者特性,提供最快最新的了解目標市場之消費者特性,提供最快最新的服務及產品,以滿足消費者需求,達成企業目標服務及產品,以滿足消費者需求,達成企業目標
3131
研究建議研究建議
在問卷設計上,增加消費者購買運動鞋在問卷設計上,增加消費者購買運動鞋特性之喜好程度之問題,並將問題與生特性之喜好程度之問題,並將問題與生活型態做事先分類活型態做事先分類強調顧客在消費上的特殊行為,以便了強調顧客在消費上的特殊行為,以便了解不同族群的消費者在購買行為上之差解不同族群的消費者在購買行為上之差異異增加問卷在通路、產品的問題,提出更增加問卷在通路、產品的問題,提出更完整的行銷策略完整的行銷策略