輔仁大學統計資訊系專題發表

32
1 輔輔輔輔輔輔輔輔輔輔輔輔輔 輔輔輔輔輔輔輔輔輔輔輔輔輔 輔輔輔輔輔輔輔輔輔輔輔輔輔 輔輔輔輔輔輔輔輔輔輔輔輔輔 輔輔輔輔輔輔輔輔 輔輔輔輔輔輔輔輔 輔輔輔輔 輔輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔 輔輔輔

Upload: aracely-trey

Post on 30-Dec-2015

29 views

Category:

Documents


5 download

DESCRIPTION

輔仁大學統計資訊系專題發表. 資料採礦在行銷策略上之運用 以運動鞋市場為例 團隊成員 : 吳孟潔 許容溶 張琬婷 李昱慧 陳羽瑩 謝邦昌. 研究背景. 我國製鞋工業發展已久,素來有「運動鞋王國」的美稱,運動鞋市場品牌眾多,促銷活動手法創新,對消費者而言,如何選購一雙適用耐穿的好鞋成為了一門值得細心思考的學問了。因此採用 統計上 Data Mining 的分析方法 ,來完成本項研究。. 研究動機. - PowerPoint PPT Presentation

TRANSCRIPT

11

輔仁大學統計資訊系專題發表輔仁大學統計資訊系專題發表

資料採礦在行銷策略上之運用資料採礦在行銷策略上之運用 以運動鞋市場為例以運動鞋市場為例

團隊成員團隊成員::吳孟潔 許容溶 張琬婷吳孟潔 許容溶 張琬婷 李昱慧 陳羽瑩 謝邦昌李昱慧 陳羽瑩 謝邦昌

22

研究背景研究背景

我國製鞋工業發展已久,素來有「運動鞋我國製鞋工業發展已久,素來有「運動鞋王國」的美稱,運動鞋市場品牌眾多,促王國」的美稱,運動鞋市場品牌眾多,促銷活動手法創新,對消費者而言,如何選銷活動手法創新,對消費者而言,如何選購一雙適用耐穿的好鞋成為了一門值得細購一雙適用耐穿的好鞋成為了一門值得細心思考的學問了。因此採用心思考的學問了。因此採用統計上統計上 DataData

MiningMining 的分析方法的分析方法,來完成本項研究。 ,來完成本項研究。

33

研究動機研究動機

利用統計上問卷調查的分析結果,來瞭解利用統計上問卷調查的分析結果,來瞭解消費者的心態,並以此擬定合適的行銷政消費者的心態,並以此擬定合適的行銷政策和組合,使各家廠商能夠善加利用這項策和組合,使各家廠商能夠善加利用這項結果在運動鞋市場上做有效生產以及能符結果在運動鞋市場上做有效生產以及能符合消費者需求的運動鞋。 合消費者需求的運動鞋。

44

研究目的研究目的

本研究既著重在探討運動鞋在市場上的行銷策本研究既著重在探討運動鞋在市場上的行銷策略,以提供廠商在生產運動鞋時可以加強改進略,以提供廠商在生產運動鞋時可以加強改進的方向。的方向。

主要的有探討方向:主要的有探討方向: 依據依據不同年齡層、不同地區、教育程度不同年齡層、不同地區、教育程度 居住地區、消費的休閒活動居住地區、消費的休閒活動 對民眾在選擇運動鞋時的影響。 對民眾在選擇運動鞋時的影響。

55

受訪者年齡受訪者年齡

受訪者包含全台灣北、中、南、東四受訪者包含全台灣北、中、南、東四個地區的消費者;而主要年齡層為個地區的消費者;而主要年齡層為 1212歲到歲到 4949 歲的男女。歲的男女。

66

資料採礦是一種資料轉化的過程資料採礦是一種資料轉化的過程

資訊資訊 知知識識

決策 決策

將沒有組織的數字與文字集結的資料,

轉換為資訊,再轉為知識,最後才產生決策。

資料庫資料庫

77

為何要使用為何要使用 Data Mining﹖Data Mining﹖

現今的資料流通筆數已大到令人無法想像現今的資料流通筆數已大到令人無法想像通常會遇到下列問題:通常會遇到下列問題:

1.1. 巨量的紀錄(巨量的紀錄( casescases )()( 108-1012 bytes108-1012 bytes ))2.2.高維的資料(高維的資料( variablesvariables )()( 10-104 attributes10-104 attributes)) 3.3.蒐集到的資料只用一小部分來分析(蒐集到的資料只用一小部分來分析( 5% to 10%5% to 10%)) 4.4.收集資料的過程中,本身並不具有延伸性的探討收集資料的過程中,本身並不具有延伸性的探討 特性,以導致常常忽略其未來潛在的重要性 特性,以導致常常忽略其未來潛在的重要性 5.5. 資料的維度增加傳統分析技術的難度資料的維度增加傳統分析技術的難度

88

Data MiningData Mining與與 StatisticsStatistics 方式的比方式的比較較

資料採礦 統計方法對分析資料屬性定義清楚

必須 必須

對解決問題目標明確

必須 必須

提供分析演算法

統計分析方法、人工智慧決策樹、類神經網路

統計分析方法

模式建立 提供多種模型,可以在短時間內決定合適者

需要分析者逐分析變數重要性,模式才能建立

相關變數 可找出多個變數間之相關性

一次只能檢查一個變數對結果的影響

可以預期分析結果

不可以 可以

執行方式 不斷循環與修正的過程 可以問題為導向,相關問題通常只需分析一次

99

Data miningData mining 的優點的優點可應用在很多的領域,像是:財務、可應用在很多的領域,像是:財務、行銷、銀行、通訊、製造業等。行銷、銀行、通訊、製造業等。

可找出的特別資訊,但若對訊息加以可找出的特別資訊,但若對訊息加以瞭解,必定可以增加企業的競爭力。瞭解,必定可以增加企業的競爭力。

沒有版權問題沒有版權問題

1010

兩個月後

研究結果說明會

1111

研究流程架構研究流程架構

資料庫

樣本

變數選擇

集群分析

生活型態群

判別分析

生活型態穩定群

市場區隔描述

市場區隔策略

建構市場區隔模型

企業目標

Business Understanding

Data Understanding Data Preparation Modeling

Evaluation

Deployment

CRISP-DM

1212

資料採礦過程資料採礦過程 建立運動鞋市場上之區隔模型建立運動鞋市場上之區隔模型

研究工具 研究工具 利用利用 STATISTICA 6.0STATISTICA 6.0之之 DATA MINERDATA MINER

1313

STEP ONE STEP ONE Data AcquisitionData Acquisition

本研究資料檔來自某運動鞋購買行爲的調查所得資料庫,本研究資料檔來自某運動鞋購買行爲的調查所得資料庫,資料庫之原始資料資料庫之原始資料 12124571212457 筆 。筆 。

1414

STEP TWO STEP TWO Data Preparation,Cleaning,TransformationData Preparation,Cleaning,Transformation

在原始資料中,有在原始資料中,有很多資料很多資料不完全的不完全的記錄記錄,所以採用,所以採用Data CleaningData Cleaning 來處來處理,放入欲清理之理,放入欲清理之變數,將受訪者不變數,將受訪者不願回答或未回答造願回答或未回答造成的“成的“拒答拒答”、訪”、訪問員未記錄等原因問員未記錄等原因造成的缺失值等刪造成的缺失值等刪除。最後資料庫中除。最後資料庫中僅剩下了僅剩下了 334256334256筆筆資料,作為本研資料,作為本研究對象之母體究對象之母體。。

•Data Cleaning

1515

資料庫之原始資料1212457 筆 ,做 Data Cleaning ,最後資料庫中僅剩下了334256 筆筆資料

1616

STEP THREESTEP THREE Systematic Random Sampling Systematic Random Sampling

運用統計中抽樣的運用統計中抽樣的觀念,對觀念,對 334256334256筆紀錄進行筆紀錄進行((Systematic Random Systematic Random

Sampling)Sampling) ,給予樣本,給予樣本區間數值區間數值

K-value=100K-value=100

抽出樣本抽出樣本 33423342 筆筆進行集群分析 進行集群分析

1717

對對 334256334256 筆紀錄進行筆紀錄進行(Systematic Random Sampling)(Systematic Random Sampling)樣本區間數值,樣本區間數值, K-value=100K-value=100抽出樣本抽出樣本 33423342 筆筆

1818

STEP THREE STEP THREE Data Analysis, Modeling, Data Analysis, Modeling, Classification, forecasting Classification, forecasting

基本次數與圓餅圖分析

集群分析 k-means 與判別分析

1919

母體與樣本之結構母體與樣本之結構

Histogram: 母體居住縣市 :

0 2 4 6 8 10 12 14 16 18 20

Category

0

10000

20000

30000

40000

50000

60000

No. of obs.

Histogram: 樣本居住縣市 :

0 2 4 6 8 10 12 14 16 18 20

Category

0

100

200

300

400

500

600

No. of obs.

Histogram: 母體年齡 :

0 1 2 3

Category

0

20000

40000

60000

80000

1E5

1.2E5

1.4E5

No.

of

obs.

Histogram: 樣本年齡 :

0 1 2 3

Category

0

200

400

600

800

1000

1200

1400

No

. o

f o

bs.

樣本結構樣本結構 ((樣本代表性樣本代表性 ))

樣本

母體

母體

樣本

居住地區

年齡

2020

母體與樣本之結構母體與樣本之結構

Histogram: 母體性別 :

0 1

Category

0

200

400

600

800

1000

1200

1400

1600

1800

2000

2200

No

. o

f o

bs.

Histogram: 樣本性別 :

0 1

Category

0

200

400

600

800

1000

1200

1400

1600

1800

2000

2200

No

. o

f o

bs.

Histogram: 母體教育程度 :

0 1 2 3 4

Category

0

20000

40000

60000

80000

1E5

1.2E5

1.4E5

No

. o

f o

bs.

Histogram: 樣本教育程度 :

0 1 2 3 4

Category

0

200

400

600

800

1000

1200

1400

No. of obs.

樣本結構樣本結構 ((樣本代表性樣本代表性 ))

樣本

樣本

母體

母體

性別

教育程度

2121

市場區隔市場區隔

由集群分析將市場區隔分為三群由集群分析將市場區隔分為三群

群一群一:重視意見群:重視意見群

群二群二:經濟實用群:經濟實用群

群三群三:流行自我群:流行自我群

2222

判別鑑別率判別鑑別率 運用判別分析檢驗運用判別分析檢驗

分群其穩定性,得分群其穩定性,得知在經濟實用群有知在經濟實用群有3333 個被誤判至流行個被誤判至流行自我群,重視意見自我群,重視意見群以及流行自我群群以及流行自我群誤判率為誤判率為 0%0% ,,此此分群鑑別力達分群鑑別力達 99%99% ,,所以三個族群皆具所以三個族群皆具足夠穩定性足夠穩定性

•判別分析

Classification Matrix (Spreadsheet26)Rows: Observed classificationsColumns: Predicted classifications

GroupPercentCorrect重視意見群p=.02364

經濟實用群p=.37074

流行自我群p=.60563

重視意見群經濟實用群流行自我群Total

100.000079 0 097.33660 1206 33100.00000 0 202499.012679 1206 2057

2323

•母體市場區隔母體市場區隔樣本將市場區隔數決定為三群,得知判別正確率樣本將市場區隔數決定為三群,得知判別正確率達達 99%99% ,,進一步區隔出母體的市場進一步區隔出母體的市場。。

2424

利用分類方程式來 建立線性判別函數

重視意見群 居住縣市

其中: 經濟實用群 購買原因 流行自我群 功能類型

判別分析之 Classification Functions

Classification Functions

Variable重視意見群p=.02364

經濟實用群p=.37074

流行自我群p=.60563

©~¦í¿¤¥«ÁʶR ì¦]¥\¯àÃþ«¬Constant

1.8011.47310.531123.3320.49750.309475.0190.55000.40602

-184.048-14.5450-3.02137

X 1

X 2

X 3

2525

Bivariate Distribution: ¸s¼Æ x ©~¦í¿¤¥«

重視意見群台灣中南部台中縣台南縣

經濟實用群台灣中北部桃竹苗和台中市

流行自我群北高直轄市

•由地區別來看母體市場區隔由地區別來看母體市場區隔

2626

Bivariate Distribution: ¸s¼Æ x ÁʶR ì¦]流行自我群重視自我喜好且偏重品牌的選擇

經濟實用群便宜又大碗是購買原則

重視意見群以意見群體的建議及經驗為意見

•由購買因素來看母體市場區隔由購買因素來看母體市場區隔

2727

Bivariate Distribution: ¸s¼Æ x ¥\¯àÃþ«¬ 經濟實用群偏愛慢跑鞋和籃球鞋

重視意見群無特殊嗜好

流行自我群慢跑鞋、籃球鞋、韻律鞋、高爾夫球鞋

此塊為其他

•由購買運動鞋種類來看由購買運動鞋種類來看母體市場區隔母體市場區隔

2828

結論與建議結論與建議 對分群之後各族群消費者行為進行描述並對分群之後各族群消費者行為進行描述並

提出提出行銷策略之建議 行銷策略之建議

流行自我群流行自我群 廠商可以利用媒體、廣告等等手法,強化廠商可以利用媒體、廣告等等手法,強化

品牌在消費者之形象,加強消費者對品牌品牌在消費者之形象,加強消費者對品牌印象,並深入了解民眾自我喜好程度,推印象,並深入了解民眾自我喜好程度,推出各樣外型、功能等主打商品 出各樣外型、功能等主打商品

2929

經濟實用群經濟實用群 廠商可加強品牌在消費者知覺之實用性、廠商可加強品牌在消費者知覺之實用性、功能性及性質,同時著重運動鞋外觀之設功能性及性質,同時著重運動鞋外觀之設計,並搭配價格之促銷手法,帶給消費者計,並搭配價格之促銷手法,帶給消費者一雙擁有流行外表且有特殊功能之運動鞋。一雙擁有流行外表且有特殊功能之運動鞋。 重視意見群重視意見群

廠商可強調促銷手法,如:買一送一、特廠商可強調促銷手法,如:買一送一、特價等等,且促銷商品亦為民眾主要特定功價等等,且促銷商品亦為民眾主要特定功能及款式;亦此外,可加強商品品質,增能及款式;亦此外,可加強商品品質,增加品牌商品在消費者心中之地位。 加品牌商品在消費者心中之地位。

3030

研究貢獻研究貢獻本研究本研究根據資料採礦技術配合軟體根據資料採礦技術配合軟體

1.1.建構出一市場區隔模型來提供運動鞋廠商快速建構出一市場區隔模型來提供運動鞋廠商快速處理大量的顧客資料處理大量的顧客資料

2.2.軟體的使用加速清理資料遺失、不完整的部份,軟體的使用加速清理資料遺失、不完整的部份,直接快速的了解資料的基本特性,辨識資料的質直接快速的了解資料的基本特性,辨識資料的質量量

3.3.以以 CRISP-DMCRISP-DM 之過程建立企業作資料採礦的模之過程建立企業作資料採礦的模型,可以有效的運用在各種企業資料中,加快分型,可以有效的運用在各種企業資料中,加快分析資料的速度,減少成本提高可信度析資料的速度,減少成本提高可信度

4.4. 了解目標市場之消費者特性,提供最快最新的了解目標市場之消費者特性,提供最快最新的服務及產品,以滿足消費者需求,達成企業目標服務及產品,以滿足消費者需求,達成企業目標

3131

研究建議研究建議

在問卷設計上,增加消費者購買運動鞋在問卷設計上,增加消費者購買運動鞋特性之喜好程度之問題,並將問題與生特性之喜好程度之問題,並將問題與生活型態做事先分類活型態做事先分類強調顧客在消費上的特殊行為,以便了強調顧客在消費上的特殊行為,以便了解不同族群的消費者在購買行為上之差解不同族群的消費者在購買行為上之差異異增加問卷在通路、產品的問題,提出更增加問卷在通路、產品的問題,提出更完整的行銷策略完整的行銷策略

3232

THANK YOU