application of hierarchical bayesian approach and genetic … · 2006-03-21 · management systems....

21
2005 第九屆科際整合管理研討會 May 28 PP103-123 - 103 - 整合層級貝氏及基因演算法在顧客偏好解讀與市場區 隔上之應用 廖子毅 張羢琦 鐘振聲 邱志洲 國立台北科技大學商業自動化與管理研究所 摘要 在過去的行銷研究上我們可以發現,學者常會將同一群顧客視為具有同質性的個體來進行分析。但 是隨著行銷環境的改變,顧客的偏好趨向多元化,再加上每位顧客具備不同的特性,造成傳統將同群顧 客視為同質性的概念已不符實務之狀況,因著如此,所謂的顧客異質性概念乃因應而生。 為了成功達到塑造品牌差異化的競爭優勢,企業須先了解消費者選擇品牌時的異質性偏好。為此本 研究嘗試以行銷學的理論與觀點佐證層級貝氏模型的延展性與實用性。論文的整體架構如下:第一部份 為緒論及相關文獻的探討;第二部份為模式的建構;第三部份提出分群的概念及相關後驗參數的推導; 第四部份利用零售產業的交易資料進行實證分析;第五部份進行總結及後續的研究方向與建議。 關鍵詞:層級貝氏模式 品牌選擇 顧客異質性 MCMC Application of Hierarchical BayesianApproach and Genetic Algorithms in illustrating customer preference and market segmentation Abstract Nowadays, enterprises need to consider not only if the products or services they provide can conform to the needs of most consumers or not, but how to satisfy the demand of a specific market segment and appeal them to repurchase as well due to the severe market competition. Besides, in an enterprise, the capability to both generate and collect data has also been expanded enormously and provides us with huge amount of data. It is noted that the number of such databases keeps growing rapidly because of the availability of powerful and affordable database management systems. To compete effectively in such an environment, business managers have changed their thoughts and treat the heterogeneity of customer as an important issue. Moreover, some enterprises start to study the customer heterogeneity when they have different brand choices. The main objective of this study is to explore the identification of customer heterogeneity and classification by using the Hierarchical Bayesian Model (HBM). Moreover, in order to resolve the efficiency issues regarding the reference estimates of the Hierarchical Bayesian model, we have integrated the genetic algorithm (GA) technology to expedite the speed of convergence amid the Monte Carlo Markov Chain (MCMC). Based on actual application results, we have discovered that the proposed method contains obvious supportive functions. Keywords: Hierarchical Bayesian Model, genetic algorithm, brand choice, Monte Carlo Markov Chain

Upload: others

Post on 12-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

May 28 PP103-123

- 103 -

整合層級貝氏及基因演算法在顧客偏好解讀與市場區

隔上之應用

廖子毅 張羢琦 鐘振聲 邱志洲

國立台北科技大學商業自動化與管理研究所

摘要

在過去的行銷研究上我們可以發現,學者常會將同一群顧客視為具有同質性的個體來進行分析。但

是隨著行銷環境的改變,顧客的偏好趨向多元化,再加上每位顧客具備不同的特性,造成傳統將同群顧

客視為同質性的概念已不符實務之狀況,因著如此,所謂的顧客異質性概念乃因應而生。

為了成功達到塑造品牌差異化的競爭優勢,企業須先了解消費者選擇品牌時的異質性偏好。為此本

研究嘗試以行銷學的理論與觀點佐證層級貝氏模型的延展性與實用性。論文的整體架構如下:第一部份

為緒論及相關文獻的探討;第二部份為模式的建構;第三部份提出分群的概念及相關後驗參數的推導;

第四部份利用零售產業的交易資料進行實證分析;第五部份進行總結及後續的研究方向與建議。

關鍵詞:層級貝氏模式 品牌選擇 顧客異質性 MCMC

Application of Hierarchical Bayesian Approach and Genetic Algorithms

in illustrating customer preference and market segmentation

Abstract Nowadays, enterprises need to consider not only if the products or services they provide can conform to the

needs of most consumers or not, but how to satisfy the demand of a specific market segment and appeal them to repurchase as well due to the severe market competition. Besides, in an enterprise, the capability to both generate and collect data has also been expanded enormously and provides us with huge amount of data. It is noted that the number of such databases keeps growing rapidly because of the availability of powerful and affordable database management systems. To compete effectively in such an environment, business managers have changed their thoughts and treat the heterogeneity of customer as an important issue. Moreover, some enterprises start to study the customer heterogeneity when they have different brand choices.

The main objective of this study is to explore the identification of customer heterogeneity and classification by using the Hierarchical Bayesian Model (HBM). Moreover, in order to resolve the efficiency issues regarding the reference estimates of the Hierarchical Bayesian model, we have integrated the genetic algorithm (GA) technology to expedite the speed of convergence amid the Monte Carlo Markov Chain (MCMC). Based on actual application results, we have discovered that the proposed method contains obvious supportive functions.

Keywords: Hierarchical Bayesian Model, genetic algorithm, brand choice, Monte Carlo Markov Chain

Page 2: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 104 -

壹、緒論

在過去五到十年來,企業在面對市場以個人化與差異化為導向的行銷趨勢下,

逐漸的將「如何塑造企業品牌,作為其主要競爭力」視為其首要工作。消費者在面

對不同品牌與不同功能屬性的產品時,皆會根據自己的偏好來選擇所喜好的品牌。

此外消費者對於產品的偏好結構也將會直接影響消費者的購買決策與時機,因此若

能充分了解消費者的偏好結構,將有助於產品品牌的定位。而近年來由於電子商務

技術及條碼設備的成熟,促使在針對消費者購買習慣的資料收集上,有了相當大的

突破。在本論文中,我們將針對此一類型的消費者資料進行模式的建構,以便能清

楚的解讀消費者真正的品牌選擇行為及偏好,另外根據此模式的建構及分析結果,

企業也才能更清楚的定位出其相關的行銷策略。

到目前為止,在有關建構描述消費者品牌選擇模式的研究當中,已有相當多成

功 且 顯 著 的 論 文 被 發 表 。 在 這 些 成 功 的 研 究 裏 , 有 許 多 的 模 型 皆 是 根 據

McFadden 所提出的隨機效用模式 (Random Utility Model) 為基礎來進行推論的

(McFadden,1973)。通常在針對消費者 Scanner Data 進行購買行為分析時,隨機效用模

式會因模式本身誤差項 ji ,ε 的假設不同而有不同的型態;當 ji ,ε 符合 extreme value 分

配時([ ] { }εεε −−−≡ eexp ),隨機效用模式為 Logit 模式;當 ji ,ε 符合 Normal 分配時,

隨機效用模式則為 Probit 模式。

至於在估計隨機效用模式中參數的方法上,已有許多傳統及新穎的分析方法分

別被成功的發展出來。在傳統的分析方法中所謂參數估計的抽樣分配,是假設在資

料屬性為隨機或者是資料乃根據某一機率模式所產生的前提下,所建構而成的。但

是,由於抽樣分配通常不會具備有完整的 Closed form,所以常造成其相關的推論必

須架構在大樣本或是樣本必須趨近於無限大的條件下始能成立。但就實務的問題而

言,面對有限、不完整的樣本資訊或者是非連續型資料時,在樣本數趨近於無限大

的假設下進行分析是相當不切實際的。為能有效解決這種問題,許多的計量經濟學

者曾提出許多無母數或半母數的相關辦法。然而,這些傳統的無母數分析方法,在

可觀察變數的預測應用上,常因著模式 Overfitting 問題的存在,而造成在預測效果上

相當不佳的情形。

除了上述的這些計量經濟及無母數分析方法外,貝氏分析技術是另一個較受到

大家廣泛應用的工具。不同於其它的傳統分析方法,貝氏技術是強調以樣本資料為

基礎來針對欲估計參數或擬預測數量進行其機率值的陳述。基本上,貝氏分析是結

合了先驗機率(prior distribution) 與概似函數 (likelihood function) 來針對不可觀測的數

量(包括參數及預測值)進行其後驗分配 (posterior distribution) 的推論。而所謂的後

驗分配則是一種綜合了樣本資料及不可觀測數值其先驗資訊的分配。由於貝氏方法

具備了上述的特性,因此當我們運用其來進行相關的統計推論時是不需要建構在任

何所謂「樣本趨近於無限大」的假設條件下的。而這樣的一個特質,對於我們在探

討行銷議題時,特別是針對單一消費者的有限消費資料或者是離散型資料的狀況

下,是相當重要的。Rossi and Allenby,2002;Allenby and Ginter,1995;Rossi et al.,1996;

Ralukdar et al.,2002 等學者便曾明確指出,運用層級貝氏理論針對消費者之消費行為

資料進行分析時,研究者除了可以很清楚的了解到個別消費者的消費行為外,更可

Page 3: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 105 -

以進一步的推論出一些無法實際觀察到,卻影響消費者購買決策的隱藏變數(latent

variable)值。只是雖然層級貝氏模型具備了極大的彈性與延展性可以用來建構行銷模

式,但對於模式中後驗分配的參數估計卻面臨了許多在積分上的困難:例如,欲估

計隨機參數間存在著複雜的交互作用及模式與模式間存在著高度的相關性等。事實

上,這些困難常造成參數的貝氏估計需要使用複雜且高維度的積分技巧,而這些積

分技巧在實際執行上是相當困難的。近年來由於蒙第卡羅-馬可夫鏈 (Monte Carlo

Markov Chain)模擬方式的成熟發展,已逐漸證明其為一個可以代替參數積分的計算方

法。由於 MCMC 可以保證當模擬次數趨近於無窮時,其所模擬出的樣本積分點可以

代表欲積分函數的分配形狀與機率,因此我們可以利用 MCMC 的隨機模擬過程來累

積模擬樣本,再運用樣本的平均數去估計複雜的貝氏後驗機率分配平均值和其他動

差。通常,對於層級貝氏模型中後驗機率的推估,皆是以 MCMC 隨機過程理論中的

Metropolis-Hasting(MH)或 Gibbs 等抽樣方法來進行。Allenby and Lenk,1994;Rossi and

McCulloch,1994;Allenby and Ginter,1995 等皆曾成功的使用 Gibbs 或 MH 抽樣方法來估

計層級貝氏模型中貝氏後驗機率。有關詳細的貝氏理論說明及抽樣方法可參考 Smith

et al.,1993;Casella et al.,1992;Gelman et al,1995;Chib,2003;Robert and Casella,1999;

Liu,2001;Bernardo and Smith,1994。

本研究將嘗試運用層級貝氏理論架構,探討消費者品牌選擇及偏好的異質性,

並利用 MCMC 方法估計貝氏模式中各後驗分配的參數值,此外我們更整合了分群機

制及基因演算法的技術來擴充傳統層級貝氏模式的應用議題與 MCMC 抽樣的效率

性。而有關分群機制的加入,我們將探討人口統計變數如何影響個別消費者偏好的

議題。由於以往學者在利用人口統計變數解釋個別消費者偏好議題時,皆將顧客視

為是一同質性的市場,由於這樣的假設,事實上已經不符合現今顧客的消費現況,

所以對於參數估計的誤差程度自然相對較高。本研究將參考 Kamakura and Russell 的

有限混合模式 (finite mixture model),與 Allenby and Ginter 所使用的邏吉斯迴歸模式來

作為本研究中所建構之模式基礎,並將利用其來建構市場區隔的機制。

另外,在參數估計方面,在消費者個人消費紀錄筆數相當有限的情況之下,對

於要準確的估計出個別消費者偏好的異質性,勢必要增加 MCMC 抽樣次數才能達到

收斂的效果。由於在小樣本資訊的限制下,模擬的進行將有可能耗費大量的時間與

成本去搜尋 MCMC 的收斂空間。因此為了降低 MCMC 的搜尋空間,本研究試圖提

出增加 MCMC 抽樣效率的方法:藉由基因演算法作為搜尋最佳參數值的工具,並依

據搜尋結果設定其為 MCMC 模擬抽樣時的初始值,期望能夠因此加速 MCMC 的收

斂速度。

本論文的架構可整理如下:第一部份為緒論及相關文獻的探討;第二部份為模

式的建構,並於第三部份提出分群的概念、如何加速 MCMC 收斂的方法及探討層級

貝氏中各項後驗參數的推導;第四部份將針對超市零售業的會員消費資料進行實證

分析,而第五部份則是研究結論及建議。

Page 4: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 106 -

貳、模式建構

在本節中我們將針對如何運用層級貝氏理論進行品牌選擇效用模式的建構進行

說明。此外,對於模式中的分群機制與如何利用人口統計變數進行偏好異質性的分

析也將進行深入的探討。

一、品牌選擇效用模式

通常在針對品牌選擇的研究當中,學者常會以經濟學的觀點:利用效用函數來

表示各品牌帶給消費者不同的效用程度。在本研究中我們也將遵循經濟學中的原

則,「品牌選擇行為是依據消費者在可選擇集合中,理性選取某一品牌產品使其效用

最大化」來進行模式的建構。換言之,我們是假設了在品牌選擇的行為中,消費者

最後將選擇具有最大效用值的產品。若以數學模式加以表示,則可將其關係呈現如:

(1)品牌 k 相較於其他品牌而言,所帶給消費者本身之效用最大化: i,j,mi,j,k YY ≥ 。(2)

消費者選擇各品牌k 之機率 ( ) for all mYYP i,j,mi,j,k ≥ ,其中 mjiY ,, 表示為第 i 個消費者在

第 j 次購買時間點,對於第 m 個品牌所產生的效用。根據上述的論點,我們可以將

本研究所建構的效用函數定義如下:

mjiimjimji xY ,,,,,, ' εβ +=

i=1, 2, …, n ≡i n 個顧客 j=1, 2, …, Ji ≡j 購買產品的時間點 m=1,2, … M+1 ≡m 可選擇的品牌集合

其中,為方便說明消費者在品牌選擇間的差異及比較,我們假設品牌集合(m)內

共有 M+1 個品牌可供消費者選擇,且第 M+1 個品牌(其效用值為”零”)為我們的「基

本品牌」。至於 mjiY ,, 仍代表了第 i 個消費者在第 j 次購買時間點,對於第m 個品牌所

產生的效用。另外, mjix ,,' 則表示為第 i 個消費者在第 j 次購買時間點,第 m 個品牌

所伴隨相對於「基本品牌」的行銷變數,例如:當時的相對價格、相對折價以及相

對於「基本品牌」是否有廣告等。此外, iβ 表示為第 i 個消費者本身對於行銷變數的

反應程度。換句話說, iβ 可以用來說明個別顧客對於品牌與行銷變數的偏好程度;

mji ,,ε 則為模式的誤差項。根據上述變數的定義我們可將品牌選擇效用模式中各參數

的資料結構整理如: j,iY 與 j,iε 為 1M× 的向量; j,iX 為 p×M 的矩陣,其中p 表示 X

變數的維度。

由於模式中誤差項性質的不同假設會嚴重影響模式參數的估計方式及結果,因

此有許多不同的學者提出許多不同的解決方案。其中 Guadagni and Little 說明了,若

品牌選擇模式中其誤差項之分配為 extreme value 分配型態時,品牌選擇模式將可以被

推導為邏吉斯函數(Logit)。事實上,在品牌選擇的相關文獻當中,邏吉斯模式早自

1970 年代後期就被大量運用在品牌選擇的議題上(Jones,1988)。在相關的行銷應用中

則包括了 Currim,1982;Kamakura and Strivastava,1984;Allenby,1989 與 Guadagni and

Little,1983 等。基本上,他們都使用了多項式邏吉斯模式來探討行銷變數與消費者選

Page 5: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 107 -

擇品牌間的關係。

邏吉斯模式除了可以用來描述實際購買行為之外,更可以用來進行品牌選擇的

研究。根據以上文獻所述,可以了解消費者在選擇品牌時,將會依據品牌間屬性的

差異而產生不同的效用函數值 mjiimjimji xY ,,,,,, ' εβ +=,其中 imjix β,,'

代表藉由可觀察

到因素(如價格)進行預測可得到之效用,亦即由解釋變數與未知參數所構成之靜態部

分;另外,在函數的第二部分 mji ,,ε則是所謂的隨機部分(Random Component of Utility),

其所代表的涵義是指消費者有一部分的效用會隨著無法觀察到之因素,(例如:消費

者心情的改變)而產生的變動,即無法觀察得到的隨機變數。因此,消費者在選購品

牌時將會依據效用函數,選擇效用最大的品牌m allfor ,,,, mjikji YY ≥

。藉此,我們也

可以進一步推導出品牌k 被購買的機率( ) m allfor ,,,, mjikji YYP ≥

。有關 mji ,,ε的屬性部

分,若我們假設其隨機性效用符合 extreme value 分配時,我們將可以依據購買機率推

導出邏吉斯的品牌選擇模式。

由於效用函數為一個隱藏變數,我們必須透過消費紀錄中所購買的品牌

( kC ji =, )與各品牌中的行銷變數( kjix ,, )來估計β 參數值,因此在進行各品牌購

買機率推估時,我們必須先選定一參考之「基本品牌」。在本研究中我們是假設第

M+1 個品牌為「基本品牌」,且其效用函數值為零。根據這樣的假設條件,我們可以

針對品牌選擇推導出以下的邏吉斯機率函式:

( ) == iji kCP β|, ( ) m allfor ,,,, mjikji YYP ≥

( )( ) max ,,,,'

,,,,'

mjiimjikjiikji xxP εβεβ +≥+=

( ) ,,'

,,,,'

jiijikjiikji xxP ∗∗+≥+= εβεβ

)exp(1

1,

'',, ijiimji xx ββ

∗−+

= (根據 [ ] { }εεε −−−≡ eexp )

( )( )

( )

+=+

≤+

=

=

=

1 if exp1

1

if exp1

exp

1

',,

1

',,

',,

Mkx

Mkx

x

M

mimji

M

mimji

ikji

β

β

β

其中, kC ji =, ,表示第 i 位顧客在第 j 個購買時間點選擇第 k 項品牌,而其條

件機率必須限制在其自我偏好( iβ )下所產生的機率值,若以數學方程式表示即為

( )iji kCP β|, = 。事實上,如果我們以經濟學的效用觀點來衡量當可以了解:如果消

費者選擇品牌k ,則品牌k 應是其在所有可供選擇的品牌集合中,能帶給消費者最大

效用的機率。換言之,選擇品牌 k 的效用必須大於所有其他品牌的效用值,但若選

(選擇「基本品牌」)

Page 6: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 108 -

擇品牌k 之效果值小於 ( )mjiYMax ,, 時,仍有被購買的機率,因此我們可以將選擇品牌

k 的條件機率表示為 ( ) ( )( )mjikjiiji YMaxYPkCP ,,,,, | ≥== β 。此外,我們更可以利用

( ) ( )( )mjikji

J

jiji

J

jYMaxYPkCP

ii

,,,,1

,1

| ≥∏==∏==

β 的聯合機率函數來估計第 i 位消費者的品

牌選擇偏好( iβ ),並利用模式中的 iβ 更清楚的了解到每一位消費者其獨特的偏好情

形。事實上,由於每一位顧客皆有不同的偏好值(亦即偏好異質性),所以我們可以利

用個別消費者 i,每次的購買紀錄( kC ji =, )以及其品牌效用函數( mjiY ,, )來估計 iβ 。換

言之,若以消費者選擇品牌的行為而言,消費者除了會考慮各品牌間的差異性與當

時各品牌所附屬的行銷屬性外,消費者也會依據其自我的特有偏好,針對每一個品

牌所能帶給自己的效用程度加以評估,最後再進行是否購買的決策判斷。

二、 品牌偏好的解讀

在本節中我們除了將利用人口統計變數來解釋品牌選擇效用模式中消費者品牌

偏好異質性的層級關係外,我們更將進一步的解釋如何依據顧客偏好來進行分群的

機制,並說明實際的市場區隔狀況與異質性所在。

基本上,所謂的品牌偏好解讀是根據品牌選擇效用模式中的偏好值 iβ 來進行模

式的建構,並以階層關係來解釋異質性偏好。其函式關係可表示如下:

∆+Θ= Zβ

[ ] ( )Λ∆=∆ ,0N

其中 Z 表示消費者的人口統計變數,例如:家庭人口數、性別與教育程度等。

而Δ則為模式之噪音項,通常我們會假設其為符合平均值為 0,變異數為Λ的常態分

配。有關品牌偏好解讀模式中各變數之資料結構可整理為:β 為 pn× 的偏好資料矩

陣;Z 為 qn × 的人口統計變數資料矩陣;Θ 為 pq× 的矩陣;Λ為 pp× 的共變異數矩

陣,其中 p 表示行銷變數(X)的維度,q 表示人口統計變數(Z)的維度, n 則為消費者

的總人數。

根據模式之型態我們可以了解模式本身是使用β 與 Z 來估計Θ參數,而 Θ參數

則是用來解釋偏好 iβ 形成異質性的原因。在此我們根據品牌選擇效用模式與品牌偏

好解讀模式,進一步觀察Θ參數用來解釋動態行銷變數與人口統計變數之間的交互

作用關係,如下所示。

品牌選擇效用模式: εβ += XY

品牌偏好解讀模式: ∆+Θ= Zβ

( )ε+∆+Θ= XXZY

根據以上之函數關係我們可以了解,Θ參數是人口統計變數( Z )與行銷環境變數

( X )間交互關係的反應值,它是用來解釋在動態行銷環境變數下,靜態人口統計變數

對於效用函數的影響關係。有關使用人口統計變數解釋品牌選擇效用模式中偏好異

Page 7: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 109 -

質性的相關文獻,包括了 Allenby and Ginter[6];Rossi et al[7];Talukdar,Sudhir and

Ainslie[8]等。根據這些文獻,我們發現除了可以利用人口統計變數針對消費者的偏好

進行預測外,更可以進一步估計新顧客的偏好反應與了解各品牌被購買的機率,以

利於行銷人員做一對一的行銷與品牌市場的定位。

本研究根據品牌偏好解讀模式的基本架構,更進一步的提出混合型態:將市場

區隔機制帶入模式當中。事實上,由於單純使用人口統計變數來解釋偏好常存在著

許多的偏誤,此外有關異質性偏好的分析亦無法利用單一的同質性假設來估計人口

變數的解釋能力,因此本研究針對消費者的變異部分擬採用區隔為 S 個的差異偏好

來解釋,並利用區隔的概念進行參數 sΘ 的估計,以達成將消費者偏好分群,增加偏

好異質性解釋度及確切建立目標市場區隔與品牌定位之目標。有關整體混合型品牌

偏好解讀模式之結構可整理如下:

i

1

∆+Θ=∑=

si

S

ssi Zψβ

[ ] ( )sipi Ns Λ∆=∆ ,0

其中, sΘ 表示不同區隔間有著差異性的偏好解釋,而 i∆ 代表人口統計變數未能

完全解釋異質性偏好的部分。由於各群集間偏好異質性的解釋是以群集的方式來呈

現,且誤差項的部分也存在著具有不同分配型態的可能,因此我們使用了 [ ]si∆ 來

表示不同群集(s)下個別消費者偏好未能加以解釋的變異。由此可知當消費者 i 被區

隔至群集 s ,其解釋偏好為 sΘ 之參數,而誤差項為 [ ] ( )sNS Λ∆ ,0~ ,故其分配可寫

成 [ ] ( )ssipssi ZN ΛΘΛΘ ,~,β 亦即產生群集間不同的偏好解釋效果( sΘ )。此外模式中

參數 Sψ 則表示每一個消費者可能被區隔至 s 集群的機率。換言之,我們將根據 Sψ 的

後驗分配估計結果進行消費者的分群機制。

總而言之,本研究所建構之層級貝氏模式除了包含品牌選擇效用模式與混合型

品牌偏好解讀模式,更針對個別顧客在選擇品牌的次序性資料與顧客本身的人口統

計資料進行分析。相關的分析結果,除了可以在品牌選擇議題上:推估個別消費者

的偏好異質性與各品牌被購買的機率外;對於以人口統計變數解釋異質性偏好方

面:也可以進一步的了解群集間對於偏好有何種不同的解釋,更可以針對不同群集

的消費者進行品牌的定位。

參、參數估計

在了解第二節中層級貝氏的模型架構後,我們將進一步針對所建構模式的參數

後驗分配推導,進行說明。在本研究中,我們將消費者 i 屬於群集 s 之情形定義為

sCZi = ,而其發生之機率表示為[ ] si sCZ ψ== ;之後我們在樣本分配到各群集之機

率 為 sψ 的 條 件 下 , 假 設 每 一 個 群 集 內 的 消 費 者 數 量 是 符 合 多 項 式 分 配

[ ] ( )Ψ=Ψ NMNN S ,亦即,消費者個數隸屬於群集 s 的機率,將符合多項式分配。

綜合上述的變數定義及品牌選擇效用模式與混合型品牌偏好解讀模式的結構,再加

上欲估計參數的先驗機率分配,我們可以進一步的推導出本論文中資料之概似函數

Page 8: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 110 -

與所有欲估計參數的完全條件分配。有關本論文中「品牌選擇效用模式」與「混合

型品牌偏好解讀模式」、各參數先驗分配的假設及資料概似函數的型式可分別彙整如

下。

品牌選擇效用模式: ( ) ( ) m allfor | ,,,,, mjikjiiji YYPkCP ≥== β

( )( )

( )

+=+

≤+

=

=

=

1 if exp1

1

if exp1

exp

1

',,

1

',,

',,

Mkx

Mkx

x

M

mimji

M

mimji

ikji

β

β

β

混合型品牌偏好解讀模式: i1

∆+Θ=∑=

si

S

ssi Zψβ

[ ] ( )sipi Ns Λ∆=∆ ,0

先驗機率分配: ( )[ ] ( )( )00'' , VuvecNvec spqs Θ=Θ

[ ] ( )100 ,| −Λ=Λ GfIW sps

[ ] ( )00 WODirW S Ψ=Ψ

在先驗機率上,我們假設 ( )'svec Θ 是屬於維度為 1×pq 的常態分配; sΛ 是屬於維

度為 pp× 的 Inverted Wishart 分配;Ψ 為 Ordered Dirichlet 分配。

資料概似函數: ( ) [ ][ ] [ ][ ]{ }[ ]ΨΛΘ∏==∏=∏∏====

|1s1

,11

ss

S

iii

n

iiji

J

j

n

ikCZsCZkCP

i

ββ

( )iji

J

j

n

ikCP

i

β=∏∏===

,11

( )sZN ssiip

n

i,,

1ΛΘ∏×

=β ( )Ψ× NMN S

( ) ( )10000

1, , −

=ΛΘ∏× GfIWVuN sspq

S

s( )0WODirS Ψ×

藉由樣本資訊及上述各先驗分配的假設,我們可以利用貝氏理論推導出各參數

的後驗分配。有關在層級貝氏模式中,各參數間的關係架構則可整理如下:

Page 9: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 111 -

[ ] ( ) [ ]sk ssii

J

i

i

,,| CP Rest| ji,1j

ΛΘ=∏∝=

βββ

[ ] [ ][ ]sss

n

s

s

ΘΛΘ∏∝Θ=

, Rest| i1iβ

[ ] [ ] [ ]sssi

n

s

s

ΛΛΘ∏∝Λ=

,| Rest|1iβ

[ ] [ ][ ]

[ ][ ]

[ ][ ]∑∑

===

==

==

==== S

jjii

siiS

jiii

iii

jCZ

sCZ

jCZjCZ

sCZsCZsCZ

11

i

Rest|

ψβ

ψβ

β

β

( ) ( )

( ) ( )∑=

−−

−−

Θ−ΛΘ−−Λ

Θ−ΛΘ−−Λ

=S

jjjiisjiij

ssiissiis

zz

zz

1

1'21

1'21

21exp

21exp

ψββ

ψββ

[ ] [ ][ ]ΨΨ∝Ψ Rest| N

其中 CZ i 代表了消費者 i 所隸屬的群集,而[ ]Rest|sCZi = 則代表了消費者 i 被區

分到群集 s 的機率。事實上此機率的產生主要是以消費者偏好( iβ )被分配到 s 群集的

樣本資訊[ ] sCZii =β 及消費者 i 分配到群集 s 的先驗機率 [ ] si sCZ ψ== 來計算。接著

我們進一步根據消費者 i 被區分到群集 s 的機率( [ ]Rest|sCZi = )進行多項式伯努力

的抽樣,以判定消費者 i 被區隔至哪一個群集,接著進行各群集中消費者人數的加總

( ( )∑=

==n

iis sCZIn

1), 以 了 解 群 集 s 分 配 到 的 消 費 者 總 數 ( )′= snnN ,,1 L , 並 以

( )ΨNMNS 來表示消費者隸屬於各群集之機率型態。在估計[ ]Rest|Ψ 之前,我們先

說明其[ ]Rest|Ψ 的涵義,其中[ ]Rest|Ψ 所表示的是各群集 s 分配到消費者 i 的後驗機

率,換句話說,[ ]Rest|Ψ 所代表的是整個市場中各群集的市場佔有率。因此在估計

參數Ψ 的後驗機率部分,我們將可以利用群集 s 內消費者數量符合多項式分配

( )( )ΨNMNs 以及Ψ 之先驗機率為 [ ]Ψ 的假設,來推導出Ψ 的後驗機率[ ]Rest|Ψ 。

之後我們根據所推導出的參數後驗分配,進一步進行動態分群機制的估計程

序。由於在整個估計的過程中所含蓋的樣本資訊包括了 iβ 、 sΘ 與 sΛ 參數的後驗估

計值,因此 MCMC 將會根據模擬時的迭代過程,計算出樣本資訊中消費者偏好被分

配到群集 s 的機率[ ] sCZii =β ,藉此我們也將進一步計算出 iβ 所屬群集的機率值。

另一方面,由於在估計[ ]Rest|sCZi = 的過程中,其作業也包括了顧客 i 以往所屬群

集的機率值 [ ] si sCZ ψ== ,因此將消費者 i 進行分群時貝氏估計將會一併考慮第 i 個

消費者的樣本資訊與以往分配到群集 s 的先驗資訊。在層級式的估計關係中,消費者

i 被分配到群集 s 的機率值 [ ] si sCZ ψ== 是經由 [ ] [ ][ ]ΨΨ∝Ψ Rest| N 後驗機率所求

Page 10: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 112 -

得,因此,機率值 sψ 的計算將會參考到群集 s 中,樣本資訊[ ] sCZii =β 所得到「各

群集消費者總數」在符合多項式分配 [ ] ΨN 條件下,與先驗機率 [ ]Ψ 來進行動態的

調整。

在本論文中,我們將應用 MCMC 的技術來進行層級貝氏模式中複雜參數的完全

條件分配估計,由於在真正執行 MCMC 模擬時,使用者可根據處理問題的不同而採

用不同的 MCMC 抽樣方法。在本研究中我們將採用 Metropolis-Hastings 抽樣方法來估

計 iβ ,因為 [ ]Restiβ 並無擁有特定的機率分配型態。至於其他的參數部分( sΘ 、 sΛ 、

Ψ、 sCZi = ),則因為其具備了 closed form 的完全條件分配,因此我們將運用 Gibbs

Sampler 的方式來進行參數的估計。

另一方面,在進行 MCMC 抽樣估計之前,我們必須先設定欲估計參數的初始值

以作為實際抽樣的依據。通常若初始值設定偏離 MCMC 的後驗機率參數值太多時,

將會造成模擬時間延長及參數估計不準確的結果,為了解決這樣的問題本研究提出

運用基因演算法的方式來尋找適當的參數初始値,以增加 MCMC 的收斂速度,並提

高參數估計的正確性。因此在整體模式的建構過程中,我們會先針對混合型品牌偏

好解讀模式,利用基因演算法先進行最佳化的分群數量搜尋,以尋求最佳的「分群

數目」。

肆、實證研究

為了說明所建構模式的有效性,在本研究中我們針對台灣某知名連鎖超市從

2001 年至 2002 年的交易紀錄資料進行分析,資料內容包含了基本的會員資料、交易

紀錄與購買之產品及品牌等。為確保模式建構的準確性,我們所選定之產品為 1 公

升裝的國產優酪乳,選定之品牌為優沛蕾優酪乳(原味)(將設定為基本品牌)、林鳳營

優酪乳(原味)、光泉晶球優酪乳(低脂)-及統一 AB 優酪乳(原味);而其市場佔有率分

別為 8%,14%,7%與 10%,其餘 45 種優酪乳產品佔總市場的 61%。此外,資料內

容是以會員為對象,並篩選出消費次數大於 5 筆之資料為分析標的。根據篩選結果,

我們得到總消費者人數為 133 人,總購買次數為 1506 筆的交易紀錄。而每位顧客的

交易記錄當中,包含了人口統計變量(變數為性別、職業、學歷、婚姻、年齡層以

及來店所需時間)及購買記錄(變數為購買日期、購買品項之名稱、購買數量、購

買金額以及商品折價)。

由於資料庫當中的欄位包含了品牌及其相關的促銷價格等資訊,且超市中也常

以不同的促銷方式來增加其商品的銷售,因此本研究將以消費者購買時的價格與品

牌作為本研究的行銷變數,並探討消費者在品牌偏好異質性上與人口統計變數間的

關係。根據實證研究中所選擇的品牌個數,我們將各參數的結構重新定義如下: iβ 表

示消費者 i 的偏好,並且為一個 14× 的向量,此外為了明白表示 iβ 中所包含的變數

內容,在此我們定義 vi ,β 為消費者 i 的第v 個行銷反應量,再者,由於在混合型品牌

偏好解讀模式中我們曾特別針對消費者的偏好進行分群作業,因此我們將加入了群

集定義的 iβ 表示成 vis ,,β ,其中下標符號中的 s 表示群集、 i 表示消費者、v 則表示

所對應的第v 個行銷變數。以相同的資料呈現方式,我們可以將Θ、Λ、Ψ、CZ 參

Page 11: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 113 -

數表示成 vs ,Θ 、 vs ,Λ 、 sΨ 及 isCZ , 。

根據表 2.1 的內容,我們可以了解顧客 i 在第 j 次購買時點的交易資料結構,包

括了當時的行銷變數( jiX , )及顧客所購買的品牌( , kC ji = )。其中,行銷變數( jiX , )為

43× 的矩陣,其變數除了三個相對的品牌(林鳳營、光泉、統一;皆以虛擬變數呈現)

外,也包含了當時三個相對品牌的相對價格(相較於優沛蕾的價格),其中優沛蕾為本

研究之「基本品牌」。在購買品牌資料的呈現方式也是以虛擬變數來表達,其大小

為 13× 的矩陣。舉例來說,根據表 2.1 所彙整的資料結構來看第 1 位顧客( 1=i )在第

1 次的購買行為中( 1=i ),選購統一優酪乳的資料可表示成:

5312100014010012001

×

表 2.1 購買記錄資料方面之資料結構

i j jiX , 為 43× 的結構矩陣 , kC ji =

顧客 ID 購買序號 林鳳營 光泉 統一 與優沛蕾的價差 是否購買

1 1 1 0 0 12 林鳳營 0

1 1 0 1 0 14 光泉 0

1 1 0 0 1 -2 統一 1

1 2 1 0 0 12 林鳳營 1

1 2 0 1 0 17 光泉 0

1 2 0 0 1 17 統一 0

在本研究中,為了能確實提高 MCMC 的模擬效率,我們特別以兩階段方式先針

對 MCMC 欲估計的參數進行初始值的估計。由於在本研究中品牌選擇效用模式是邏

吉斯的型態,因此在第一階段中,我們先利用最大概似估計法求取模式中的參數 iβ值。在接下來的第二階段裡,我們再根據最大概似估計值 iβ ,以基因演算法來推估

混合型品牌偏好解讀模式中各項參數的估計結果。值得注意的是由於混合型品牌偏

好解讀模式是屬於一般廻歸的模式,因此在執行基因演算法時我們是將其目標設定

為最小平方估計法所估計出的∧

Θ s 。簡單來說,在使用基因演算法的過程中,我們是

以總誤差值最小1

S

ss

min SSE=

∑ (其中 sSSE 代表第 s 群的誤差平方和)為目標,並利用

每一次的基因突變與交配,將消費者 i 歸屬於不同的群集 s, sZi =C ,再進行基因子

代的衍生,以求取全域最佳解。

Page 12: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 114 -

如此利用最大概似法並結合基因演算法來估計 MCMC 抽樣分配中初始值設定的

最大優點在於,增加 MCMC 收斂速度並減少抽樣時所耗費的時間成本,此外,更可

以避免人為設定群集數量的偏誤,降低其所可能造成的誤差。

由於在利用層級貝氏方法進行模式的建構前,我們必須要先針對各參數先驗分

配內的參數進行設定,在本論文中我們將各參數的先驗機率假設如表 2.2。

表 2.2 各參數先驗機率設定值

( )[ ]=Θ 'svec

( )( )00' ,| VuvecN spq Θ

[ ] =Λ s

( )100 ,| −Λ GfIW sp

[ ]=Ψ 0W

( )0WODirS Ψ

參數

0u 0V 0f 10−G 0W

初始值設定

1280

0

×

M

M

M

28281000

100000100

×

LLL

MOM

MOM

M

LL

7

441000010000100001

×

1211

×

最後,綜合基因演算法所估計出的參數結果與各相關參數的先驗分配設定(表

2.3),我們利用 MCMC 的方法進行參數 iβ 、 sΘ 、 sΛ 、Ψ、 sCZi = 的模擬與估計,

在設定模擬次數為 50 萬次的情況下,我們發現參數在模擬至 30 萬次左右時,其估

計值已達收斂之狀態,因此我們取最後 2 萬次參數模擬的平均結果作為模式參數的

估計值。根據收斂圖形之結果我們發現,所有參數的模擬數據皆呈穩定水平狀態,

亦即達收斂的結果。

為了進一步驗證提出基因演算法能有效改善 MCMC 的估計效率,我們以行銷變

數價格之估計係數 4,2s == vβ 為對象。分別以「使用基因演算法」及「未使用基因演算

法」之分析結果(如圖 2.1 及圖 2.2)進行說明。根據圖 2.1 所示,我們可以很明顯的發

現價格敏感度的反應值 4,2s == vβ ,在使用基因演算法所產生結果為初始值設定的模式

下呈現收斂狀態;而在「未使用基因演算法」的隨機設定初始值模式下(圖 2.2)在最

後 2 萬次 MCMC 的模擬過程中呈現未收斂的結果。簡單來說,基因演算法成功的加

速了 MCMC 估計的收斂速度且有效率、正確的估計出參數的貝氏後驗機率,以減少

時間成本的浪費。除了收斂圖形的說明外,我們將逐步解釋並介紹模式中各項參數

估計結果的意義與行銷內涵。第一步我們將探討品牌選擇效用模式中個別消費者之

間品牌選擇的偏好異質性。所謂偏好異質性的涵義在於:消費者在購買商品時,會

Page 13: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 115 -

根據本身對每個品牌的偏好程度以及當時各品牌所進行促銷的價格,進行品牌的選

擇,由於消費者之間的偏好結構( iβ )皆不相同,因此消費者的偏好異質性將導致差異

性的消費行為。

圖 2.1 基因演算法設定 MCMC 抽樣,後 2 萬次 4,2s == vβ 估計值的收斂圖

圖 2.2 隨機初始值的 MCMC 抽樣圖,後 2 萬次 4,2s == vβ 估計值的收斂圖

-3.20

-3.18

-3.16

-3.14

-3.12

-3.10

-3.08

1.0E+01 3.0E+03 6.0E+03 9.0E+03 1.2E+04 1.5E+04 1.8E+04

次數

Bet

a 模

擬值

-1.80

-1.75

-1.70

-1.65

-1.60

-1.55

-1.501.0E+01 3.0E+03 6.0E+03 9.0E+03 1.2E+04 1.5E+04 1.8E+04

次數

Bet

a 模

擬值

Page 14: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 116 -

表 2.3 部分消費者之偏好結構( 4~1=i )

消費者偏好結構( iβ ) 1=vβ 2=vβ 3=vβ 4=vβ

1i=β 52.08136 50.43648 53.09589 -3.18126

2i=β 55.31237 47.46318 54.82509 -3.05202

由(表 2.3)中我們可以清楚的觀察到,第一位消費者偏好結構( 1i=β ),與第二位消

費者偏好結構( 2i=β )間的異質性;很明顯的第一位消費者對於價格的敏感度 4,1i == vβ 高

於第二位消費者 4,2i == vβ ,因此將會有較高的促銷反應,且兩群消費者間所偏好的品

牌程度也有所不同,因此偏好結構的差異成為所謂異質性品牌選擇的重要因素。此

外,根據消費者之偏好結構我們可以進一步進行品牌購買行為的預測,若以表 2.3 中

的第一位消費者為例,有關其在動態行銷環境下選擇各品牌的機率將如表 2.4 所示。

我們先假設動態促銷環境為:林鳳營優酪乳折價 10 元、光泉晶球優酪乳折價 5 元、

統一 AB 優酪乳折價 10 元、優沛蕾優酪乳折價 0 元,並根據第一位消費的偏好結構

( 1i=β ),推估出各品牌間的效用函數值( Y j,i )。之後,我們再根據品牌選擇效用模式

中之邏吉斯模型進一步的推導出各品牌的購買機率 ( ) |, iji kCP β= 。換言之,我們可

以利用品牌選擇效用模式中的邏吉斯回歸函式預測各品牌在動態性促銷時,消費者

購買各個品牌的機率,並進一步反應顧客需求以及推薦顧客心中理想之品牌來達到

真正行銷的成效。

表 2.4 第一位消費者在動態促銷環境中選擇品牌的機率

動態環境

品牌 原價 折價

1j,1iX ==

變數

第一位消費者

的 1i=β 1j,1iY ==

( ) |, iji kCP β=

林鳳營 75 元 10 元

光泉 75 元 5 元

統一 75 元 10 元

優沛蕾 58 元 0 元 43

7100120107001

×

143.181-096.53436.50081.52

×

14030.8312.2629.81

×

1400.73

00.27

×

接著我們針對混合型品牌偏好解讀模式的分群估計進行深入的探討。首先我們

根據 MCMC 估計[ ]Rest|sCZi = 與[ ]Rest|Ψ 的結果發現,藉由多項式分配所抽出的

「每一位消費者被區隔到各群集的機率樣本」,我們可以推估出「各群集中消費者的

個數」以及「消費者依其偏好反應而被區隔到不同群集的機率」。而有關兩集群中,

MCMC 在進行抽樣估計後所求得的各群集所涵蓋之消費者人數估計值,包括其平均

數及變異數可彙整如表 2.5 。由表 2.5 中,我們注意到由於抽樣變異數相當的小,表

示可能只有二個至三個消費者介於群集區隔的模糊地帶。此外,為便於本論文後半

段研究之進行我們使用最後一次抽樣之結果作為各個區隔群體內的消費者人數,其

結果為群 I:21 人,群 II:112 人。於最後一次抽樣之分群結果其各群集間的人口統

Page 15: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 117 -

計變數差異不大,其中群集二的各項人口統計變數,就個數的分佈上,皆約佔所有

樣本的 80%。

表 2.5 群集內消費者數量的抽樣平均數與變異數

群一 群二

群集內消費者個數(平均數) 18.93735 114.0627

群集內消費者個數(變異數) 2.895211 2.895211

由於藉著分群機制所獲得的結果,我們可以更進一步的探討顧客選擇品牌的偏

好異質性程度。此外,依據混合型品牌偏好解讀模式的架構,我們也可以了解到消

費者間的偏好異質性,並藉由分群機制下的人口統計變數來進行分群解釋,因此本

研 究 乃 進 一 步 的 針 對 各 群 集 內 的 消 費 者 偏 好 進 行 平 均 值 計 算 的 作 業 ,

S

n

iis n

s

/1

_

∑=

= ββ ,希望能藉此討論到群集區隔間的偏好異質性關係。換句話說,我們

將消費者個人偏好的資訊,藉由不同人口變數的分群解釋,擴展出群集間的偏好差

異性,並以其作為市場區隔中解釋群集差異化的重要指標。但由於分群的架構是基

於「人口統計變數具有解釋不同群集之偏好異質性」的想法,我們乃嘗試利用群集

為指標來描述可能存在的異質性偏好,如此我們當可以針對不同區隔內的偏好,鎖

定目標市場並進行差異化的行銷。根據上述原則,我們將群集間的偏好予以平均

( S

n

iis n

s

/1

_

∑=

= ββ ),並將其結果整理如表 2.6 所示。由表中數據,我們發現在群集一與

群集二之消費者皆偏好林鳳營優酪乳(53.88178 , 55.18492),而對於群集二之消費者而

言有較高的價格敏感度(-3.15202)。

另外,我們根據 [ ] sii ZsE Θ=β 進一步深入探討顧客在選擇品牌時,其偏好異質

性形成不同群集效果的原因,並分析品牌偏好間以及品牌偏好與價格敏感度間的關

係( sΘ ),希望能藉此提供有利於行銷人員進行市場區隔及了解偏好異質性的結構關

係。而相關的分析結果,可彙整如表 2.7 所示。

由於根據混合型品牌偏好解讀模式的型態,我們可以很清楚的觀察到 vis ,,β 的

值將等於 1=vZ (截距項) ,當所有其餘的 vZ 變數值為零時(即 2=vZ = 3=vZ = … = 7=vZ =

0 )。換句話說,當任何一個 vZ 變數值由零轉變為一時, vis ,,β 皆會因此而變動 vs,Θ

的單位。亦即,我們可以藉由不同 vZ 變數(人口統計變數)的調整來進一步推論出消

費者的偏好異質性。接下來我們將根據 vs,Θ 的估計結果逐步的解析其隱藏的行銷意

涵。

對於群集一的消費者而言,男性對於選擇優酪乳的品牌較偏好統一 AB 優酪乳

(2.556399),而女性較男性喜歡光泉晶球優酪乳的產品(-2.45369);而在價格敏感度上,

由於性別在群集ㄧ的影響因素係數較小(0.007153),因此,我們可以進一步推論「促

銷對於性別而言並無顯著的差別」。

Page 16: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 118 -

表 2.6 群集間的偏好差異性

林鳳營品牌偏好

1=vβ

光泉品牌偏好

2=vβ

統一的品牌偏好

3=vβ

價錢敏感度

4=vβ

1s=β 53.88178 53.42425 51.52694 -3.07446

2s=β 55.18492 50.1712 54.88176 -3.15202

表 2.7 顧客選擇品牌時其偏好異質性的群集解釋效果

各品牌偏好及敏感度

林鳳營

1=vβ

光泉

2=vβ

統一

3=vβ

價格

4=vβ

Intercept

1=vZ 54.59657 52.24189 52.89216 -3.49478

性別

(男 1 女 0) 2=vZ 0.694296 -2.45369 2.556399 0.007153

職業

(家庭主婦=0,其他=1) 3=vZ -0.2319 1.015669 -1.07491 0.141316

學歷

(大專以上=1,以下=0) 4=vZ -0.72574 0.526476 0.13525 -0.1116

婚姻狀況

(已婚=1,未婚=0) 5=vZ -1.73689 1.00646 0.029708 0.116838

來店所需時間

(5-10=1,其他=0) 6=vZ -0.25213 1.143826 -1.40253 0.186456

1=Θ s

年齡層

(青年=0,成年=1) 7=vZ 1.539523 -0.88136 -0.55178 0.180824

intercept 1=vZ 55.96151 50.59226 53.62553 -3.06967

性別

(男 1 女 0) 2=vZ -0.1541 -0.17723 0.294571 -0.01678

職業

(家庭主婦=0,其他=1) 3=vZ -0.39098 -0.21933 0.716399 0.029395

學歷

(大專以上=1,以下=0) 4=vZ -0.10006 -0.3783 0.68789 0.105868

婚姻狀況

(已婚=1,未婚=0) 5=vZ -0.83759 -0.55519 1.63786 -0.02059

來店所需時間

(5-10=1,其他=0) 6=vZ 0.167056 -0.00275 -0.11914 0.055942

2=Θs

年齡層

(青年=0,成年=1) 7=vZ 0.154273 0.45846 -0.98631 -0.18629

而在職業方面,家庭主婦較喜歡統一 AB 優酪乳的品牌;且相較於家庭主婦而

言,其他職業者有較低的價格敏感度(0.141316)。大專以上的消費者較偏好光泉晶球

優酪乳,這樣的結果可能是因為光泉的產品訊息刺激高學歷的消費者有較高的偏好

(0.526476);另外學歷較高的消費者也具有較高的價格敏感度(-0.1116)。已婚的消費者

Page 17: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 119 -

對於光泉有高度的品牌偏好(1.00646)。對於需要較長時間才能到達超市消費的顧客

(其他=0)而言,具有較高的價格敏感度,相對的也較容易受到促銷的影響

(0.186456)。至於年齡層方面:成年人對品牌的選擇,以光泉晶球優酪乳的偏好最低,

統一 AB 優酪乳的偏好較高(1.539523),且價格敏感度較低。

對於群集二的消費者來說,男性則較女性偏好統一品牌的優酪乳(0.294571),性

別因素在價格敏感度上較無太大的差異(-0.01678)。至於在職業方面我們可以發現家

庭主婦較偏好林鳳營優酪乳(-0.39098),而其他職業對統一 AB 優酪乳則有較高的偏好

(0.716399)。學歷方面則指出,具有大專以上學歷的消費者,對統一有正向的偏好程

度(0.68789),且對於其它品牌的優酪乳皆有負向的偏好,另外,群集二中具高學歷

的消費者對價格較無敏感(0.105868)。婚姻狀況方面已婚者較偏好統一 AB 優酪乳

(1.63786),對於其他兩個品牌則有排斥的現象,婚姻狀況在價格敏感度上由於數值

很小(-0.02059),所以並無太大的影響。來店所需時間在對品牌的選擇上,顯示出

在價格敏感度上群二與群一的消費者有著相同的結果,對於離店遠的顧客而言對

於折扣的商品則有較高的購買偏好(0.055942)。由於在本研究之實證資料中所選定

之的賣場常常會寄發一些商品目錄與折價商品的優惠資訊給消費者,因此許多較

遠的消費者可能因為資訊的接收而前來消費。年齡層上成年人較偏好光泉

(0.45846),而青年人則是偏好統一的統一 AB 優酪乳(-0.98631)。

另外,我們亦可從縱向方式進行觀察,並說明其實証結果與行銷意涵。針對

林鳳營產品,我們可從人口統計變數中找出婚姻狀況對群集一與群集二的影響最

大。對於其它品牌而言,各集群中影響最大的人口統計變數分別為:光泉是性別(群

集一)、婚姻狀況(群集二);統一為性別(群集一)、婚姻狀況(群集二);價格敏感上

為來店所需時間(群集一)、年齡層(群集二)。這的分析結果也提供了各家廠商一個

新的行銷方向。換言之,商家將可依造不同群體之消費者以及顧客的各種屬性,

進行有效之促銷策略與行銷手法。根據表 2.7 中之數據,我們可以清楚的發現到性

別、婚姻狀況、來店所需時間以及年齡層是影響品牌選擇的四個主要因素。所以

廠商應將產品定位於此基礎上,甚至於在行銷管理上也應朝這四個變數來進行有

效的加強與改進,如此一來除了可以成功的抓住消費者心態外,更可以爲廠商帶

來更多的獲利。

最 後 我 們 根 據 混 合 型 品 牌 偏 好 解 讀 模 式 中 isi

S

ssi Z ∆+Θ=∑

=1

ψβ 以 及

[ ] ( )sipi Ns Λ∆=∆ ,0 的關係,透過群集內同質性的 sΘ 與 sΛ 來解釋消費者在品牌選

擇 時 各 品 牌 間 的 相 關 程 度 。 此 外 , 藉 由 群 集 內 共 變 異 數 相 等 的 假 設 ,

[ ] ( )ssipi ZNs ΛΘ= ,β , 我 們 也 可 以 進 一 步 針 對 群 集 內 的 貝 氏 後 驗 估 計 值

[ ]Rest|sE Λ ,探討品牌偏好間的相關性以及價格敏感度的關係。有關共變異數的

分析結果可彙整如表 2.8 所示。

在此我們先針對相關性以及價格敏感度的涵義進行解釋,依據群集內共變異數

相等的假設,我們可以根據 ( )bvsavsCov == ,, , ββ ( ba ≠ )進一步推論出群集內 avs =,β與 bvs =,β 之間的變動關係。其中品牌間的變動程度可以探究是否呈現替代品或互補

Page 18: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 120 -

品的交互關係,而品牌與價格之間的相關程度則代表著該品牌偏好的上升,是否會

帶動消費者對於其他品牌促銷活動的反應。若消費者對該品牌與價格偏好呈現正相

關時,我們可以推論該消費者對該品牌偏好的上升將會帶動價格偏好的上揚。值得

注意的是由於價格偏好的估計結果皆為負值,因此價格偏好的上升將會造成消費者

對於價格敏感度的降低。亦即消費者將會直接選擇該品牌之產品,而較不考慮其他

品牌的折扣促銷。

表 2.8 貝氏後驗估計值

各品牌偏好及敏感度

sΛ 林鳳營

1=vβ

光泉

2=vβ

統一

3=vβ

價格

4=vβ

林鳳營品牌偏好 1=vβ 1.734564 -2.03445 1.259848 -0.05625

光泉品牌偏好 2=vβ - 3.63666 -3.17306 0.081174

統一的品牌偏好 3=vβ - - 3.331319 -0.10474

1=Λ s

價錢敏感度 4=vβ - - - 0.144893

林鳳營品牌偏好 1=vβ 0.662857 0.469157 -1.35482 -0.00984

光泉品牌偏好 2=vβ - 1.304515 -2.26784 -0.29478

統一的品牌偏好 3=vβ - - 4.576754 0.396477

2=Λ s

價錢敏感度 4=vβ - - - 0.12685

表 2.8 中,我們可以觀察到群集一的消費者對於林鳳營優酪乳與光泉晶球優酪乳

之間呈現著負相關的關係(-2.03445),這表示林鳳營的品牌忠誠度上升將會造成光泉

顧客的流失。換言之,這兩種品牌呈現出互相競爭的態勢;至於林鳳營與統一之間

則較沒有顧客重疊的問題,因此當林鳳營的品牌偏好上升時,連帶也會加深消費者

對統一的品牌偏好程度(1.259848);另外,光泉與統一之間也存在著品牌競爭的特性

(-3.17306)。在品牌偏好與價格敏感度的分析上,光泉品牌的偏好上升呈現較低的促

銷反應(0.081174),因此,若直接對光泉品牌的消費者提昇其品牌偏好將會正向提昇

顧客對該品牌的忠誠度,並減少其他品牌進行促銷時消費者選購光泉品牌的衝擊以

及價格敏的感度,反之亦然。然而,林鳳營與統一兩品牌的效用提昇卻會增加顧客

對於價格的敏感度,因此我們建議林鳳營與統一應利用促銷與折扣方式來保留顧客

以增加獲利之基礎。

至於在群集二內消費者對於品牌選擇的相關性議題上,統一相對於其他兩品牌

呈現顧客重疊且形成相互競爭的情況,而林鳳營與光泉的品牌間較無顧客重疊的問

題;對於價格敏感度方面統一則是呈現明顯的正相關的趨勢(0.396477)。因此增加統

一的品牌偏好時,將會提升顧客選擇統一品牌的忠誠度。就整體而言,群集一與群

集二之消費者皆偏好林鳳營的品牌,而對於群集二之消費者而言有較高的價格敏感

度。

另外,在混合型品牌偏好解讀模式偏好結構的分析結果中,我們可以清楚的發

現到性別、婚姻狀況、來店所需時間以及年齡層在優酪乳品牌的選擇上最具影響效

Page 19: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 121 -

果,因此企業對產品定位或相關的行銷管理議題上皆應以這四個變數為重點進行有

效的加強與改進。如此一來企業除了可以成功的抓住消費者心態,更可以爲企業本

身帶來更多的獲利。最後在探討品牌偏好間相關性及價格敏感度關係方面,我們發

現,光泉晶球優酪乳(群一)與統一 AB 優酪乳原味(群二)兩品牌的偏好上升時,消費

者將會對於其他品牌的促銷價格皆呈現較低的效用反應。換言之,如果我們進一步

提昇顧客的品牌偏好,其結果將會正向的提昇顧客對該品牌的忠誠度,並降低消費

者的價格敏感度,反之亦然。然而,林鳳營品牌的品牌偏好提昇卻會增加顧客對於

價格的敏感度,因此光泉應利用促銷與折扣方式來保留顧客以增加獲利基礎。

伍、結論與後續研究

本研究主要探討層級貝氏模型在資料庫行銷議題上的應用。根據實證分析結

果,我們除了成功的探討了顧客選擇品牌的偏好異質性外,也利用層級貝氏模型清

楚的解析了資料庫中時序性購買紀錄與個別消費者購買行為偏好的異質性。最後,

我們更依據消費者的人口統計變數進行分群能力的解釋,並進一步建構出一個更一

般化的行銷模型。

本論文的研究重點在於,第一,將消費者偏好異質性的部分加以解釋並分群。

雖然消費者的性別、生活環境、教育程度等人口統計變數,會直接影響消費者的購

買意願,但其影響程度卻存在著不同情況下具有不同偏好異質性的解釋效果,本研

究的實證部分證實了以上的想法。此外,我們也針對消費者的偏好進行分群,以判

別不同的人口統計變數會對偏好異質性造成不同的程度的影響。第二,利用基因演

算法的技術,我們成功的縮短了 MCMC 的模擬時間。由於 MCMC 的抽樣理論並無

法保證何時收斂,因此當模式的複雜性增加時,常會造成收斂速度減慢的問題。本

研究利用基因演算法成功的探測出最佳分群個數,並且使用最佳化的方法找出

MCMC 的參數初始值,來加速 MCMC 的收斂速度與效果。

本研究在後續發展上,除了可以在層級貝氏模型中的品牌選擇效用模式部分加

入經濟學的無異曲線概念及產品購買數量變數外,更可以導入經濟學的理論來探討

消費者的行為以增加模式的合理性與解釋性。在 MCMC 估計方面,則可以探討其他

的人工智慧工具來加速模擬抽樣的收斂速度。換言之,利用人工智慧工具應用於層

級貝氏模型中,將會有更多議題可以進行更深入的探討。

參考文獻

1. Allenby, Greg M. (1989), ” A Unified Approach To Identify Estimating And Testing Demand Structures With Aggregate Scanner Data,” Marketing Science, Vol. 8. No. 3. (Summer), 265-280. 2. Allenby, Greg M. and James L. Ginter (1995), “Using Extremes to Design Products and Segment Markets,” Journal of Marketing Research, 32, 392-403. 3. Allenby, Greg M. and Peter J. Lenk (1994), “Modeling Household Purchase

Page 20: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

2005 第九屆科際整合管理研討會

- 122 -

Behavior with Logistic Normal Regression,” Journal of American Statistical Association, 89, 1218-1231 4. Basu, S. and S. Chib (2003), “ Marginal likelihood and Bayes Factors for Dirichletprocess mixture models”, Journal of the American Statistical Association, 98,224-235. 5. Bernardo JM, Smith AFM (1994). “Bayesian Theory”, New York: Wiley. 6. Casella, G. and George, E. (1992).” Explaining the Gibbs Sampler. “The American Statistician 46, 167-174. 7. Currim, Imran S. (1982), ”Predictive Testing Of Consumer Choice Models Not Subject To Independence Of Irrelevant Alternatives,” Journal of Marketing Research, Vol. XIX, (May), 208-222 8. Gelman, A., J. B. Carlin, H. S. Stern, and D. B. Rubin. (1995). “Bayesian data analysis.” Chapman and Hall, New York. 9. Guadagni, Peter M. And John D. C. Little (1983), ”A Logit Model Of Brand Choice Calibrated On Scanner Data, ” Marketing Science, Vol. 2. No. 3. (Summer), 203-238. 10. Jones, Morgan and Jane T. Landwehr (1988), ”Removing Heterogeneity Bias From Logit Model Estimation,” Marketing Science, Vol. 7. No. 1. (Winter), 41-59. 11. Kamakura, Wagner A. and Gary J. Russell(1989), “A Probabilistic Choice Model for Market Segmentation and Elasticity Structure”, Journal of Market Research,33,364-372 12. Kamakura, Wagner A. and Rajendra K. Srivastava (1984), ”Predictive Choice Shares Under Conditions Of Brand Interdependence,” Journal of Marketing Research, Vol. XXI, (November), 420-434 13. Liu, J.S. (2001). “Monte Carlo strategies in scientific computing”, Springer, NY. 14. McFadden, D. (1973), “Conditional Logit Analysis of Qualitative Choice Behavior”, in: Zarembka,P. (ed.), Frontiers in Econometrics, Academic Press. 15. McCulloch, Robert E. and Peter E. Rossi (1994) "An Exact Likelihood Analysis of the Multinomial Probit Model," Journal of Econometrics, 64, 217-228 16. Peter E. Rossi and Greg M. Allenby (2002), “Bayesian Statistics and Marketing”,3-34. 17. Robert, C. P., and G. Casella. (1999).” Monte Carlo Statistical Methods.” Springer-Verlag, New York, New York, USA. 18. Rossi, Peter E., Robert E. McColloch and Greg M. Allenby (1996), “The Value of Purchase History Data in Target Marketing,” Marketing Science, 15, 321-340. 19. Smith, A.F.M. and Roberts, G.O. (1993). “Bayesian computation via the Gibbs sampler and related Markov chain Monte Carlo methods.” Journal of the Royal

Page 21: Application of Hierarchical Bayesian Approach and Genetic … · 2006-03-21 · management systems. To compete effectively in such an environment, business managers have changed their

整合層級貝氏及基因演算法在顧客偏好解讀與市場區隔上之應用

- 123 -

Statistical Society B, 55: 3-24. 20. Talukdar, Debobrata, K. Sudhir, and Andrew Ainslie (2002), “Investing New Production Diffusion Across Products and Countries,” Marketing Science 21, 97-116.