標準化迴歸係數的正確解釋 - national sun yat

16
ISSN 1023-2842 2005 6 pp.533-548 533 標準化迴歸係數的正確解釋 Proper Interpretation of Standardized Regression Coefficients 林新沛 San-Pui Lam 國立中山大學公共事務管理研究所 Institute of Public Affairs Management National Sun Yat-Sen University 摘 要

Upload: others

Post on 21-Feb-2022

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 標準化迴歸係數的正確解釋 - National Sun Yat

ISSN 1023-2842 中山管理評論 2005 年 6 月號 第十三卷第二期 pp.533-548

~533~

標準化迴歸係數的正確解釋

Proper Interpretation of Standardized Regression Coefficients

林新沛 San-Pui Lam 國立中山大學公共事務管理研究所

Institute of Public Affairs Management National Sun Yat-Sen University

摘 要

多元迴歸裡的標準化迴歸係數常被用來表達一個自變項的作用、預測力或

解釋力。但是,學界和管理者對標準化迴歸係數的解釋卻仍時有錯誤。本文以

假設性的數據為例,配合數學演算証明:當自變項超過兩個時,標準化迴歸係

數並不適合作為評斷自變項相對重要性的唯一依據。同時,本文也透過例子指

出:即使自變項只有兩個,一個自變項的標準化迴歸係數在統計上不顯著也不

表示該變項不重要。根據這些迴歸係數的特性,本文針對過去管理學文獻對標

準化迴歸係數的應用與解釋,和統計及研究方法教科書容易讓人誤解的部分,

提出了討論和建議。本文並舉出正確解讀迴歸係數的注意事項,並指出如何結

合其他資訊探討多元迴歸裡自變項的重要性。

關鍵字:標準化迴歸係數、零階相關、壓抑變項

Page 2: 標準化迴歸係數的正確解釋 - National Sun Yat

標準化迴歸係數的正確解釋

~534~

Abstract

The standardized regression coefficient has been a common tool for assessing the effect,

predictive power or explanative power of an independent variable (IV). However, researchers

and managers often failed to interpret regression coefficients properly. With mathematical

proofs and hypothetical data, this paper demonstrated that when there are more than 2 IVs,

inference on the relative importance of these IVs should not be made from standardized

regression coefficients (βs) alone. The hypothetical data also show that even when there are

only 2 IVs, the nonsignificance of a β does not give sufficient evidence on the triviality of the

corresponding IV. According to these limitations on βs, this paper discuss expression problems

in textbooks on research methods and statistics, as well as problems in the management science

literature. How βs should be properly interpreted with other information—such as zero-order

correlations—is also discussed.

Keywords: Standardized Regression Coefficient, Zero-order Correlation, Suppressor

Variable

壹、前 言

多元迴歸(multiple regression)是管理及行為科學上常用的一種統計技

術,而標準化迴歸係數(standardized regression coefficients)1 則是一個常用

的指標,用來表達一個自變項(independent variable)的預測力或解釋力。但

是,研究者卻常忽略一個條件:當自變項超過兩個時,標準化迴歸係數的大小

並不適合作為評斷自變項相對重要性的唯一依據。同時,即使自變項只有兩

個,一個自變項的標準化迴歸係數在統計上不顯著也並不表示該變項對依變項

(dependent variable)不重要。本文的目的是要說明這些解釋上的問題,和提

出正確解釋標準化迴歸係數的準則。由於未標準化迴歸係數不適用於比較一個

迴歸模式中自變項的相對重要性,因此下文將僅討論標準化的迴歸係數,並以

「迴歸係數」簡稱之。

1 Regression coefficients又稱作 partial regression coefficients,後者一般譯作淨迴歸係數或偏迴歸係數。

Page 3: 標準化迴歸係數的正確解釋 - National Sun Yat

中山管理評論

~535~

貳、概念分析

一個自變項和一個依變項間的關係,至少可以透過三個指標來了解。首先

是零階相關(zero-order correlation),它是在忽略(ignore)其他變項的時候,

某兩個變項之間的相關。例如,當我們直接計算員工教育程度和其工作績效間

的相關,而不管所有其他變項時,所求得的便是一項零階相關。一般而言,當

我們直接計算兩個變項間的皮爾生相關(Pearson’s correlation)時,該結果便

是一項零階相關。

另一種反映兩個變項間關係的指標是部分相關(part correlation 或

semipartial correlation);它是在扣除其他變項與某個自變項(例如 X1)的關係

後,該自變項(X1)與依變項間的相關。例如,當我們利用統計方法把年齡

對員工教育程度的影響扣除後,再計算員工教育程度和其工作績效間的相關,

那麼得出的便是教育程度和工作績效的部分相關。零階相關和部分相關的差

異,可由圖 1來說明。

a

b

cd

X

X

Y

1

2

圖 1 兩個自變項與依變項間的相關

在圖 1 中,X1和 X2是兩個自變項,Y 是依變項,a+b 是 X1和 Y的所有

重疊部分,(a+b)/(a+b+c+d) 表示全部可由 X1解釋的 Y的變異量比例。若令 ry1

表示 X1和 Y之間的零階相關,則 r2y1便等於(a+b)/(a+b+c+d)。另一方面,a是

在「X1和 Y的重疊面積」中扣除與 X2重疊的部分後的剩餘面積,a/(a+b+c+d)

是扣除 a+b 中 X2可以解釋的部分後,X1可以解釋的 Y 的變異量比例。若令

sry1表示 X1和 Y之間的部分相關,則 sr2y1便等於 a/(a+b+c+d)。當自變項只有

兩個時,部分相關和零階相關(以 Pearson 相關計量)的關係又可以公式(1)

Page 4: 標準化迴歸係數的正確解釋 - National Sun Yat

標準化迴歸係數的正確解釋

~536~

表示:

212

1212y22

12

1221y1

1 ,

1

r

rrrsr

r

rrrsr yyyy

−=

−= ……(1)

式中 ry1表示 X1和 Y 之間的零階相關,ry2表示 X2和 Y 之間的零階相關,r12

表示 X1和 X2之間的零階相關,sry1表示 X1和 Y 之間的部分相關,sry2表示

X2和 Y之間的部分相關。

反映兩個變項間關係的第三種指標是迴歸係數。和部分相關一樣,迴歸係

數所表示的是在扣除其他變項對一個自變項的影響後,該自變項與依變項的關

係。不同的是,迴歸係數並非以「解釋多少依變項的變異」的方式,而是以「當

自變項增加一個單位時,依變項會增加(或減少)幾個單位」的方式來呈現此

一關係,也就是該自變項的淨作用(partial effect)。從圖 1可知,a的面積會

隨著不同的 X2而改變。換言之,隨著被控制或被排除的自變項的不同,一個

特定自變項和依變項之間的部分相關也會不同。從公式(2)或(3)可知,迴歸係

數也有此一特性:

212

121222

12

12211 1

,1

r

rrr

r

rrr yyyy

−−

=−−

= ββ ……(2)

212

222

12

11

1 ,

1

r

sr

r

sr yy

−=

−= ββ ……(3)

式中β1, β2為與迴歸方程式 Y = b0 + b1X1 + b2X2 + error中未標準化迴歸係數 b1

和 b2對應的標準化迴歸係數。

總之,零階相關表達的是一個自變項與依變項之間的全部關係,部分相關

和迴歸係數則是反映一個自變項與依變項的獨特的,不能由其他自變項來解釋

的關係。一般而言,這兩種關係並不相同。

Page 5: 標準化迴歸係數的正確解釋 - National Sun Yat

中山管理評論

~537~

一、迴歸係數大小與自變項相對重要性:兩個自變項的情形

若自變項只有兩個,迴歸係數絕對值的相對大小和零階相關絕對值的相

對大小相同。這時候,僅由迴歸係數絕對值的相對大小就足以看出「自變項的

相對重要性」,亦即和迴歸方程式裡其他的自變項相比,某個自變項對依變項

的作用是更大或更小。其証明如下:2

若 |β 1 | > |β 2 | 則 β 12 > β 2

2 且從公式 (2)可知

||||

)1()1(

22

21

22

21

212

22

212

21

212

22

22

212

21

21

212

21

22

212

22

21

212

211212

22

212

221221

21

yy

yy

yy

yyyy

yyyy

yyyyyyyy

rr

rr

rrrr

rrrrrr

rrrrrr

rrrrrrrrrrrr

>⇒

>⇒

−>−⇒

−>−⇒

+>+⇒

+−>+−

故 |β 1 | > |β 2 | ⇔ |ry1 | >|ry2 |。

同理,依據公式(1)也可証明在只有兩個自變項的情形下,部分相關絕對

值的相對大小也和零階相關絕對值的相對大小相同,也即|sry1| > |sry2| ⇔ |ry1|

>|ry2|。因此,在只有兩個自變項的情形下,|β1| > |β2| ⇔ |sry1| > |sry2| ⇔ |ry1| >|ry2|。

二、迴歸係數顯著性與自變項絕對重要性

即使迴歸係數絕對值的相對大小可顯示自變項的相對重要性,迴歸係數的

統計顯著性卻未必能反映自變項的「絕對重要性」。也就是說,某個自變項對

依變項的作用究竟是大或小,是否值得注意,未必僅能從其迴歸係數的統計顯

著性來判斷。這可以由表 1、表 2及表 3的例子來說明。

表 1是假設的數據,其中 X1, X2, X3, X4是自變項,Y1, Y2, Y3是依變項,

以下的表格數據都是根據表 1的數據進行多元迴歸分析而產生。表 2是以 X1

2 感謝羅春光教授和黃士峰先生協助此部分的証明。

Page 6: 標準化迴歸係數的正確解釋 - National Sun Yat

標準化迴歸係數的正確解釋

~538~

和 X2預測 Y1而得的結果,其中 B是未標準化的迴歸係數,SEB是其標準誤,

rX1,X2是 X1和 X2之間的零階相關。從表 2 可見,若不考慮其他變項,X1可解

釋 Y1 79%的變異(r2Y1,X1 = .892 = .79),但在扣除 X2的貢獻後,X1僅能解釋

Y1 7%的變異(sr2Y1,X1 = .272 = .07)。雖然 X1和 X2都跟 Y1有高相關(rY1,X1 = .89,

rY1,X2 = .94),但由於 X1和 X2間的相關甚高(rX1,X2 = .75),X1的迴歸係數並不

顯著。如果研究者只從迴歸係數的顯著性來解釋 X1和 X2的作用,便會作出「X1

與 Y1無關」或「X1對 Y1沒有顯著影響」的錯誤結論。

表 1 假設數據

X1 X2 X3 X4 Y1 Y2 Y3

1 2 4 3 1.8 2 2

2 2 2 4 1.8 2 3

3 2 3 4 2.6 3 3

4 3 1 2 3.2 3 3

4 4 4 2 4.2 4 3

4 5 3 5 4.4 4 4

表 2 以 X1 及 X2 預測 Y1 的迴歸分析結果

與 Y1 之間的 相關係數

B SEB β t p 零階相關

r 部分相關

sr

常數 .171 .324 .529 .634 X1 .371 .144 .413 2.583 .082 .889 .273 X2 .571 .144 .635 3.974 .028 .944 .420

rX 1 , X 2 = .750, R2 = .966

同理,從表 3可見,雖然 X1和 X2都跟 Y2有高相關(rY2,X1 = rY2,X2 = .88),

但 X1和 X2的迴歸係數卻都不顯著。如果研究者只從迴歸係數的顯著性來解

釋,便會作出「X1和 X2都與 Y2無關」或「X1和 X2都對 Y2沒有顯著影響」

的錯誤結論。而一個正確的結論大概可以如此說:

Page 7: 標準化迴歸係數的正確解釋 - National Sun Yat

中山管理評論

~539~

X1及 X2都和 Y2有同樣的高度相關(零階相關 rY2,X1 = rY2,X2 = .88),但由

於這些自變項間有許多的重疊,因此當在扣除 X1與 X2的重疊部分後,X1和

Y2的相關便降低(部分相關 srY2,X1 = .33),而 X1對 Y2的預測力也變得不顯著

(βX1 = .51, p > .05)。同樣的情形也發生在 X2對 Y2的預測力上。換言之,對

Y2而言,無論 X1或 X2都是重要的變項,但是同時考慮 X1和 X2並不比單獨考

慮其中一者更能有效地預測 Y2。3

表 3 以 X1 及 X2 預測 Y2 的迴歸分析結果

與 Y2 之間的 相關係數

B SEB β t p 零階相關

r 部分相關

sr

常數 .857 .456 1.882 .156 X1 .357 .202 .505 1.768 .175 .884 .334 X2 .357 .202 .505 1.768 .175 .884 .334

rX 1 , X 2 = .750, R2 = .893

三、迴歸係數大小與自變項相對重要性:多個自變項的情形

當自變項超過兩個時,sr可由公式(4)或(5)求得(參考 Cohen, 1983, p. 102;

Pedhazur, 1982, p. 119)。式中 sryi和βi分別是以 I個自變項預測 Y時,第 i個自

變項(Xi)的部分相關和迴歸係數;R12…I是全部 I 個自變項都用來預測 Y時

而產生的的複相關(multiple correlation),R12…(i)…I是除 Xi以外其他 I-1個自變

項都用來預測 Y 時的複相關,Ri.12…(i)…I是 Xi以外其他 I-1 個自變項都用來預

測 Xi時的複相關。

IiIyi RRsr )......(122

...1222 −= ……(4)

Iiiiyi Rsr )......(122

1 ⋅−= β ……(5)

3 進一步分析可以發現,無論是從 Y2 = b0 + b1X1 + error或 Y2 = b0 + b2X2 + error模式擴展至 Y2 = b0 + b1X1 +

b2X2 + error模式,所增加的可解釋變異量(∆R2)均為 .11, F(1, 3) = 3.13, p> .05。這顯示當 X1和 X2其中

一個自變項已被用來預測後,另一個自變項的新增貢獻甚少;這也更支持了上述的結論。

Page 8: 標準化迴歸係數的正確解釋 - National Sun Yat

標準化迴歸係數的正確解釋

~540~

從公式(5)可知,sr的正負號和其對應的β的相同。從公式(4)可推知,sr2yi

並不一定比 Y 和自變項 Xi之間的相關平方(r2yi)大或小,而即使知道 Xi的

部分相關平方大於另一個的自變項(Xj)的部分相關平方(sr2yi > sr2

yj)也無

法推知 r2yi > r2

yj。因此,部分相關絕對值的相對大小和零階相關絕對值的相對

大小不一定相同。唯一的例外是當 I = 2,亦即自變項只有兩個時。這時,從

公式(4)可知

sr2y1 - sr2

y2 = (R21 2 - r2

y2) – (R21 2 -r2

y1) = r2y1 - r2

y2

而因此|sry1| > |sry2| ⇔ sr2y1 > sr2

y2 ⇔ r2y1 > r2

y2 ⇔ |ry1| >|ry2|。同時,從公式(4)

和(5)可得公式(6),而從公式(6)可以發現:從 sr2yi > sr2

yj無法推知β2i > β2

j,反

之亦然。由此可見,在自變項超過兩個的情形下,迴歸係數絕對值的相對大

小,部分相關絕對值的相對大小和零階相關絕對值的相對大小都不一定相同。

)1(

)1(

)......(1222

)......(1222

2

2

Ijj

Iii

yj

yi

R

R

sr

sr

j

i

−=

β

β ……(6)

以表 4為例,它是以 X1, X2和 X3預測 Y2而得的結果(原始數據見表 1)。

雖然從表中的零階相關可知,X1和 X2都與 Y2有高相關(rY2,X1 = rY2,X2 = .88),

且此關係遠強於 X3與 Y2的相關(rY2,X3 = .19),但 X2的迴歸係數(βX2 = .20, p

> .05)卻低於 X3的係數(βX3 = .39, p < .05)。這是因為 X2雖然與 Y2有較高的

相關,但在扣除X1和X2的重疊部分後,X2對Y2的獨特貢獻便所剩無幾(sr2Y2,X2

= .112 = .01),還低於 X3對 Y2的獨特貢獻(sr2Y2,X3 = .322 = .10)。從表 4也可

發現,部分相關的大小順序和零階相關的也不相同。

表 4 以 X1, X2 及 X3 預測 Y2 的迴歸分析結果

與 Y2 之間的 相關係數

B SEB β t p 零階相關 r 部分相關 sr 常數 -.052 .203 -.258 .821

X1 .592 .070 .837 8.396 .014 .884 .456 X2 .144 .068 .204 2.103 .170 .884 .114 X3 .298 .051 .390 5.864 .028 .191 .318

rX 1 , X 2 = .750, rX 1 , X 3 = -.271, rX 2 , X 3 = .135, R2 = .994

Page 9: 標準化迴歸係數的正確解釋 - National Sun Yat

中山管理評論

~541~

由於上述迴歸係數的特性,當自變項超過兩個時,研究者便不應只從迴歸

係數(的絕對值)來解釋自變項的貢獻──除非研究者真的只關心自變項的淨

作用。事實上,許多管理學研究裡的自變項都不容易在「不影響其他自變項的

情況下」被獨立操弄。例如,「高階主管支持度」和「對電腦資訊系統之態度」

曾被列為一項管理研究(孫敏育,陳鴻基,1997)的自變項;但在現實裡我們

很難只改變「高階主管(對員工使用電腦資訊系統的)支持度」而不影響到「(員

工)對電腦資訊系統之態度」。所以,雖然可以經由迴歸分析,在統計上將「對

電腦資訊系統之態度」排除以觀察「高階主管支持度」的淨作用或直接效果,

但在現實世界裡「高階主管支持度」的作用卻常常是結合了它的直接效果與它

透過其他變項(包括「對電腦資訊系統之態度」)所產生的間接效果。因此,

一個關心研究的應用意義的研究者,往往不能只考慮自變項的淨作用。

在實務上,管理者也應注意(從零階相關檢視)自變項的全部作用,而不

該只注意自變項的淨作用。譬如,管理者可能從迴歸分析發現,「在排除教育

程度的作用以後」,員工的年齡對其工作績效有正的淨作用。但是管理者如果

只因為看到這淨作用就儘量錄取高年齡的求職者,便可能得不償失。因為,在

實際的情況裡管理者並無法排除「教育程度與年齡的相關」和「教育程度與工

作績效的相關」。假設因為年代的不同,年齡愈高者教育程度愈低,而教育程

度又與工作績效的相關有正相關,那麼大量錄用高年齡者的結果,可能使整個

組織的工作績效不增反降。尤其是當教育程度的作用大於人生閱歷、工作經

驗、心理成熟度等與年齡有正相關的變項的作用時,錄用高年齡者的負面影響

將更明顯。

回到表 4的例子,假設 X1 = 教育程度,X2 = 甄試成績,X3 = 年齡,Y2 =

工作績效,則對表 4的結果大致可作如下說明:

以員工的教育程度、甄試成績和年齡為自變項,幾乎可以預測他們工

作績效的所有變異(R2 = .99)。但只有教育程度和年齡在迴歸分析裡有顯

著的貢獻(β = .84, .39, p < .05);在扣除與迴歸分析裡的其他變項的關係

後,它們分別可以單獨解釋工作績效 21% 和 10% 的變異(sr = .46, .32)。

三個自變項有彼此重疊的部分可解釋工作績效另外 99% - 21% - 10% - 1%

= 67% 的變異(1% 是可被甄試成績單獨解釋的變異量)。雖然甄試成績

和工作績效的零階相關高達 .88,而且顯著大於零(p = .02),但它在迴歸

分析裡卻是不顯著的。這大概是由於它與工作績效的大部分相關都是透過

教育程度而產生。如果要參考這三個自變項來晉用新人,教育程度無疑是

Page 10: 標準化迴歸係數的正確解釋 - National Sun Yat

標準化迴歸係數的正確解釋

~542~

最優先的考慮,因為它的迴歸係數和零階相關都是最大。如果有許多人可

以挑選,則可進一步考慮在高教育程度者中晉用年紀較高者。最後,如果

公司沒有應徵者的教育程度資料,那麼甄試成績將是最佳的錄取依據,因

為它的零階相關遠高於年齡的零階相關,而且它與年齡間的相關也甚低

(rX2,X3 = .14)。

參、文獻回顧

一、管理科學論文裡的迴歸係數解釋問題

根據上述關於迴歸係數的特性,過去文獻中許多針對迴歸係數的應用與解

釋仍有待改進。例如,孫敏育,陳鴻基(1997)透過迴歸分析探討「高階主管

支持度」、「對電腦資訊系統之態度」等變項對「終端使用者電腦應用」

(End-User Computing, EUC)的相對解釋能力,而其比較自變項間相對解釋

能力或相對重要性則是以迴歸係數為依據。謝明助(2001)利用逐步迴歸

(stepwise regression),探討態度、主觀規範(subjective norm)和知覺到的行

為控制(perceived behavioral control)4 對環境倫理決策意向的預測力。由於

發現僅有態度的迴歸係數達到顯著,於是作者結論說「似可認為『主觀規範、

控制認知』則較不重要」(頁 74)。朱斌妤、葉旭榮、黃俊英(2002)利用結

構方程式模型(structural equation modeling)來分析參與老人福利機構志工的

行為意向。他們的一個結論是:

相對已擔任老人福利機構的志工而言,「行為控制知覺」對於一般市民

「擔任老人福利機構志工」的行為意向更為重要([徑路]係數為 0.83),

「態度」(係數雖顯著,僅 0.08)與「主觀規範」(係數雖顯著,僅 0.02)

則相對不重要。(頁 492-493)

上述這些作者對於其研究結果的結論雖然不一定錯誤──迴歸係數所顯

示的自變項相對重要性,「不一定」和由零階相關所顯示的相同或不同──但

他們都沒有結合變項間零階相關的結果來解釋自變項的相對重要性,便「有可

4 在中文文獻裡,perceived behavioral control有不同的翻譯方式,例如「行為控制知覺」、「知覺行為控制」

等。為求統一用詞,除非是引述(quote)文獻的用詞,本文一概以「知覺到的行為控制」來稱之。

Page 11: 標準化迴歸係數的正確解釋 - National Sun Yat

中山管理評論

~543~

能」產生錯誤的結論。5 而且,除非論文裡有特別強調作者只是關心自變項的

淨作用,否則有關的結論也容易誤導讀者。

即使沒有導致錯誤的結論,忽略零相關也會使原本可以更豐富的討論流於

表面或空洞。例如,在一篇發表於公共事務與管理的期刊的論文(許朝傑,2002)

裡,作者發現態度、主觀規範、知覺到的行為控制三者跟學生升學意向的零階

相關分別為 .441, .278, .179;但主觀規範的迴歸係數(β = .002)則低於知覺

行為控制的迴歸係數(β = .383),而且前者不顯著(p = .96),後者非常顯著

(p < .001)(頁 145)。同時該研究也發現,當在詢問受測者「您會因主觀規

範的差別而影響自己的行為意向嗎?」時,受測者回答的平均分數是 4.26;當

在詢問受測者「您會因知覺行為控制的差別而影響自己的行為意向嗎?」時,

受測者回答的平均分數是 3.38(頁 148)。由於這些題目是以 1至 5分的量表

測量,愈高分表示愈同意,因此上述平均數顯示,受測者認為自己受主觀規範

的影響,多於受知覺行為控制的影響。作者原可根據零階相關和上述平均數的

結果,以及這些結果和迴歸係數結果間的矛盾,進一步深入討論。(較適當的

一個結論是:「主觀規範」對於升學意向的影響,高於「知覺行為控制」的影

響;但由於「主觀規範」有部分作用是透過「態度」而產生(主觀規範與態度

間的相關為 .316),因此在扣除「態度」的作用後,「主觀規範」的淨作用便

不顯著。)但作者在討論只說:「『主觀規範』則在待進一步研究」(頁 149),

使此部分的討論顯得薄弱。

二、教科書裡的迴歸係數解釋問題

此種忽略零階相關,不當解讀迴歸係數的風氣的形成,也許和一些統計及

研究方法的教科書有關。例如,林清山(1998)以一個有兩個自變項的迴歸分

析為例時提到:「由標準分數化的迴歸係數可大約看出兩個預測變項變數的相

對重要性」(p. 560)。榮泰生(1997)在以一個含兩個自變項的例子說明迴歸

分析時說:「不要以為有比較大的[未標準化的]係數的自變數會比較重要……

但如果我們將這些迴歸係數加以標準化之後,就可以做相對的比較。」(頁

557)。這些話雖然正確,但由於兩位作者均未進一步強調此種作法只適用於僅

有兩個自變項的情況,許多讀者難免產生誤解。

5 因標準化迴歸係數與徑路係數(path coefficients)同義,故本文有關於標準化迴歸係數的討論也適用於結

構方程式模型中的徑路係數。

Page 12: 標準化迴歸係數的正確解釋 - National Sun Yat

標準化迴歸係數的正確解釋

~544~

Emory and Cooper (1991) 以一個有三個變項的例子指出,研究者可以憑

迴歸係數的大小來判定自變項的相對重要性。他們說:

The beta weights show the relative contribution of the three independent

variables to the explanatory power of the equation. They show, for

example, that household income [β = .617] explains more than do either of

the other two variables [βs = .276, .449]. (p. 632)

雖然他們稍後補充(見 Emory & Cooper, p. 634),當自變項間的相關甚高

時,便不宜以迴歸係數來比較自變項的相對重要性,但部分讀者可能並未注意

到此一但書。

肆、迴歸係數的一種應用:壓抑變項的探討

事實上,研究者在利用迴歸係數來比較自變項的相對重要性時,必須同時

考慮自變項與依變項的零階相關,和各自變項間的相關(Tabachnick & Fidell,

2001)。若迴歸係數與零階相關出現看似矛盾的結果,這往往代表一種更有趣、

更具意義的發現。最典型的一種情況是壓抑變項(suppressor variable)的問題。

以表 1的假設數據及表 5的結果為例,X1與 Y3的零階相關和 X4與 Y3的零階

相關雖都甚高(rY3,X1 = .75, rY3,X4 = .52),但都不顯著(p = .09, .29)。在移除

X4的影響後,X1與 Y3的相關變強(srY3,X1 = .83),而其迴歸係數也非常顯著

(βY3,X1 = .83,p < .01)。這顯示 X4是一個壓抑變項,在排除它的影響後,X1

的作用可以更彰顯。同理,在本例中 X1也是對 X4的一個壓抑變項。

上面這種「互相壓抑」(reciprocal suppression)的現象有可能出現在管理

的例子裡。例如,年資和教育程度可能是互相壓抑的變項,它們之間的負相關

(假設年資較高者年齡也較大,早期所受教育程度較低)壓抑了彼此對工作績

效的作用。在多元迴歸裡,它們的作用可透過迴歸係數而凸顯。討論此種互相

壓抑的關係,和討論自變項作用的相對大小是同樣有趣,甚至更有趣、更有意

義。6 而唯有透過迴歸係數(或部分相關)和零階相關的比較,此種壓抑的關

係才可以凸顯。

6 關於壓抑變項的更詳細討論,可參考 Cohen (1983) 或 Tabachnick and Fidell (2001)。

Page 13: 標準化迴歸係數的正確解釋 - National Sun Yat

中山管理評論

~545~

表 5 以 X1 及 X4 預測 Y3 的迴歸分析結果

與 Y3 之間的 相關係數

B SEB β t p 零階相關

r 部分相關

sr

常數 .653 .314 2.080 .129 X1 .416 .063 .832 6.647 .007 .750 .825 X4 .329 .065 .631 5.038 .015 .522 .626

rX 1 , X 4 = -.131, R2 = .954

有時候,和依變項無關的變項也可能有壓抑作用。例如,假設有一項研究

要探討「某部門主管對員工工作能力的評分能否預測日後員工的真正表現」和

「主管對個別員工的好感會否影響日後員工的真正表現」,並得出如表 6的原

始數據及表 7 的結果。從表 7 可知,主管對員工的好感(X6)和員工的日後

表現(Y4)間沒有相關(rY4,X6 = .06),但以 X6和主管評分(X5)同時預測員

工日後表現時,預測力(R2 = .32)則高於主管評分的單獨預測力(r2Y4,X5 = .512

= .26)。由此可見主管對員工的好感是一個壓抑變項。

表 6 員工表現與其預測變項的原始數據(假設數據)

Y4: 員工半年後

真正表現(後測) 56 68 52 95 72 59 84 95 71 97

X5:

主管評分(前測) 24 28 23 36 29 25 27 29 24 23

X6: 主管對個別員工的

好感(前測) 53 75 52 68 62 66 59 52 49 57

Page 14: 標準化迴歸係數的正確解釋 - National Sun Yat

標準化迴歸係數的正確解釋

~546~

表 7 以 X5 及 X6 預測 Y4 的迴歸分析結果

與 Y4 之間的 相關係數

B SEB β t p 零階相關

r 部分相關

sr

常數 34.12 41.88 0.82 .44 X5 2.83 1.56 0.67 1.82 .11 .51 .57 X6 -0.59 0.74 -0.29 -0.80 .45 .06 -.25

rX 5 , X 6 = .54, R2 = .32

事實上,當一個自變項的迴歸係數和它與依變項的零階相關有不同的正負

號時(在本例中βY4,X6 = -0.29, rY4,X6 = .06),這往往表示該自變項是個壓抑變

項。這時候,我們不宜僅從迴歸係數來解釋該自變項的作用;更適當的解釋是

強調該自變項的「減少預測誤差」功能。就本例而言,以主管評分單獨預測員

工日後表現時,有 1- r2Y4,X5 = 1- .512 = 74%的誤差變異量;而在控制了主管對

員工的好感之後,以主管評分便可解釋員工日後表現 sr2Y4,X5 = .572 = 32%的變

異,誤差變異量降至 68%。這顯示主管評分與主管對員工的好感間的相關包

括了部分上述的誤差變異量;換言之,以主管評分來預測員工日後表現時,部

分的預測誤差是和主管對員工的好感有關(例如,對於自己較陌生的員工,主

管比較無法根據員工過去的表現來評估其未來工作能力,卻是根據對這些陌生

員工的大概印象而評分)。

伍、結 論

迴歸分析是管理研究上一項非常有用而普遍的統計技術。標準化的迴歸係

數可以顯示個別自變項的淨作用,讓研究者得到無法單從零階相關可以獲得的

訊息。但是──大概是過去教科書較少強調的關係──許多研究者都忽略了一

個重要的事實:如果沒有同時配合各變項間的零階相關來解釋,標準化的迴歸

係數可能會誤導我們對自變項作用的理解,尤其是對於自變項間相對重要性的

理解。

在實務上,管理者常常無法在「不影響其他自變項的情況下」獨立操弄某

Page 15: 標準化迴歸係數的正確解釋 - National Sun Yat

中山管理評論

~547~

些自變項。這時候管理者所關心的,不應只有各自變項的淨作用,更應包括各

自變項透過其他變項所產生的間接作用。換言之,除了藉由標準化迴歸係數來

了解自變項的淨作用以外,管理者也該從零階相關來檢視自變項的全部作用。

總之,要理解多元迴歸裡自變項的重要性,必須綜合三項資訊:(1)自變

項與依變項的零階相關;(2)標準化迴歸係數,和自變項與依變項的部分相關;

以及(3)各自變項間的零階相關。此一綜合不僅可以避免可能的誤解,並能讓

解釋更完整,甚至發現更有趣、有意義的現象。希望這篇文章可以喚起研究者

與管理者對零階相關的重視,並改變大家對多元迴歸結果討論的寫作習慣。

參考文獻

朱斌妤、葉旭榮、黃俊英,2002,「志工參與行為意向模式的建構及其在老人

福利機構志工招募的應用」,管理學報,19卷 3期:475~505。

林清山,1998,心理與教育統計學,台北市:東華書局。

孫敏育,陳鴻基,1997,「影響『終端使用者電腦應用』績效因素之實證研究」,

中山管理評論,5卷 4期:797~824。

許朝傑,2002,「學生升學選擇意願行為之研究──計劃行為論理論之模式應

用」,公共事務評論,3卷 2期:143~154。

榮泰生,1997,企業研究方法,台北市:五南。

謝明助,2001,影響企業經理人環境倫理決策意向之相關變項研究─以製造業

事業廢棄物清理為例,國立中山大學企業管理學系碩士論文。

Cohen, J. 1983. Applied multiple regression/correlation analysis for the behavioral

sciences. (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum Associates.

Emory, C. W., & Cooper, D. R. 1991. Business research methods. (4th ed.) Boston,

MA: IRWIN.

Pedhazur, E. J. 1982. Multiple regression in behavioral research (2nd ed.). New

York: Holt, Rinehart, and Winston.

Page 16: 標準化迴歸係數的正確解釋 - National Sun Yat

標準化迴歸係數的正確解釋

~548~

Tabachnick, B. G., & Fidell, L. S. 2001. Using multivariate statistics (4th ed.).

Needham Heights, MA: Allyn & Bacon.