to be master or slave of statistics

48
To be master or slave of statisticsComparisons among SPSS, SEM, HLM, PLS 張偉豪 三星統計服務有限公司 執行長 AMOS亞洲一哥

Upload: beckett-hsieh

Post on 21-Jan-2018

721 views

Category:

Education


3 download

TRANSCRIPT

Page 1: To be master or slave of statistics

To be master or slave of statistics-Comparisons among SPSS, SEM, HLM, PLS

張偉豪

三星統計服務有限公司 執行長

AMOS亞洲一哥

Page 2: To be master or slave of statistics

沒有最好的統計方法

只有最適當的統計方法

Page 3: To be master or slave of statistics

三星統計服務有限公司

Outline

Latent variable vs. observe variable

Sample size

Sample independent vs. dependent

Cross-section vs. longitudinal data

Model complexity

Data format

Direct and indirect effect

Sample distribution

Formative and Reflective

Hypothesis

Page 4: To be master or slave of statistics

三星統計服務有限公司

Variables

潛在變數

SEM, PLS

符號

觀察變數

SPSS, HLM

符號

潛在變數 觀察變數

Page 5: To be master or slave of statistics

三星統計服務有限公司

Variables

潛在變數(Latent variable)

AKA. Unobserved variable, factor, dimension, construct

態度, 信念等心理測量

Definition

測量模型中無法直接觀察的變數,通常由三個(含)以上的觀察變數進行間接測量

觀察變數(Observed variable)

AKA. Indicators, manifest variables, items, scales

股價, 血壓, 景氣燈號, 李克特量表

Definition

可以直接觀察或測量的變數

Page 6: To be master or slave of statistics

三星統計服務有限公司Latent vs. Observed Variables

結構模型的構面題目經平均後便形成路徑分析,這個過程稱為item parceling or summate scale

Page 7: To be master or slave of statistics

三星統計服務有限公司SEM (PLS) vs. SPSS

1. SEM具有高度彈性及廣泛功能的分析技術

2. SEM需以理論為基礎,預先設定分析模型

3. SEM同時整合了觀察與潛在變數

4. SEM允許測量變數不完美的特性 (殘差)

5. SPSS僅提供各種分析的顯著性檢定,SEM提供Model Fit Index, 了解模型與樣本資料的差異程度

6. SEM解決多元共線性的問題 (相關高的測量變數會被整合成潛在變數)

7. 提供圖形介面, 容易理解SEM複雜的關係

Page 8: To be master or slave of statistics

三星統計服務有限公司

Sample size

Large (>200)

SEM, SPSS, HLM

Small (<200)

PLS, SPSS

Page 9: To be master or slave of statistics

三星統計服務有限公司Sample size determination

至少為估計參數的5倍或模型觀察變數的10倍

SEM為 full information estimation

樣本為模型全部變數的10倍

PLS為 limit information estimation

樣本為模型最大構面變數的10倍

SPSS為 generalized least square estimation

樣本為模型變數的10倍

HLM為 generalized least square estimation and chi-square estimation

Rule for sample(group/sample) 為 30/30, 50/20, 100/10

Page 11: To be master or slave of statistics

三星統計服務有限公司

Independent vs. dependent

Independent

SEM, SPSS, PLS

dependent

HLM, SPSS

Page 12: To be master or slave of statistics

三星統計服務有限公司

Independent vs. dependent

統計基本假設

變數符合常態分配

變數或群組同質(變異數一樣)

樣本獨立(樣本與樣本之間不相互影響)

Page 13: To be master or slave of statistics

三星統計服務有限公司

SEM vs. HLM

Hierarchical Linear Models 又稱為Multilevel models

HLM and SEM均為迴歸的拓展

HLM 適用於巢型結構的資料,因此樣本不獨立

SEM一般假設樣本獨立,Latent Growth Model (LGM)除外

Page 14: To be master or slave of statistics

三星統計服務有限公司

SEM vs. HLM

HLM可以同步研究群組層次及個人層次的效應

跨層次之間的交互作用只HLM有可以解釋

可同時評估固定效果隨機效果

HLM因為違反樣本獨立及變異數同質的統計假設,因此估計時會產生不正確的標準誤.

Page 15: To be master or slave of statistics

三星統計服務有限公司

SEM vs. HLM

SEM 可以分析較為複雜的因果路徑模型並同時整合潛在變數,中介變數及觀察變數

SEM 包含了一組變數所組成的理論模型並解釋變數之間的關係

Page 16: To be master or slave of statistics

三星統計服務有限公司SEM vs. HLM

標準的SEM –包含了中介變數及潛在變數

Special Cases of SEM

路徑分析 –所有的變數均為觀察變數,但也會包含中介變數

驗證式因素分析 –利用幾個指標來反應潛在變數的特性並計算研究構面的品質,如組成信度(CR>.7),平均變異數萃取量(AVE>.5)及區別效度(HTMT.85)

MIMIC Model (Multiple Indicators Multiple Causes )

Page 17: To be master or slave of statistics

HLM研究的課題

學生巢形(包含)於教授之下,教授巢形學校之下

病患巢形於醫生之下,醫生巢形於醫院之下

果樹巢形於果園之下,果園巢形於產地之下

員工巢形於公司之下,公司巢形於產業之下

兒童巢形於家庭之下,家庭巢形於社區之下

人民巢形於城市之下,城市巢形於國家之下

校外實習生巢形於公司經理之下

重複實驗巢形於個人之下

連續10年財務指標巢形於公司之下

重點是以上的個體樣本資料都不獨立

三星統計服務有限公司

Page 18: To be master or slave of statistics

三星統計服務有限公司

Cross-section vs. longitudinal data

Cross-section

SEM, PLS, SPSS, HLM

Longitudinal

HLM, SPSS, SEM

Page 19: To be master or slave of statistics

三星統計服務有限公司

longitudinal data (AMOS)

潛在成長模型 (latent growth model, LGM)

重複量數分析 (實驗次數至少三次)

估計固定效果與隨機效果

線性(重複三次)及非線性(至少重複四次以上)分析

條件式成長模型

加入自變數

自變數可為類別, 觀察, 潛在及隨時間而改變的變數

原理與HLM一樣,均為估計固定效果與隨機效果

Page 20: To be master or slave of statistics

三星統計服務有限公司

潛在成長模型

Page 21: To be master or slave of statistics

三星統計服務有限公司

Model complexity

Complex (>7 constructs)

PLS

Simple (≤7 constructs)

SEM, SPSS, HLM

Page 22: To be master or slave of statistics

三星統計服務有限公司

Model complexity

SEM模型愈複雜 (變數愈多),收斂愈困難,樣本數的需求愈大,且配適度往往難以達到學者建議的水準

HLM有LEVEL1及LEVEL2兩層迴歸,一,二層自變數過多會造成解釋上的困難,甚至無法收斂

SPSS本來就進行資料簡化,如因素分析,Item parceling, 而且SPSS只能進行直接效果分析,模型複雜會造成型一錯誤

PLS無配適度報告,目的是求解釋能力最大,屬無母數估計,無收斂問題,因此模型可以很複雜

Page 24: To be master or slave of statistics

三星統計服務有限公司

SEM vs. PLS

SEM –估計重點放在模型配適度= 最小化樣本共變異數

矩陣與模型估計共變異數矩陣

研究目的

檢定及驗證先驗理論的正確性

研究假設

資料分佈為常態,同質,大樣本等

檢定路徑關係時,先具有一定的信效度

採 “完全訊息估計法”表示模型設定上的小小變化都可能影響模型配適度

Page 25: To be master or slave of statistics

三星統計服務有限公司SEM vs. PLS

PLS – 估計重點放在內生變數解釋能力最大化

研究目的

理論的發展與預測

研究假設

資料分佈無需常態分配

研制限制

構面可使用較少的指標,如1或2題

分析大量的題目也不怕(SEM超過50個題目就不理想了)

可使用形成型指標

小樣本也會通

Page 26: To be master or slave of statistics

三星統計服務有限公司

Data format

Covariance (correlation) Matrix

SEM

Raw data

HLM, SPSS, PLS

Page 27: To be master or slave of statistics

三星統計服務有限公司

Data format

SEM分析時,採用共變異數矩陣或相關矩陣進行分析

不用Raw data 即可驗證研究結果的正確性

易於不同研究結果的比較, 類似於整合分析(Meta analysis)

共變異數矩陣並非完整訊息,SEM學者建議應提供於文章附錄或e-mail以供索取

SPSS, HLM, PLS均需使用原始資料分析

一般研究者是無法取得別人研究的原始資料,因此無法重製別人的研究

Page 28: To be master or slave of statistics

三星統計服務有限公司

Direct and Indirect effect(Mediating effect)

Direct effect (c’)

SPSS, HLM, PLS, SEM

Indirect effect (a*b)

SEM, PLS

Page 29: To be master or slave of statistics

三星統計服務有限公司

Direct and Indirect effect(Mediating effect)

Direct effect 指的是自變數與依變數之間的關係

Indirect effect 指的是自變數透過中介變數影響依變數之間的關係

間接效果

特定中介效果 (Specific Indirect effect)

遠程中介效果 (Distal indirect effect)

總間接效果 (Total Indirect effect)

Page 30: To be master or slave of statistics

三星統計服務有限公司

Specific Indirect effect, SIE

SIE: bd, ac, ae, cd, acd

Magnitude, sign, significance (H1/S.E.)

Standard error (bootstrap)

Page 31: To be master or slave of statistics

三星統計服務有限公司

Moderating effect

Moderator is category

SPSS, PLS, SEM

Moderator is continuum

PLS, HLM, SPSS

車速

危險性

0 mg/l

.15 mg/l

.30 mg/l

.60 mg/l

Page 32: To be master or slave of statistics

三星統計服務有限公司

Moderating effect

干擾(調節)檢定不同情境下, XY的斜率是否不同?

Moderator is category

群組比較自變數與依變數之間斜率的差異

Moderator is continuum

觀察變數可以階層式迴歸(Hierarchical regression)進行 (SPSS)

潛在變數可以PLS及SEM進行(尤其是PLS更為方便)

HLM原本重點就是在分析干擾 (調節)效果level 2 level 1的斜率

Page 33: To be master or slave of statistics

三星統計服務有限公司

階層式迴歸 (SPSS)

1. 自變數與干擾變數標準化或平減 (減去平均數)

2. 變數相乘產生交互作用或干擾效果變數

3. 帶入階層回歸

1. 主效用(自變數及干擾變數)第一層

2. 交互或調節效果第二層

4. 檢定兩層R2改變量的顯著性

5. P<.05表示交互或調節效果存在

Page 34: To be master or slave of statistics

三星統計服務有限公司

SEM干擾效果(AMOS)

Step: 1

1. 建立主效用模型 (僅含自變數與干擾變數)

2. 計算干擾效果非線性設定之lambda及theta值

Step: 2

3. 模型加入調節效果,檢定調節效果變數對Y的顯著性

4. P<.05表示調節作用存在

Page 35: To be master or slave of statistics

三星統計服務有限公司

PLS干擾效果(SmartPLS)

1. 建立主效用模型 (僅含自變數與干擾變數)

2. 在內生變數按右鍵建立干擾效果分析

3. 自變數及干擾選擇標準化或平減

4. SmartPLS自動產生干擾效果變數

5. Bootstrap 1000~5000 times,干擾效果變數對內生變數之t-value>1.96,表示干擾效果存在

Page 36: To be master or slave of statistics

三星統計服務有限公司

HLM干擾效果(HLM)

1. 建立individual模型

自變數選擇組平減(group center)

2. 建立group level模型

組自變數選擇總平減(grand center)

3. 以leve1的斜率(β1, β2…)當作Y進行估計

4. HLM完整模型自動建立干擾作用項

5. P<.05表示干擾作用顯著

Page 37: To be master or slave of statistics

HLM估計干擾效果

• 整體而言, 學生參與和學習成績為正相關(跨所有群組的平均迴歸線)

• 整體而言, 好的教學技巧有比較好旳學習成績(average intercept green/solid vs. mean red/dotted line)

• 好的教學技巧的平均斜率比差的教學技巧要高

學習成績

學生參與

High 教學技巧

Low 教學技巧

Page 38: To be master or slave of statistics

三星統計服務有限公司

Sample distribution

Normality

SEM, SPSS, HLM

Distribution free

PLS

Page 39: To be master or slave of statistics

三星統計服務有限公司

Formative and Reflective indicator

Formative index

PLS

Reflective scale

SEM, SPSS, HLM

究竟是誰去影響誰?構面題目?題目構面?

Page 40: To be master or slave of statistics

三星統計服務有限公司

Formative and Reflective indicator

Indicators are Formative or Reflective should be theoretically driven.

構面如態度, 個人特質為心理測量, 藉由觀察個人行為來判斷, 應屬於反映型構面

構面如社會經濟地位, 主要由教育程度, 所得, 職業等的組合,應屬於形成型構面

Page 41: To be master or slave of statistics

Reflective (Scale) Vs Formative (Index)

構面操作型定義在社會科學中,複雜構面之間的關係是研究的主要議題

究竟是題目影響構面還是構面影響題目?

構面

Scale 1 Scale 2 Scale 3

構面

Index 1 Index 2 Index 3

?

當構面產生改變時,觀察變數會有那些現象被我們所觀察到?

那些原因會造成構面結果的改變?

Page 42: To be master or slave of statistics

三星統計服務有限公司

Formative and Reflective indicator

Formative index Reflective scale

那些原因會造成我們喝酒醉?

酒醉之後會有什麼行為被我們觀察到?

Page 43: To be master or slave of statistics

三星統計服務有限公司

Hypothesis

Model Hypothesis should not be reject (P>0.05)

Regression weight should be reject (P<0.05)

SEM

Regression weight should be reject (P<0.05)

SPSS, HLM, PLS

Page 44: To be master or slave of statistics

三星統計服務有限公司Hypothesis

SEM (卡方分析)

H0: 模型期望共變異數陣=樣本資料共變異數矩陣

Regression

H0: X對Y沒有顯著的影響

ANOVA or T-test

H0: 群組間的平均數沒有顯著差異

Homogeneity test (同質性檢定)(卡方分析)

H0: 群組間變異數沒有顯著差異(連續變數)

H0: 群組間的組別沒有顯著差異(類別變數)

Reject H0 or not 由研究目的決定

Page 45: To be master or slave of statistics

模型檢定統計結果(Kline, 2011, p.193)

Reject-support context

檢定結果是顯著的 (p<0.05) ,則支持研究者的理論,如相關分析、迴歸分析、ANOVA檢定及路徑分析等。

Accept-support context

檢定結果是不顯著的 (p>=0.05) ,則支持研究者的理論,如SEM、同質性、適合度檢定、不變性檢定 (invariance test)。

Page 46: To be master or slave of statistics

46

常見卻不見得懂的統計單字

Variables (變數)

統計分析的基本要素, 研究目的在於了解變數之間的關係, 分成潛在變數與觀察變數兩種

Variance (變異數)

變數中樣本分散的程度, 開根號值為標準差, 為統計分析中最重要的數值.

Covariance (共變異數)

測量兩個隨機變數共同改變的大小及方向

Vary (改變)

變數的改變如"Prices vary"; "His moods vary depending on the weather“

Page 47: To be master or slave of statistics

常見卻不見得懂的統計單字

Covary (共變)

兩個隨機變數在同一時段內的共同改變

Variate (變量)

幾個變數的線性組合,通常為多變量分析構面的基礎Variate value = x1w1 + x2w2 + . . . + xkwk

Measure of Variation (Variability)

包含Variance, Standard Deviation, Range, Mean Absolute Deviation 為分散量數的總稱

Page 48: To be master or slave of statistics

http://www.semsoeasy.com.tw/