kirk' experimental design, chapter 5

31
Date 實驗設計 效果量、估計樣本數、還有靠近一點看看ANOVA.... 1348星期

Upload: kevin-chun-hsien-hsu

Post on 07-Aug-2015

34 views

Category:

Data & Analytics


2 download

TRANSCRIPT

Page 1: Kirk' Experimental Design, Chapter 5

Date

實驗設計效果量、估計樣本數、還有靠近一點看看ANOVA....

13年4月8⽇日星期⼀一

Page 2: Kirk' Experimental Design, Chapter 5

✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計

✤ p: 實驗組別的數量

✤ 用法:獨變項的組別數量有三組以上,觀察各組的依變項之平均值有無差異。

✤ 統計假設:

✤ H0: µ1 = µ2 = µ3 ... = µp

✤ H1: µj ≠ µj’ for some j and j’, j ≠ j’

✤ H0: α1 = α2 = α3 ... = αp

✤ H1: αj ≠ αj’ for some j and j’, j ≠ j’

13年4月8⽇日星期⼀一

Page 3: Kirk' Experimental Design, Chapter 5

✤ Completely Randomized Design (CRD, CR-p) 完全隨機化設計

✤ Yij = µ + αj + εi(j) (i = 1,..., n; j = 1,...,p)

✤ Fixed-effects model

Yij 受試者 i 在第 j 個實驗組別下的依變項

µ 母群的平均值,各實驗組別平均觀察值(µ1, µ2, µ3)的總平均值。µ為固定值。

αj(alpha) 第j個實驗組別的效果,等於該組平均值與母群平均值的差異量(µj–µ)。同一個實驗組別之下每個觀察值有一樣的 αj。

εi(j) (epsilon) Yij的殘差值,等於 Yij – µ – αj。

13年4月8⽇日星期⼀一

Page 4: Kirk' Experimental Design, Chapter 5

✤ 固定效果模式(fixed effect model): 當一個研究的獨變項的組別數量(p組),包括了該變項所有可能的水準(P組),也就是樣本的水準數等於母群的水準數(P = p) 。

✤ 例如比較大學四個年級學生的曠課次數,此時獨變項為年級,具有四個水準,母群亦為四個年級。

✤ 隨機效果模式(random effect model): 研究的獨變項只包含一部份的水準,並非包括所有的類別,此時樣本的水準數小於母群的水準數(P > p) 。

✤ 例如教育學者比較不同地區的學校教學方法的成效有所不同,因此隨機選取幾個地區的一些學校共四所(獨變項)。此時母群裡面每個學校各自有不同的教學環境,但該研究僅觀察其中四個組別。

13年4月8⽇日星期⼀一

Page 5: Kirk' Experimental Design, Chapter 5

✤ 範例 Table 5.2-1

✤ CP-4, n = 8 (N = 32)

✤ IV: 睡眠剝奪時間 (12小時、18小時、24小時、30小時)

✤ DV: 將感應器維持在0.5 英吋的圓洞中,估計兩分鐘內碰到圓洞邊緣的次數。

13年4月8⽇日星期⼀一

Page 6: Kirk' Experimental Design, Chapter 5

✤ 進行推論統計之前,要檢查資料分佈的形狀、決定極端值(outlier)的條件以及處置方法。

✤ 常用的極端值條件: 樣本與平均值的差大於2.5 倍標準差

✤ 處置極端值:刪除,或者用平均值取代

✤ 目的:使樣本趨近常態分佈、變異性同質。此外,檢查資料可以瞭解受

試者的氣質、實驗材料是否適當。

13年4月8⽇日星期⼀一

Page 7: Kirk' Experimental Design, Chapter 5

一般會使用的樣本統計數有:平均數、標準差、

標準誤 (s/(n^0.5),如果樣本分佈會偏離常態分佈,可以補充中位數。

13年4月8⽇日星期⼀一

Page 8: Kirk' Experimental Design, Chapter 5

以殘差的分佈進行觀察。也可以將殘

差除以MSerror。理想的分布圖應該呈

現常態分佈,以0為中心左右對稱。

觀察殘差與其他實驗變數的關聯。理

論上殘差應該是獨立於任何因素,不

會發生正相關/負相關的情況

13年4月8⽇日星期⼀一

Page 9: Kirk' Experimental Design, Chapter 5

離均差平方和 組內離均差平方和組間離均差平方和

SSTO SSTO = [AS] – [Y]

SSBG = [A] – [Y]

SSWG = [AS] – [A]

個別觀察值與總平均之間的距離

各組平均值與總平均之間的距離

個別觀察值與各組平均值之間的距離

13年4月8⽇日星期⼀一

Page 10: Kirk' Experimental Design, Chapter 5

13年4月8⽇日星期⼀一

Page 11: Kirk' Experimental Design, Chapter 5

✤ 臨界值:F(0.05, 3, 28) = 2.95 [ = fdist(f, v1, v2) ]

✤ F 統計量 7.5代表的 第一類型錯誤機率:0.000781 [ = finv(f, v1, v2) ]

✤ APA 報告方式:

✤ 睡眠剝奪時間的效果達顯著( F(3, 28) = 7.5, MSE = 2.179, p < .001)

13年4月8⽇日星期⼀一

Page 12: Kirk' Experimental Design, Chapter 5

✤ 多重比較 (1)

✤ IV: 睡眠剝奪時間 (12小時、18小時、24小時、30小時)

✤ 3組正交/事前比較

✤ !1  =  µ1  –  µ2                  [ 1 -1 0 0]

✤ !2  =  µ3  –  µ4                  [ 0 0 1 -1]

✤ !3  =  (µ1  +  µ2)/2 – (µ3  +  µ4)/2                [ 0.5 0.5 -0.5 -0.5]

^

^

^

13年4月8⽇日星期⼀一

Page 13: Kirk' Experimental Design, Chapter 5

p – 1 a priori orthogonal contrasts

✤ Student’s Multiple t Test

✤ CP4 , n = 8 (N = 32), MSE = 2.179

1. 估計MSE

2. 將平均值、加權值帶入下列公式,計算每一組比較的t 分數

3. 依照α, MSE的自由度查表取得臨界值。t分數的絕對值大於臨界值表示該組比較俱有顯著效果

tα/2, p(n-1)

13年4月8⽇日星期⼀一

Page 14: Kirk' Experimental Design, Chapter 5

p – 1 a priori orthogonal contrasts

✤ Student’s Multiple t Test

✤ CP4 , n = 8 (N = 32), MSE = 2.179

t (0.05/2, 28) = 2.048

13年4月8⽇日星期⼀一

Page 15: Kirk' Experimental Design, Chapter 5

✤ 多重比較 (2)

✤ IV: 睡眠剝奪時間 (12小時、18小時、24小時、30小時)

✤ 配對比較 (6 組配對)

✤ Tukey’s HSD test

✤ Fisher-Hayter Test

✤ REGW step-down procedure

easy

powerful

13年4月8⽇日星期⼀一

Page 16: Kirk' Experimental Design, Chapter 5

✤ Fisher-Hayter Test

✤ 使用 qFH的公式估計各配對的差值、臨界值

13年4月8⽇日星期⼀一

Page 17: Kirk' Experimental Design, Chapter 5

✤ 統計顯著性(statistical significance)

✤ 基於機率理論的觀點,說明獨變項效果相對於隨機變化的一種統計意義的檢驗

✤ 例如利用F考驗來決定獨變項效果的統計意義

Effect Size 效果量

0"

10"

20"

30"

40"

50"

60"

70"

80"

0" 0.01" 0.02" 0.03" 0.04" 0.05" 0.06"

numbe

r'of'sam

ples'

p'values'

13年4月8⽇日星期⼀一

Page 18: Kirk' Experimental Design, Chapter 5

✤ 實務顯著性(practical significance)

✤ 反應獨變項效果在真實世界的強度意義

✤ 常用關聯強度 (!2)、效果量( f量數) 表示

Effect Size 效果量

0"

10"

20"

30"

40"

50"

60"

70"

80"

0" 0.01" 0.02" 0.03" 0.04" 0.05" 0.06"nu

mbe

r'of'sam

ples'

p'values'

13年4月8⽇日星期⼀一

Page 19: Kirk' Experimental Design, Chapter 5

Omega Squared 關聯強度

✤ 類似於迴歸分析的R2

✤ 定義式

✤ !2量數

✤ 組間變異與總變異的比值,表示依變項變異量能被獨變項解釋的百分比。

✤ 亦即獨變項與依變項的關聯強度

✤ 樣本估計式

13年4月8⽇日星期⼀一

Page 20: Kirk' Experimental Design, Chapter 5

Omega Squared 關聯強度

✤ ω2量數的數值介於0到1之間,越接近1表示關聯越強✤ ω2量數值分佈為以.05到.06為眾數的正偏態分配,達到.1以上者,即屬於高強度的獨變項效果。一般期刊上所發表的實證論文的 ω2 僅多在.06左右。

✤ Cohen(1988)建議的判斷準則:

.059> 2ω ≥.01 ������

.138> 2ω ≥.059 ������ 2ω ≥.138 ������

13年4月8⽇日星期⼀一

Page 21: Kirk' Experimental Design, Chapter 5

獨變項可以解釋依變項38% 的變異量。

13年4月8⽇日星期⼀一

Page 22: Kirk' Experimental Design, Chapter 5

✤ η2是迴歸分析當中的R2,除了作為X對Y解釋強度的指標外,經常也被視為效果量的指標

✤ 樣本數小的時候必須調整η2,以得到不偏估計數(Wherry, 1931)

eta square 量數

13年4月8⽇日星期⼀一

Page 23: Kirk' Experimental Design, Chapter 5

效果量系數

✤ 效果量(effect size)係數

✤ 用來衡量獨變項強度的統計量。

✤ Cohen ‘s d 係數:最簡單的效果量,指平均數之間的差異程度。平均數間差異越大,表示獨變項的強度越強。

✤ f量數:適用於當平均數數目大於2時

13年4月8⽇日星期⼀一

Page 24: Kirk' Experimental Design, Chapter 5

✤ Cohen(1988)建議的判斷準則:

.25 > f ≥ .10 低效果量

.40 > f ≥ .25 中等效果量

f ≥ .40 高效果量

13年4月8⽇日星期⼀一

Page 25: Kirk' Experimental Design, Chapter 5

Power and sample size

✤ 變異數分析提供了一些訊息,可以估計該實驗的檢定力 (power)。

✤ 1–β就是檢定力(power),代表可以拒絕H0的機率。一般研究者認為 1–β大於0.8代表該研究效果值得信任。

真實情況真實情況

H0為真 H0為假

研究者的決定

無法拒絕 H0正確接受H0

probability = 1 – α第二類型錯誤

probability = β

研究者的決定

拒絕H0

第一類型錯誤

Type I errorprobability = α

正確拒絕H0

probability = 1 – β

13年4月8⽇日星期⼀一

Page 26: Kirk' Experimental Design, Chapter 5

估計power 的方式

✤ 使用Tang (1938) 的表,或者用SPSS

13年4月8⽇日星期⼀一

Page 27: Kirk' Experimental Design, Chapter 5

用Tang 的方法估計power

✤ 睡眠剝奪實驗的參數:

✤ p = 4; n = 8; MSb = 16.333; MSw = 2.179

✤ phi = 2.21

13年4月8⽇日星期⼀一

Page 28: Kirk' Experimental Design, Chapter 5

✤ Tang的效果量對應表:

13年4月8⽇日星期⼀一

Page 29: Kirk' Experimental Design, Chapter 5

✤ Tang的效果量對應表:

✤ v1 = p – 1 = 3✤ v2 = p(n – 1) = 28✤ α = 0.05✤ ϕ = 2.21

本研究的效果量 大約為 0.95,遠大於合理標準 (0.8)

13年4月8⽇日星期⼀一

Page 30: Kirk' Experimental Design, Chapter 5

✤ 效果量過大,代表將來在檢驗同一個研究的時候,保持

同樣的實驗設計時,使用較少的樣本數即可拒絕H0。

✤ 換言之,重複檢驗的時候,只要樣本來源不變,所有的

實驗條件一樣:

✤ p = 4; MSb = 16.333; MSw = 2.179

✤ 試試看當  n  小於8  的時候,power  什麼時候會剛好大於0.8?✤ 估計不同樣本數量之下的  phi

✤ n  =  5;  ϕ  =  1.75✤ n  =  6;  ϕ  =  1.92

13年4月8⽇日星期⼀一

Page 31: Kirk' Experimental Design, Chapter 5

✤ Tang的效果量對應表:

v1 = 4 – 1 = 3

v2 = 4(5 – 1) = 16

! = 0.05

ϕ = 1.75

v1 = 4 – 1 = 3

v2 = 4(6 – 1) = 20

! = 0.05

ϕ = 1.92

13年4月8⽇日星期⼀一