信度. 真分數理論的假設 x = t + e...

Post on 20-Dec-2015

292 Views

Category:

Documents

7 Downloads

Preview:

Click to see full reader

TRANSCRIPT

信度

真分數理論的假設

X = T + E

任何觀察分數是由真實分數與誤差分數,這兩個假設的成分所組成。

誤差的概念

誤差是指觀察分數與真實分數的差值,由

於測量會產生誤差,所以每次測量所獲得的觀察分數會產生變動。

誤差的來源可分成系統性誤差 (systematic errors) 與隨機性誤差 (random errors) 。

誤差的來源

系統性誤差又可分成恆定誤差 (constant errors) 與偏誤 (bias) 兩種。

對所有測量者皆有影響的誤差即為恆定誤差;只對某些群體的人會產生影響的誤差即為偏誤。

隨機誤差是由隨機產生的,並無法事先預測。

信度的表示法

根據真分數理論,信度可以表示為:真實分數的變異數與觀察分數的變異數的比值。

2x

2t

XX σ

σρ

21

信度的種類

測驗版本

測驗次數

一種 兩種一次 折半信度、庫李

20 、 α 係數複本信度 ( 等同係數 )

兩次 再測信度 ( 穩定係數 )

再測複本信度

再測信度 (test-retest reliability)

再測信度是指將受試者在兩個不同的時間點,接受同一份測驗,然後以受試者在兩個不同時間點的兩個總分,求其相關係數,即可得到再測信度。

再測信度的兩次施測的間隔時間,不能太長也不能太短,可採 2 至 4 的星期。

複本信度 (alternate-form reliability)

複本信度是指將受試者在同一個時間點,接受兩份測驗 ( 一份為正本,另一份為複本 ) ,然後以受試者在正本與複本的兩個總分,求其相關係數,即可得到複本信度。

複本測驗必須在內容、題型、題數、難度、測試時間等均須相同,才能稱為複本測驗。

複本信度 (alternate-form reliability)

複本測驗需滿足下列的 假定:1. 同一個人在兩個測驗

具有相同的真分數。 T1=T2

2. 兩個測驗的誤差分數彼此獨立 ( 即兩者相關係數為 0) ,且誤差分數的變異數相等。

0ρ21XX

2E

2E 21

σσ

再測複本信度

再測複本信度是指將受試者在兩個不同的時間點,接受兩份測驗 ( 一份為正本,另一份為複本 ) ,然後以受試者在正本與複本的兩個總分,求其相關係數,即可得到再測複本信度。

再測複本信度可同時考量時間與內容兩個向度,是不錯的信度考驗方法。

內部一致性係數

內部一致性係數是由一次施測的結果,去估算信度的數值,主要關注於試題的同質性。內部一致性係數的主要限制是不能估計速度測驗的信度。

內部一致性係數主要包含1. 折半信度2. 庫李 20 公式或庫李 21 公式3.α 係數

折半信度 (split-half reliability)

折半信度的求法是將一份測驗的試題分成兩個部分,然後求兩個部分總分的相關係數。

折半信度的折半方法有: 1. 奇偶折半; 2.隨機折半。

由於試題的題數越多,所估計的信度值會越高,因此,採用折半信度必須以斯布 (Spearman-Brown) 校正公式,校正被低估的信度值。

斯布校正公式

n :測驗工具長度增長或縮短的倍數rXX: 測驗工具增長或縮短後的信度rAA: 測驗工具原本的信度

AA

AAXX r1)-(n1

rnr

斯布校正公式的應用實例

例 1 :折半信度的數值大小為 0.7 ,則則經斯布校

正公式的校正後,其信度為多少?

82.07.01)-(21

7.02rXX

斯布校正公式的應用實例

例 2 :已知一份 40 道題目的測驗,其信度為 0.8 ,

若打算將試題縮減為 30 道題目,則其信度 將變成多少?

75.08.01)-

4

3(1

8.04

3

rXX

斯布校正公式的應用實例

例 3 :已知一份 40 道題目的測驗,其信度為 0.8 ,

若打算將信度增加至 0.9 ,則測驗的題目將 變成多少題?

90402.25Ans

2.25n

0.81)-(n1

0.8n0.9

KR20

KR20 是由 Kuder & Richardson 兩人所發展的第 20 號公式,但它僅適用在二分計分法,亦即答對得 1 分,答錯得 0 分。

K :題數 P :每題的答對率 Q :每題的答錯率 (σx)2 :測驗總分的變異數

pq(1

1k

kKR

2X

20

α係數

α 係數是由 Cronbach 所發展的,當測驗的評分方式不只二分計分時,例如 likert 五點量表,則不能採用 KR20 ,而須採用 α 係數。

K :題數 (σi)2 :第 i 題的變異數(σx)2 :測驗總分的變異數

σ(1

1k

2X

2i

1 2 3 4 5 6 7 8 9 10 總A 1 1 0 1 1 1 0 1 0 1 7

B 1 0 0 1 1 1 0 1 0 1 6

C 1 0 0 1 1 1 0 0 0 1 5

D 1 1 0 1 1 1 0 1 0 1 7

E 1 1 1 0 0 1 1 1 1 1 8

F 1 0 0 1 1 1 0 1 1 1 7

G 1 1 0 0 1 1 1 0 0 1 6

H 1 1 1 1 0 1 1 1 1 0 8

I 1 0 0 0 1 1 0 0 0 0 3

J 1 1 1 1 1 1 0 1 1 1 9

Pi 1 .6 .3 .7 .8 1 .2 .7 .4 .8 S=2.93

Qi 0 .4 .7 .3 .2 0 .8 .3 .6 .2

PQ 0 .24 .21 .21 .16 0 .16 .21 .24 .16

S2 0 .267 .233 .233 .178 0 .233 .233 .267 .178 1.822

KR20的計算實例

pq(1

1k

kKR

2X

20

0.44)2.64

59.1(1

110

10KR 20

α係數的計算實例

σ(1

1k

2X

2i

.42)2.64

64.1(1

110

10α

評分者信度 (scorer reliability)

評分者信度主要針對不同的評分者,對同一表現評分的一致性程度。

當評分者只有兩人時,可採用 Spearman的等級相關;當評分者三人以上,則需採用肯德爾的和諧係數。

測量標準誤 (standard error of measurement)

在測驗與評量中,假定對同一個人施測非常多次,則每次觀察分數與真實分數的誤差分數,會形成常態分配,而此常態分配的標準差,特別稱為測量標準誤。

測量標準誤的最大應用價值在於可用以推論真實分數的可信範圍。

測量標準誤 (standard error of measurement)

σx :觀察分數的變異數rxx :信度係數

由上述公式,可知 SEM 越小,則信度越高, SEM 越大,則信度越低。

xxx r1σSEM

測量標準誤的應用實例

例 1 :某測驗的信度為 0.84 ,標準差為 10 ,則該

測驗的 SEM 為多少?

40.84110SEM

測量標準誤的應用實例

例 2 :承例 1 ,若某生在該測驗考 80 分,則某生 真實分數的範圍是多少?

1. 某生的真是分數有 68.26%( 即平均數上下一個標準差 )落在 80±1SEM

80- 4≦某生的真實分數≦ 80 + 4

76≦某生的真實分數≦ 84

測量標準誤的應用實例

2. 某生的真是分數有 95.44%( 即平均數上下兩個標準差 )落在 80±2SEM

80- 2×4≦某生的真實分數≦ 80 + 2×4 72≦某生的真實分數≦ 88 3. 某生的真是分數有 99.74%( 即平均數上下三

個標準差 )落在 80±3SEM 80- 3×4≦某生的真實分數≦ 80 + 3×4 68≦某生的真實分數≦ 92

top related