平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/pdfsample/aem002200.pdfn = 樣本數...

14
平均數比較(t 檢定) 7-1 平均數比較 ( 各種 t test 的應用 ) 平均數比較(Compare Means)是常用的統計分析,用來比較兩個群體的平均數,也 就是各種 t test 的應用,常見的範例 1:在學生學習成就方面,常見的方法是將學生隨 機分成 2 組,一組使用原本的教法,稱為控制組(control group),另一組使用新的教法, 稱為處理組(treatment group),學生學習課程結束後,比較新的教法是否比原本的教法 來的有效。範例 2:同一個群體前後量測比較,在學生學習成就方面,同一個群體的學 生在學習課程前量測一次分數和學習課程結束後再量測一次分數,比較學習課程是否 有效果。平均數比較(各種 t test 的應用)SPSS 提供 5 種平均數比較的方法如下: Means 平均數分析 One-Sample t test 單一樣本 t 檢定 Independent-Sample t test 獨立樣本 t 檢定 Paired-Samples t test 成對樣本 t 檢定 One-Way ANOVA 單因子變異數分析 使用時機的整理: 不同類別變數組合下,連續變數在各組的平均數、標準差、次數等:使用平均數 單一變數的平均數作檢定:單一樣本 t 檢定 兩組平均數差異的檢定(獨立樣本):獨立樣本 t 檢定 兩組平均數差異的檢定(相依樣本):成對樣本 t 檢定 多個母體平均數差異的檢定: One-Way ANOVA 單因子變異數分析(ANOVA 於第 十章再詳細介紹) CHAPTER

Upload: others

Post on 26-Jul-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

平均數比較(t檢定)

7-1 平均數比較(各種 t test的應用) 平均數比較(Compare Means)是常用的統計分析,用來比較兩個群體的平均數,也

就是各種 t test的應用,常見的範例 1:在學生學習成就方面,常見的方法是將學生隨

機分成 2組,一組使用原本的教法,稱為控制組(control group),另一組使用新的教法,

稱為處理組(treatment group),學生學習課程結束後,比較新的教法是否比原本的教法

來的有效。範例 2:同一個群體前後量測比較,在學生學習成就方面,同一個群體的學

生在學習課程前量測一次分數和學習課程結束後再量測一次分數,比較學習課程是否

有效果。平均數比較(各種 t test的應用),SPSS提供 5種平均數比較的方法如下:

Means平均數分析

One-Sample t test單一樣本 t檢定

Independent-Sample t test 獨立樣本 t檢定

Paired-Samples t test成對樣本 t檢定

One-Way ANOVA單因子變異數分析

使用時機的整理:

不同類別變數組合下,連續變數在各組的平均數、標準差、次數等:使用平均數

單一變數的平均數作檢定:單一樣本 t檢定

兩組平均數差異的檢定(獨立樣本):獨立樣本 t檢定

兩組平均數差異的檢定(相依樣本):成對樣本 t檢定

多個母體平均數差異的檢定:One-Way ANOVA 單因子變異數分析(ANOVA於第

十章再詳細介紹)

C H A P T E R

Page 2: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-2

統計分析入門與應用

說明:

a. 獨立樣本:兩個來自於獨立,沒有相關的樣本

b. 成對樣本:兩個平均數來自於同一個樣本,有關係的樣本

7-2 Means平均數分析 Means平均數分析是用在不同類別變數組合下,連續變數在各組的統計量,例如:

平均數、中位數、標準差、總合、最小值、最大值、範圍、峰度、偏態…等等,也可

以勾選 Anova table and eta,進行單因子變異數分析和 Test for linearity線性檢定。

範例:

我們以大學生為例,抽樣調查 12個大學生的 No編號,Sex性別(1男性,2女性),

Score學期成績,Cost每月花費,Income家庭收入(1低收入,2高收入),Location區域

(1北部,2中部,3南部) 如下:

No Sex Score Cost Income Location

1 2 79.00 8500.00 2 2

2 1 88.00 4800.00 1 3

3 1 72.00 9200.00 1 1

4 2 76.0012000.00 1 1

5 2 85.0015000.00 2 1

6 1 81.00 7200.00 1 2

7 2 76.00 6800.00 1 2

8 2 72.00 8000.00 2 3

9 2 70.00 9500.00 2 1

10 1 65.00 5000.00 2 3

11 1 75.00 6000.00 1 2

12 1 66.00 7000.00 2 3

我們在不同類別變數組合下,進行 Means平均數分析。

Means平均數分析的實務操作如下:

(請先將範例檔 Ch7複製到 C:\Ch7)

Page 3: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-3

平均數比較(t 檢定) 07 Chapter

1. 開啟 cost.sav範例檔 (在 C:\Ch7),點選[分析/比較平均數法/平均數]

2. 選取「Score」、「Cost」至「依變數清單」欄位

變數說明:

No編號,Sex性別(1男性,2女性),Score學期成績,Cost每月花費,Income家

庭收入(1低收入,2高收入),Location區域(1北部,2中部,3南部)。

按這裏

選取

Page 4: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-4

統計分析入門與應用

3. 選取「Sex」、「Income」和「Location」至「自變數清單」欄位

4. 點選[選項]

5. 勾選「Anova表格與 eta值」與「線性檢定」,點選[繼續]

選取

點選

勾選

按這裏

有三個統計量

Page 5: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-5

平均數比較(t 檢定) 07 Chapter

6. 選擇完畢後,點選[確定]

7. 結果如下圖

各種變數的組合,有樣本的 Included包括,Excluded排除和 Total總合。

按這裏

Page 6: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-6

統計分析入門與應用

8. 結果如下圖(接續)

以 Sex性別(1男性,2女性)做分組,顯示 1男性,2女性和總共的三個統計量 Mean平

均數,N樣本數和 Std. Deviation標準差。

在不同性別下,Score學期成績的 Sig. P=0.673未達顯著水準,在不同性別下,Cost每

月花費的 Sig. P=0.035達顯著水準。

我們也可以在範例資料檔下,直接執行下列語法,會得到相同的報表結果:

MEANS TABLES=Score Cost BY Sex Income Location /CELLS MEAN COUNT STDDEV /STATISTICS ANOVA LINEARITY .

總結:

Mears平均數分析在一般情形下較為少用,原因是 Mears平均數提供的各種統計量,都

較其它的功能不足,我們整理如下:

Mears平均數分析的功能

一般敍述性統計:一般用 Descriptives取代

ANOVA檢定:一般用 One-Way ANOVA取代

關聯分析:一般用相關分析 Correlate取代

Page 7: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-7

平均數比較(t 檢定) 07 Chapter

7-3 單一樣本 t檢定 單一樣本 t檢定(One-Sample t Test)是適用於用單一變數的平均數作檢定,也就是

說,檢定樣本數中某一個變數的平均數是否與母體的平均數有無顯著的不同,條件是

母體的平均數必須為已知,研究假設如下:

虛無假設 H 0: = 0 (無顯著差異)

對立假設 H 1: 1 (有顯著差異)

單一樣本 t檢定的統計量:

x = 樣本平均數

u = 母體的平均數

s = 樣本的標準差

N = 樣本數

自由度 df = N-1

注意:在常態分配下,平均數比較中,母體平均數 u的檢定是與母體操準差 (已

知,未知)和樣本數 N(大,小)有關,檢定的方式有 Z值,Z分配和 t值(t分配)兩種,

分別如下:

Z = N

ux, NX

t = N

Sux , NSSX

我們整理檢定方式中 Z值與 t值的適用方式,如下:

在母體的標準差已知,小樣本的情形下:使用 Z值

在母體的標準差已知,大樣本的情形下:使用 Z值

在母體的標準差未知,小樣本 N<30的情形下:使用 t值

在母體的標準差未知,大樣本的情形下:使用 Z值

有趣的是當樣本數增大時,t分配會趨近 Z分配,也就是可以使用 t值來替代 Z值

的判定,在實務上,我們大多都是用樣本推論母體,母體提供 t檢定,而無 Z檢定。

t = N

Sux

Page 8: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-8

統計分析入門與應用

範例:

我們以大學生的生活花費為例,在不考慮租屋費用和課業花費的情況下,根據調

查,家長給大學生每個月的平均生活花費為$6000,我們抽樣 12 個大學生每個月的花

費如下:

學生數 1 2 3 4 5 6 7 8 9 10 11 12

花費/每月 8500 4800 9200 12000 15000 7200 6800 8000 9500 5000 6000 7000

研究假設如下:

虛無假設 H 0:u = 6000元,無顯著差異

H 1:u 6000元,有顯著差異

小樣本,母體常態且變異數未知,所以,適用 t分配來檢定母體平均數

Total cost= 99000

樣本平均數 X = 99000/12 = 8250

樣本變異數 S 2 =

2)(1

1 xxn i

= 112

1

(8500-8250) 2

= 11294510000

= 8591818

樣本標準差 = S = 2S = 8591818 = 2931

6000 7000 8000

t = XSuX 0

= n

sux 0

= 12

293160008250

10.846

70008250

10.846

80008250

= 1.846

60008250

10.846

70008250

10.846

80008250

= 2.659 =1.477 = 0.295

查表:

t 25.0,1n = t 25.0,11 = 2.201

t >t 025.0,1n

結論:

檢定統計量 t = 2.659, t >t 025.0,1n ,拒絕虛無假設

在 = 0.05 水準下,大學生的花費和家長給的生活有顯著的差異,因此,可以解

釋為許多大學生為了生活費,而不得不外出打工。

Page 9: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-9

平均數比較(t 檢定) 07 Chapter

單一樣本 t檢定的實務操作如下:

(先前已將範例檔 Ch7,複製到 C:\Ch7)

1. 開啟範例檔 cost.sav (在 C:\Ch7),點選[分析/比較平均數法/單一樣本 T檢定]

變數說明:

No編號,Sex性別(1男性,2女性),Score學期成績,Cost每月花費,Income家

庭收入(1低收入,2高收入),Location 區域(1北部,2中部,3南部)。

2. 選取「Cost」至「檢定變數」欄位

按這裏

選取

Page 10: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-10

統計分析入門與應用

3. 檢定值設為 6000,點選[選項]

4. 信賴區間百分比設為 95%,點選[繼續]

5. 選擇完畢後,點選[確定]

②點選

設為 95%

①設為 6000

按這裏

按這裏

Page 11: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-11

平均數比較(t 檢定) 07 Chapter

6. 結果如下圖

顯示 Cost每月花費的 N樣本數,Mean平均數,每月花費 8250元,Std. Deviation 標

準差和 Std. Error Mean標準差平均數。

Cost每月花費:

檢定統計量 t = 2.659, Sig. P=0.022 <0.05,拒絕虛無假設

在 = 0.05水準下,大學生的平均每月花費 8250元和家長給的平均生活費 6000

元有顯著的差異,因此,可以解釋為許多大學生為了生活費,而不得不外出打工。

我們也可以在範例資料檔下,直接執行下列語法,會得到相同的報表結果:

T-TEST /TESTVAL = 6000 /MISSING = ANALYSIS /VARIABLES = Cost /CRITERIA = CI(.95) .

7-4 獨立樣本 t檢定 獨立樣本 t檢定(Independent-Sample t test),獨立樣本是受測者隨機分派至不同組

別,各組別的受測者没有任何關係,也稱為完全隨機化設計。t test(t檢定)是用來檢定 2

個獨立樣本的平均數差異是否達到顯著的水準。也就是說這二個獨立樣本可以透過分

組來達成,計算 t檢定時,會需要 2個變數,我們會將自變數 x分為 2個組別,檢定 2

Page 12: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-12

統計分析入門與應用

個獨立樣本的平均數是否有差異(達顯著水準)得考慮從 2個母體隨機抽樣本後,計算其

平均數 u差異的各種情形。

研究假設如下:

虛無假設 H 0: = 0 (無顯著差異)

對立假設 H 1: ≠ 1 (有顯著差異)

範例:

獨立樣本 t檢定的實務操作如下:

(先前已將範例檔 Ch7複製到 C:\Ch7)

1. 開啟範例檔 cost.sav (在 C:\Ch7),點選[分析/比較平均數法/獨立樣本 T檢定]

變數說明:

No編號,Sex性別(1男性,2女性),Score學期成績,Cost每月花費,Income家

庭收入(1低收入,2高收入),Location區域(1北部,2中部,3南部)。

點選

Page 13: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-13

平均數比較(t 檢定) 07 Chapter

2. 選取「Score」與「Cost」至「檢定變數」欄位

3. 選取「Sex」至「分組變數」欄位

4. 點選[定義組別]

5. 定義組別,選擇完畢即點選[繼續]

選取

選取

按這裏

定義

按這裏

Page 14: 平均數比較 t 檢定 - 碁峰資訊epaper.gotop.com.tw/PDFSample/AEM002200.pdfN = 樣本數 自由度 df = N-1 注意:在常態分配下,平均數比較中,母體平均數u

7-14

統計分析入門與應用

6. 選擇完畢後,點選[確定]

7. 結果如下圖

以 Sex性別(1男性,2女性)做分組,顯示 1男性,2女性在 Score學期成績,Cost

每月花費的四個統計量 N樣本數,Mean平均數,Std. Deviation標準差和 Std. Error Mean

標準誤差平均數。

以 Sex性別(1男性,2女性)做分組,顯示在 Score學期成績,檢定統計量 t = -.434,

Sig. P=0.673 >0.05,接受虛無假設,在 = 0.05水準下,大學生男女性別的 Score 學期

成績平均數是一樣的,沒有顯著的差異。

在 Cost每月花費,檢定統計量 t = -2.445, Sig. P=0.035 <0.05,拒絕虛無假設,在 =

0.05水準下,大學生男女性別的 Cost 每月花費平均數是不一樣的,有顯著的差異,女

生平均每月花費 9966元,比男生平均每月花費 6533元較高。

按這裏