non parametric(fazlası için )

45
17 PARAMETRİK OLMAYAN TESTLER

Upload: wwwtipfakultesi-org

Post on 14-Aug-2015

158 views

Category:

Documents


0 download

TRANSCRIPT

17PARAMETRİK OLMAYAN

TESTLER

Parametrik - Nonparametrik Farkı

• Parametrik testlerin uygulanışında bazı varsayımlar öngörülür .

• Testlerle ulaşılan sonucun geçerliliği, varsayımların geçerliliğine bağlıdır.

• Parametrik testlerin uygulanabilmesi için, en az eşit aralıklı ölçeklerle ölçüleme yapılmış olması gerekir.

• Nonparametrik testlerin uygulanmasında ise varsayımlar öngörülmez.

• Bu testler için yalnız gözlemlerin bağımsızlığı ve rasgele seçilmeleri gibi varsayımlar öngörülmesine karşın, bunlar parametrik testlerdeki varsayımlardan daha az ve daha zayıftır.

• nonparametrik testin uygulandığı değerlerin kuvvetli bir ölçme tekniği ile ölçülendirilmesi gerekmez. Bu testler, sıralayıcı ölçekteki ve sınıflayıcı ölçekteki değerlere uygulanabilir.

• En güçlü testler, kapsamlı varsayımları olan testlerdir.

• Parametrik testler kullanılışlarını belirleyen güçlü pek çok varsayıma sahiptirler.

• Varsayımlar geçerli olduğu takdirde, bu testlerde, diğer bütün testlere nazaran, H0 yanlış olduğunda H0'ın reddedilmesi en fazla imkan dahilindedir. Buna bir testin kuvveti denir.

• Kuvvet, kullanılan testin bir fonksiyonudur. H0 yanlış iken onu reddetme olasılığı (1-β) bir testin gücünü verir. β ile n ters orantılı olduğundan, n arttıkça testin gücü artmaktadır.

• Eğer bir istatistiksel testte H0 doğru olduğunda H0 'ı reddetme olasılığı küçükse, buna karşı H0 yanlış olduğunda H0 'ı reddetme olasılığı da büyükse, bu test iyi bir testtir.

• Ancak, testin seçimini etkileyen güçten başka faktörler de vardır. • Verilerin toplanış biçimi, toplumun yapısı, verilerin ölçülendirilmesi

de test seçimini etkiler. • Nonparametrik bir test, örneğin alındığı toplumun parametreleri

hakkında koşulları belirlemeyen bir testtir.• Bir hipotez kontrolünde test seçimi için; testin kuvveti, testin verilere

uygunluğu ve verilerin ölçülendirilmesi gibi noktalara dikkat edilir.• Bir istatistiksel modele ait bütün varsayımlar yerine getirildiğinde ve

veriler en az aralıklı bir ölçekle ölçülendirildiğinde parametrik test en kuvvetli bir testtir.

• Örnekteki birim sayısını uygun bir miktar arttırmak suretiyle, parametrik bir test kullanımı yerine parametrik olmayan bir test kullanılabilir ve H0'ı reddetmede aynı kuvvet sağlanmış olur.

Nonparametrik testlerin yararları:

• Nonparametrik testlerin, parametrik testlere göre öğrenilmesi ve uygulanması daha kolaydır.

• Sıralayıcı ölçeğe göre ölçülendirilmiş verilere uygulanabilir.

• Sınıflandırma şeklinde ölçülendirilen verilere uygulanır. Bu tür verilere parametrik testler uygulanamaz.

• Örnekteki birim sayısı n=6 kadar küçük olursa bunun çekildiği toplumun dağılımı bilinmediği sürece non-parametrik test uygulamaktan başka çıkar yol yoktur.

• Toplum dağılımlarının şekli hakkındaki varsayımların (normallik, homojenlik) şüpheli olduğu durumlarda uygulanabilir.

Nonparametrik testlerin kötü yanları:

• Eğer veriler parametrik test için gerekli olan bütün koşulları sağlıyorsa ve ölçme, gereken kuvvette ise bu durumda parametrik test yerine nonparametrik bir test kullanılmasıyla veriler ziyan edilmiş olur.

• Nonparametrik testler ve bunlar için kullanılan anlamlılık düzeyini veren tablolar çok fazla dağıtılmış ve bazıları da özelleştirilmiştir. Bu nedenle bu testlerin pratikliği ve uygulanabilirliği parametrik testlere göre daha azdır.

İstatistik testlerinin uygulanabilmesi için aranan varsayımlar:

• Toplumla ilgili olanlar:– Toplumun normal dağılım göstermesi

(parametrik testler için)

• Örnekle ilgili olanlar:– Örneğin rasgele seçilmesi,– Çekilen birimlerin birbirinden bağımsız olarak

seçilmesi.

• Parametrik testler için değişkenlerin ölçümle belirtilmeleri gereklidir. • Nonparametrik testler için bu ölçmenin yanında gruplara

(kategorilere) ayırma, sınıflandırma gibi ölçülendirme işlemleri de uygulanabilir.

• Parametrik testler, nonparametrik testlere göre daha güçlü testlerdir. Ancak, varsayımların varoluşundan şüpheye düşüldüğü durumlarda nonparametrik testler uygulanır.

• Bu nedenle her parametrik test için bazı nonparametrik testler geliştirilmiştir. Bunlar içinde en önemlileri,– Eşleştirilmiş gruplar için kullanılan t testi yerine Wilcoxon işaret testi,– İki toplum ortalamasının farkını test etmede kullanılan t testi yerine

Mann -Whitney testi,– İki topluma ait oranların farkını test etmede kullanılan Z testi yerine 2x2

ki kare testi,– Bir yönlü variyans analizi yerine Kruskal Wallis variyans analizi

testleridir.

Wilcoxon İşaret Testi

• Wilcoxon testi iki A ve B örneğinin çiftleştirilmiş farkları dikkate alınarak yapılır.

• Bu testte, • bir gruptan iki ayrı işlem sonucu elde edilen

puanların her bir çifti için bir fark (di) bulunur.

• Bu farklar, işaretleri göz önüne alınmaksızın en küçükten başlayarak sıraya konur.

• Sıfır olan farklar analizden çıkarılır.

• Aynı puana sahip di'ler varsa, bunlara almaları gereken sıraların ortalaması sıra olarak verilir.

• Sıralamadan sonra fark işaretleri (-) ve (+) olarak konulur.

• Eğer gruptan elde edilen iki işlem puanları eşitse, yani H0 doğru ise, pozitif di'ler ve negatif di'ler toplamı hemen hemen birbirine eşit olacaktır.

• Fakat pozitif di'lerin toplamı negatif di'lerin toplamından çok fazla farklıysa iki işlemin birbirlerinden farklı oldukları sonucuna varılır. H0 reddedilir.

• Eşleştirilmiş deneylerde sıra toplamı ile ilgili olasılıklar, olasılık yasaları kullanılarak hesaplanabilir.

• (-) ve (+) farklarına ait sıra toplamlarının (T) küçük olanının, H0 hipotezinin doğrultusunda çift sayısına (n) göre belirli bir değere eşit ve ondan küçük (ya da büyük) olma olasılıkları tablolar halinde hazırlanmıştır.

• Farkı sıfır olmayan çift sayısı n ve anlamlılık düzeyi 'ya göre T'nin bir ve iki yanlı kritik değerleri bulunabilir (Ek 7).

EK 7

Wilcoxon Uyumlu çiftler, işaretli dereceler

testinde T'nin kritik değerleri

* 0.025 0.01 0.005

n ** 0.05 0.02 0.01

6 0 - -

7 2 0 -

8 4 2 0

9 6 3 2

10 8 5 3

11 11 7 5

12 14 10 7

13 17 13 10

14 21 16 13

15 25 20 16

16 30 24 20

17 35 28 23

18 40 33 28

19 46 38 32

20 52 43 38

21 59 49 43

22 66 56 49

23 73 62 55

24 81 69 61

25 89 77 68

(*) Bir yanlı anlamlılık düzeyi

(**) İki yanlı anlamlılık düzeyi

Wilcoxon testi Örnekteki eşlerin sayısına (n) göre test iki şekilde yapılır;1) Küçük örnekler için (n≤25) test:

• Küçük örnekler için hazırlanmış tabloda T'nin kritik değerleri verilmiştir.

• T, aynı işareti (pozitif ya da negatif) taşıyan sıra toplamlarından küçük olanın değeridir.

• Örneğin n=17 çift için =0.05 düzeyinde T'nin iki yanlı dağılımındaki kritik değeri 35'dir.

• Thesap≤Ttablo ise Ho red.• Eğer örnekte, farkı sıfır olan (di=xi-yi=0) çiftler varsa bunlar

çıkarıldıktan sonra diğer çiftlerin sayısı n olarak alınır.• Farklar sıraya konulduktan sonra birbirlerine eşit olan farkların sıra

numarası, bu farkların içinde bulundukları sıra sayılarının ortalamasıdır. (Örneğin, üç tane fark birbirine eşitse ve bunlar 3., 4. ve 5. sıralarda bulunuyorsa, bunların sıra sayıları, (3+4+5)/3=4 olacaktır. Bunlardan sonra gelen farkın sıra sayısı da 6 olacak, 3. ve 5. sıra sayıları sıralamada yer almayacaktır.)

Örnek 17.5: Pentothal ile indüksiyon yapılan hastalarda anestezinden önce ve anestezi sırasında (10'uncu dakikada) nabız sayıları aşağıda verilmiştir. t testi için varsayımların gerçekleşmediğini varsayarsak "Anesteziden önceki ve sonraki nabız sayıları arasında fark yoktur" hipotezini kontrol edelim. = 0.05 olsun.

Çözüm:• 10 tane gözlem çiftinden iki

tanesinin farkı sıfır olduğundan n=8 olur.

• Farkı sıfır olan 2 çifti çıkardıktan sonra geriye kalan 8 farkın sıralanışı tabloda görülmektedir.

• Eksi (-) işaretlilerin sıra toplamı T=(1+3=4) 4'tür.

• (+) işaretlilerin ise T=(6+3+6+3+8+6=32) 32'dir.

• Bunların küçük olanı 4 olduğundan T=4 olarak alınacaktır.

• T'nin kritik değerleri tablosunda n=8 ve =0.05 için T=4'dür.

• Thesap≤Ttablo ise Ho red.• Sonuç olarak, anestezi

sırasındaki nabız sayılarının anesteziden önceki nabız sayılarından farklı olduğu kararına varılır.

____________________________________________________ Nabız Sayıları (Önce - Sonra) ____________________________________________________ Anesteziden Anesteziden Fark Sıra önce sonra _____________________________________________________ 80 80 0 - 88 84 4 6 92 93 -1 1 96 94 2 3 100 96 4 6 94 92 2 3 98 92 6 8 104 100 4 6 94 96 -2 3 100 100 0 - _____________________________________________________

Büyük ( n>25 ) örnekler için Test:

n>25 örnekler için T,

Ortalaması

Varyansı

olan bir normal dağılıma yakın bir dağılım verir. Buna göre, gözlenen T değerinin birim normal dağılımdaki değeri olan Z,

Elde edilen Z değeri bir ve iki yanlı Z tablolarındaki kritik değerlerle karşılaştırılarak hipotez kontrol edilir.

T

n n ( )1

4

T

n n n2 1 2 1

24 ( ).( )

ZT

n n

n n n

( )

( )( )

14

1 2 124

Örnek 17.6: Örnek 17.5'deki çalışmanın 30 kişi üzerinde yapıldığını ve aşağıdaki sonuçların bulunduğunu varsayalım. "Anestezi sırasındaki nabız sayısının anesteziden önceki nabız sayısından daha düşüktür" hipotezini kontrol edelim.

• İki tane fark sıfır olduğundan n=28'dir.

• (+) ve (-) işaretli farkların sıra numaraları karşılarında verilmiştir.

• (-) işaretli farkların sıra toplamı 120.5'dir.

• (+) işaretlilerin sıra toplamı ise 285.5'dir.

• Buna göre T=120.5 alınır.

Z = -1.876

Bir yönlü tabloda Z0.05 = 1.645 H0 hipotezi reddedilir. Buna göre,

"Anestezi sırasındaki nabız sayıları daha düşüktür" hipotezi kabul edilir.

Anesteziden Anesteziden Fark Önce Sonra (Sonra-Önce) Sıra __________________________________________________________ 88 84 -4 18 87 85 -2 9.5 86 87 -1 3.5 85 86 1 3.5 94 95 1 3.5 100 99 -1 3.5 97 97 0 - 96 94 -2 9.5 86 88 2 9.5 90 88 -2 9.5 92 95 3 14 90 94 4 18 92 97 5 21.5 98 92 -6 23.5 80 88 8 26 81 86 5 21.5 82 84 2 9.5 82 85 3 14 83 87 4 18 88 94 6 23.5 81 80 -1 3.5 87 91 4 18 79 82 3 14 80 87 7 25 80 90 10 28 82 82 0 - 87 86 -1 3.5

Z

120 528 28 1

428 28 1 2 28 1

24

.( )

( )( )

Mann - Whitney Testi• Bu test, iki gruba ait gözlemlerin karşılaştırılmasında

yaygın bir şekilde kullanılır.

• Parametrik testlerden t testinin gerekli olan varsayımlarından şüphe edildiğinde, ya da gözlemlerin ölçümünün zayıf olması durumunda t testinin bir alternatifi olarak kullanılır.

• U testi, gözlemlerden elde edilen bilgilerin en azından sıralı ölçme ile ölçülendirilebildiği iki bağımsız örneğin, ait oldukları sıra toplamlarının dağılımlarının aynı olup olmadığını test eder.

• A ve B gibi iki ayrı toplumdan örnek alındığını düşünelim. Kurulacak hipotez,

H0: A ve B toplumları aynı dağılıma sahiptir.

H1: A ve B toplumları farklı dağılımlara sahiptir.

• Örnek olarak nA=3, nB=4 olsun.

Sıra : A A A B B B B

Sıra No : 1 2 3 4 5 6 7

TA = 1 + 2 + 3 =6

Küçük olan U değeri alınarak tablo değeri ile karşılaştırılır.

Bir düzeyinde test sonucunun anlamlı olabilmesi için hesaplanan U'nun alt kritik U'dan küçük ya da üst kritik U'dan büyük olması gerekir.

Uhesap<Ualt kritik veya Uhesap>Ualt kritik Ho Red

A AA A

B BB BU T

n nU T

n nve

( ) ( )1

2

1

2

EK 8Mann-Whitney U testi için Alt Kritik U değerleri(bir yanlı)

nA 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

nB

0 0 0 0 0 0 1 1 1 1 3 3 4 4 5 5 5 6

3 0 0 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9

1 1 2 3 3 4 5 5 6 6 7 8 8 9 10 10 11 12

0 1 2 2 3 4 4 5 6 6 7 8 8 9 10 10 11

4 1 2 3 4 5 5 6 7 8 9 10 11 12 12 13 14 15

2 3 4 5 6 7 8 8 10 11 12 13 15 16 17 18 19

2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

5 3 4 6 7 8 9 10 12 13 14 15 16 18 19 20 21

5 6 7 9 10 12 13 14 16 17 19 20 21 23 24 26

4 5 7 8 9 10 12 13 14 16 17 19 20 21 23

6 6 7 9 11 12 14 15 17 18 20 22 23 25 26 28

8 9 11 13 15 17 18 20 22 24 26 27 29 31 33

7 8 10 12 13 15 17 18 20 22 24 25 27 29

7 9 11 13 15 17 19 21 23 25 27 29 31 33 35

13 14 16 18 20 22 25 27 29 31 34 36 38 40

10 12 14 16 18 21 23 25 27 29 31 33 35

8 14 16 18 20 23 25 27 30 32 35 37 39 42

16 19 21 24 27 29 32 34 37 40 42 45 48

15 17 19 22 24 27 29 32 34 37 39 41

9 18 21 24 27 29 32 35 38 40 43 46 49

22 25 28 31 34 37 40 43 46 49 52 55

20 23 25 28 31 34 37 39 42 45 48

10 24 27 30 34 37 40 43 46 49 53 56

28 32 35 38 42 45 49 52 56 59 63

26 29 32 35 38 42 45 48 51 54

11 31 34 38 41 45 48 52 56 59 63

35 39 43 47 51 55 58 62 66 70

32 36 39 43 47 50 54 57 61

12 38 42 46 50 54 58 62 66 70

43 48 52 56 61 65 69 73 78

40 44 48 52 56 60 64 68

13 46 51 55 60 64 68 73 77

52 57 62 66 71 76 81 85

48 52 57 61 66 70 74

14 56 60 65 70 75 79 84

62 67 72 78 83 88 93

57 62 67 71 76 81

15 65 71 76 81 86 91

73 78 84 89 95 101

67 72 77 83 88

16 76 82 87 93 99

84 90 96 102 108

78 83 89 94

17 88 94 100 106

97 103 110 116

89 95 101

18 100 107 113

110 117 1241. sıra : = 0.01 düzeyi 102 108

19 2. sıra : = 0.025 düzeyi 114 1203. sıra : = 0.05 düzeyi 124 131

115

20 128

139

Örnek 17.7: İki tip A ve B kültürlerinde her birim hacim için bakteri sayıları aşağıda verilmiştir. Bu iki kültürü bakteri sayıları bakımından birbiriyle karşılaştıralım. = 0.05 alınacak.

A Kültürü B Kültürü

(3) 27 32 (7)

(6) 31 29 (5)

(2) 26 35 (8)

(1) 25 28 (4)

Sıra Toplamı: 12 24

H0: A ve B kültürlerindeki bakteri sayılarının dağılımı aynıdır.H1: A ve B kültürlerindeki bakteri sayılarının dağılımı aynı değildir.

İki gruba ait gözlem değerlerinin büyüklüklerine göre sıra numaraları parantez içinde verilmiştir.

(Negatif işaretli değerler varsa, bunlar en küçük sıraları alırlar).

TA = 12, TB = 24, nA = nB = 4

A

B

U

U

124 4 1

22

244 4 1

214

( )

( )

• UA < UB olduğu için U = UA = 2

• Hipotez iki yanlı ve verilen önemlilik düzeyi = 0.05 olduğundan, tabloda 0.05'in yarısı olan 0.025'e karşı gelen U değeri kritik değer olarak alınacaktır.

• Tabloda nA = nB = 4 için kritik Ualt kritik =1

• Uhesap>Ualt kritik H0 hipotezi kabul

Kruskal Wallis Testi• Bir yönlü variyans analizinde istenen

varsayımların gerçekleşememesi halinde bu test uygulanır.

• Hipotez:

H0: Gruplar arasında fark yoktur.

H1: En az bir grup diğerlerinden farklıdır.

Testin Uygulanışı:• Tüm gruplarda yer alan veriler bir sıra halinde

küçükten büyüğe doğru sıralanırlar. • Bunlara, en küçüğüne 1’den başlayarak sıra

numaraları verilir. • Birbirlerine eşit olan verilerin sıra numaraları bu

konuda daha önce anlatıldığı şekilde verilir.• Tabloda, her verinin karşısına sıra numarası

yazılır. • Gruplara ait sıra numaraları her grup için ayrı

ayrı toplanır (Ti). i, gruplara ait indistir.

• Test İstatistiği hesaplanır.KW = 12/n(n+1) ( (Ti )2 /ni) – 3(n+1)Ti - i. Gruptaki verilerin sıra numaralarının toplamıni – i. Gruptaki veri sayısın – Toplam veri sayısı

• Anlamlılık düzeyi belirlenir. değerine göre tablodan kritik değer bulunur.

a) Gruplardaki veri sayısı (ni) 5’den fazla ise veya grup sayısı (k) 3’den fazla ise ki kare tablosu kullanılır (=k-1).

– Hesaplanan KW 2 ise sıfır hipotezi reddedilir.

b) Grup sayısı 3 ve her gruptaki veri sayısı n5 ise Kruskal Wallis tablosu (Ek 9) kullanılır.

– Tabloda, gruplardaki veri sayısına uygun olan kombinasyon sırası seçilir. Bu kombinasyon için KW değerleri ve bunlara karşı gelen olasılık değerleri verilmiştir.

– KW değerlerinden, örnekten hesaplanan KW’ye en yakın olanı ve karşısındaki olasılık değeri (p) alınır.

– p ise H0 hipotezi reddedilir.

EK 9KRUSKAL-WALLIS VARYANS ANALİZİ TABLOSU

KW P KW P

n1 n2 n3 n1 n2 n3

3 3 3 7,200 0,004 5 4 3 7,445 0,0106,489 0,011 7,395 0,0115,689 0,029 5,656 0,0495,600 0,050 5,631 0,0505,067 0,086 4,549 0,0994,622 0,100 4,523 0,103

4 3 3 6,745 0,010 5 4 4 7,760 0,0096,709 0,013 7,744 0,0115,791 0,046 5,657 0,0495,727 0,050 5,617 0,0504,709 0,092 4,619 0,1004,700 0,101 4,553 0,102

4 4 3 7,144 0,010 5 5 3 7,578 0,0107,136 0,011 7,543 0,0105,599 0,049 5,706 0,0465,576 0,051 5,626 0,0514,546 0,099 4,545 0,1004,477 0,102 4,536 0,102

4 4 4 7,654 0,008 5 5 4 7,823 0,0107,538 0,011 7,791 0,0105,692 0,049 5,666 0,0495,654 0,054 5,643 0,0504,654 0,097 4,523 0,0994,500 0,104 4,520 0,101

5 3 3 7,079 0,009 5 5 5 8,000 0,0096,982 0,011 7,980 0,0105,649 0,049 5,780 0,0495,515 0,051 5,660 0,0514,533 0,097 4,560 0,1004,412 0,109 4,500 0,102

Örnekteki Birim Sayısı Örnekteki Birim Sayısı

Örnek 17. 8: Bir araştırma için alınan 3 grubun yaş ortalamaları arasında fark olup olmadığı test edilmek isteniyor. Gruplara göre yaş dağılımı aşağıda verildiğine göre uygun testi seçerek bu gruplardaki yaşların farklı olup olmadığını bulunuz.

Grup1

Sıra1

Grup2

Sıra2

Grup3

Sıra3

15 6 18 7,5 23 13 18 7,5 20 10 20 10 12 3,5 22 12 25 16,5 10 1,5 24 14,5 24 14,5 13 5 25 16,5 20 10 12 3,5 26 8 10 1,5

Sıra Toplamı(Ti)

28,5 60,5 82

ni 7 5 6

Grup farkı gözetmeksizin en küçükten başlayarak sıra numarası verilirGruplara ait veri sayıları ve sıra toplamlarını formülde yerlerine koyarak KW’yu bulunur.

1,1257)8,1968(342

12)118(3

6

82

5

5,60

7

5,28

)118(18

12KW

222

991,5,213.d.s 22;05,0 KW >

22050 ;,

H0 red

Örnek 17.9: Örnek 17.8’de gruplardaki veri sayıları aşağıdaki gibi olsun. Grup sayısı 3 ve gruplardaki veri sayısı da 5 olduğu için test için Kruskal Wallis tablosu kullanılacaktır.

Grup1 Sıra Grup2 Sıra Grup3 Sıra 15 4 18 5,5 23 11 18 5,5 20 8 20 8 12 2 22 10 25 14,5 10 1 24 12,5 24 12,5 13 3 25 14,5 20 8

Sıra toplamı (Ti)

15,5 50,5 54

ni 5 5 5

1,948)3,1141(

240

12)115(3

5

54

5

5,50

5

5,15

)115(15

12KW

222

Kruskal Wallis Tablosunda, üç gruptaki veri sayıları 5,5,5 olduğu için, bu kombinasyonun karşısında bulunan KWhesap=9,1’e en yakın olan değer bulunur. Bu değer tabloda (ek-9) KW=8 ve P=0.009’dir. Örnekten bulunan KW, 8’den de küçük olduğu için örnek değerleri için p0.009’dur. Sonuç olarak sıfır hipotezi reddedilir. En az bir grup diğer gruplardan farklıdır.

Kolmogorov - Smirnov Testi• Ki-kare testinin yaptığı işi yapar.

• Gözlerdeki küçük frekanslardan etkilenmediğinden n x 2 tablolarında ki kare testinin yerine kullanılır.

• Ki kare testinde beklenen değer 5'in altında olduğunda kategorileri birleştirme yoluna gidiliyordu. Bu da bilgi kaybına neden oluyor.

• Ki kare testinin hiç uygulanamadığı küçük örneklerde Kolmogorov Smirnov testi uygulanabilir.

• • n x 2 tablosunda n sayısının büyük olması yani, grubun daha fazla

sınıflara ayrılması, testin gücünü arttırır.

• Bu test yalnızca iki grubun birbiriyle karşılaştırılması ve gözlenen bir frekans dağılımının kuramsal bir dağılımla karşılaştırılmasında kullanılır.

• Örneklerin durumuna göre, tek örneklem Kolmogorov - Smirnov testi ve çift örneklem Kolmogorov - Smirnov testi olmak üzere iki ayrı test vardır.

Tek Örneklem Kolmogorov - Smirnov Testi• Bu test bir iyi uyuşum testidir.

• Gözlenen bir frekans dağılımının kuramsal bir dağılıma uyup uymadığını test eder.

• H0 hipotezi olarak "kuramsal ve örnekten elde edilen gözlenen eklemeli frekansların oranları birbirine eşittir" alınır.

fb fg fb fg fbk fgkE E E E E ENb Ng Nb Ng Nb Ng

1 1 2 2 , ,.........,

• Kolmogorov - Smirnov testi en büyük farka göre işlem yapar.

• En büyük farkı D ile gösterelim.• H0 koşulu altında D'nin örneklem dağılımı

bilinmektedir. Bu örneklem dağılımında D'nin belli düzeylerdeki iki yanlı kritik değerleri verilmektedir. (Ek 10).

• Dhesap<Dtablo H0 kabul

EK 10Tek Örneklem Kolmogorov-Smirnov Testinde D'nin kritik değerleri

Örnektekibirim İki yanlı anlamlılık düzeyleri()sayısı( n ) 0.2 0.15 0.1 0.05 0.01

1 0.900 0.925 0.950 0.975 0.9952 0.684 0.726 0.776 0.842 0.9293 0.565 0.597 0.642 0.708 0.8284 0.494 0.525 0.564 0.624 0.7335 0.446 0.474 0.510 0.565 0.6696 0.410 0.436 0.470 0.521 0.6187 0.381 0.405 0.438 0.486 0.5778 0.358 0.381 0.411 0.457 0.5439 0.339 0.360 0.388 0.432 0.51410 0.322 0.342 0.368 0.410 0.49011 0.307 0.326 0.352 0.391 0.46812 0.295 0.313 0.338 0.375 0.45013 0.284 0.302 0.325 0.361 0.43314 0.274 0.292 0.314 0.349 0.41815 0.266 0.283 0.304 0.338 0.40416 0.258 0.274 0.295 0.328 0.39217 0.250 0.266 0.286 0.318 0.38118 0.244 0.259 0.278 0.309 0.37119 0.237 0.252 0.272 0.301 0.36320 0.231 0.246 0.264 0.294 0.35625 0.210 0.220 0.240 0.270 0.32030 0.190 0.200 0.220 0.240 0.29035 0.180 0.190 0.210 0.230 0.270

35 +1 0 7.

N

1 2 2.

N

1 3 6.

N

1 6 3.

N

1 1 4.

N35

Örnek 17.10: Bir toplumdan seçilen 4 çocuklu 100 ailenin sahip oldukları kız çocuk sayıları aşağıda verilmiştir. Bu dağılım, kız çocuğunun doğum olasılığı 0.50 olan bir binomial dağılıma uyar mı? Ya da, bu örnek kız çocuğu doğum olasılığı 0.50 olan bir toplumdan seçilmiş rasgele bir örnek midir? =0.05

Kız Çocuğu Sayısı fg Efg Efg/100 fb Efb Efb /100 Efb/100-Efg/100 _____________________________________________________________________________ 0 4 4 0.04 6.25 6.25 0.0625 0.0225 1 26 30 0.30 25.00 31.25 0.3125 0.0125 2 38 68 0.68 37.56 68.75 0.6875 0.0075 3 28 96 0.96 25.00 93.75 0.9375 0.0225 4 4 100 1.00 6.25 100 1.0000 0.0000 _____________________________________________________________________________ Toplam 100 100

H0: Örnekten gözlenen frekans dağılımı, kuramsal frekans dağılımına uyar.

H1: İki frekans dağılımı birbirinden farklıdır.

En büyük frekans oranı farkı 0 kız ve 3 kız sayısındadır, D=0.0225

Tabloda n=100 için =0.05'e karşı gelen kritik D değeri, DN

1 36 1 36

1000 136

. ..

Dhesap<D0,05 H0 kabul

Çift Örneklem Kolmogorov Smirnov Testi• Çift örneklem testi, bağımsız iki örneğin aynı toplumdan (ya da dağılımları

aynı olan toplumlardan) gelip gelmediğini inceleyen bir testtir. • İki yanlı test, örneklerin alındığı dağılımlardaki her çeşit farklılığa (çarpıklık,

basıklık, eğrilik) duyarlıdır. • Örneklerden birinin alındığı toplumdaki değerlerin, diğer örneğin alındığı

toplumdaki değerlere kıyasla olasılık açısından daha büyük olup olmadığına karar vermede bir yanlı test kullanılır.

• Çift örneklem testi de tek örneklem testi gibi birikimli iki dağılım arasındaki uyuşumu inceler.

• Eğer iki örnek gerçekten aynı toplumdan alınmışsa, bunlar, toplum dağılımından sadece rasgele sapmalar göstereceğinden, her iki örneklemin eklemeli dağılımlarının birbirlerine oldukça benzer olmaları beklenir.

• İki örneğin eklemeli frekans dağılımları herhangi bir noktada çok fazla ayrıysa, bu iki örneğin ayrı toplumlardan geldiğine işaret eder.

• Kolmogorov-Smirnov çift örneklem testinde, her iki örnekteki eklemeli frekans oranları ayrı ayrı bulunur.

• Bir yanlı test için oran farkları istenilen yönde alınarak maksimum olan fark D olarak alınır. İki yanlı test için ise oran farklarının maksimum mutlak değerlisi D olarak alınır. Bir yanlı testte, H1, örneklerden birinin alındığı toplum değerlerinin diğer örneğin alındığı toplum değerlerine kıyasla olasılık açısından daha büyük olduğunu belirtir.

• Testin bir yanlı ya da iki yanlı oluşu ve her iki örnekteki gözlem sayılarının 40'tan az ya da büyük oluşlarına göre ayrı test yöntemleri uygulanır.

i. İki Yanlı Testler için Yöntem: a) n1 ve n>40 ise:

• 1) Her iki örnekteki eklemeli frekanslar bulunur.

• 2) Eklemeli frekanslar örneklerdeki birim sayılarına bölünerek eklemeli frekans oranları bulunur.

• 3) İki örneğe ait eklemeli frekans oranları arasındaki farklar bulunur.

• 4) En büyük fark, mutlak değer olarak gözlenen D'dir.

5) Beklenen D (kritik D) değeri

n1 = Birinci örnekteki birim sayısı

n2= İkinci örnekteki birim sayısı

K = Yanılma olasılığı 'ya bağlı değer.

7)

KDn nn n

K

1 2

1 2.

K değeri_________________

_0.10 1.220.05 1.360.025 1.48 0.01 1.63 0.001 1.95

Dhesap<D0,05 H0 kabul

Örnek 17.11: Primer kanser özofagusta olan 41 hastanın ve primer kanser kardiada olan 42 hastanın yaş gruplarına göre dağılımı aşağıda verilmiştir. İki grubun yaş gruplarına göre dağılımı aynı mıdır? = 0.05 alınacak.

H0: Kanser hücresi kardiada ve özofagusta olan hastaların yaş gruplarına göre dağılımı aynıdır.

H1: İki grubun yaş gruplarına göre dağılımı farklıdır. Kardia özofagus Yaş Ef Ef Fark Grupları f Ef oranı f Ef oranı _________ ______ ________________ __________________ _______ 50 4 4 0.095 3 3 0.073 0.021 50 - 59 4 8 0.190 6 9 0.219 0.029 60 - 69 10 18 0.428 12 21 0.512 0.084 70 - 79 20 38 0.904 17 38 0.926 0.022 80 + 4 42 1.000 3 41 1.000 0.000 _________ ______________________ __________________ _______ Toplam 42 41

En büyük eklemeli frekans farkı mutlak değer olarak 0.084'dür. Buna göre D=0.084 olur.

n1, n2 >40 ve hipotez iki yanlı olduğundan, beklenen D değeri, =0.05 için K=1.36

D

13641 42

41 420 298. . Dhesap<D0,05 H0 kabul

• b) n1 = n2 ≤40 ise:

• 1) Her iki gruptaki eklemeli frekanslar bulunur. En büyük eklemeli frekanslar farkı D olarak alınır.

• 2) Verilen N ve 'ya göre çift örneklem için hazırlanan tablodan D (D) kritik değeri bulunur (Ek 11).

• 3) Dhesap<Dtablo H0 kabul

Örnek 17.12: Miks enfeksiyonlu 10 hasta ve 10 kontrol grubundaki sağlam kişilerde "T" antijenine karşı reaksiyon bakımından bir fark var mıdır? = 0.05

H0: Her iki gruptaki kişilerin reaksiyonlara göre dağılımları aynıdır.

H1: Gruplardaki kişilerin reaksiyonlara göre dağılımları farklıdır. Hasta Kontrol Grubu Grubu Reaksiyon f Ef f Ef Ef farkı ____________________ ___________ ____________ Erken 4 4 1 1 3 Geç 0 4 2 3 1 Her ikisi de 3 7 1 4 3 Negatif 3 10 6 10 0 ____________________ ___________ ____________ Toplam 10 10

Eklemeli frekans farkları için en büyük fark olan 3 gözlenen D değeridir.

Bu örnekte n=n1=n2=10 olur. Tabloda, n=10 ve iki yanlı test için =0.05'e karşı gelen D değeri 7'dir.

Dhesap=3<Dtablo =7 H0 kabul

ii. Bir Yanlı Testler için Yöntem:a) n1 ve n2>40 ise:

• 1) İki yanlı testlerde anlatıldığı gibi gözlenen D değeri bulunur.

• U=2

• 3) Yanılma olasılığı saptanır.

• 4) ²hesap< ²;2 Ho kabul

• Bu ki kare yaklaşımı aynı zamanda n1≠n2 olan küçük örnekler (n1≠n2<40) için de geçerlidir.

2 2 1 2

1 2

4 Dn nn n

Örnek 17.13: Bir sınıfta bulunan 60 kız ve 80 erkek öğrencinin bir sınavdan aldıkları puanlar aşağıda verilmiştir. Erkeklerin puanlara göre en az bir frekansı (Ef oranı) kızlardan daha yüksektir, hipotezini test edin. = 0.01

E R K E K K I Z (Erkek-Kız) Puan f Ef Ef /n1 f Ef Ef /n2 Ef Farkı ___________________________________________________________________ 0 - 20 5 5 0.0625 3 3 0.05 0.0125 21-40 38 43 0.5375 7 10 0.1666 0.3709 41-60 24 67 0.8375 32 42 0.7 0.1375 61-80 10 77 0.9625 17 59 0.9833 -0.0208 81-100 3 80 1.0000 1 60 1.0 0.0000 ____________________________________________________________________ Toplam 80 60

H0: Kız ve erkek öğrencilerin puanlara dağılımı bakımından bir fark yoktur.

H1: Erkek öğrencilerin en az bir puan grubundaki frekansı kız öğrencilere göre daha

yüksektir.Tabloda en büyük eklemeli frekans farkı D = 0.3709'dur.Yukarıda verilen formülde bilinenleri yerine koyup ² 'yi bulalım.D = 0.3709, n1 = 80, n2 = 60 için

2 24

80 60

80 6018 8660 3709

( . ) .

²hesap = 18,866 > ²;2= 9,210 Ho Red

ii. Bir Yanlı Testler için Yöntem: b) n1 = n240 ise:

• 1) İki yanlı testlerde anlatıldığı gibi D değeri bulunur.

• 2) Yanılma olasılığı saptanır.

• 3) D tablosunda (Ek 10), N ve 'ya bağlı D kritik değeri bulunur.

• 4) Dhesap<Dtablo H0 kabul

Örnek 17.14: Diyabetli ve normal kişilerin diyabetli akrabalarının yaş gruplarına göre dağılımı aşağıdaki gibi olsun. Normal gruptaki diyabetli akrabaların yaş gruplarına göre en az bir frekansı diğerlerine göre daha yüksek midir? = 0.05

Diyabetli Normal (Normal-Diyabetli) Yaş Grupları f Ef f Ef Ef farkı __________________________________________________________

0-15 2 2 1 1 -1 16-30 4 6 5 6 0 31-45 7 13 10 16 3 46+ 5 18 2 18 0

_____________________________________________________ Toplam 18 18

H0: Diyabetli ve normal gruptaki akrabaların yaş gruplarına göre dağılımı (frekansları) aynıdır.

H1: Normal gruptaki diyabetli akrabalarının en az bir eklemeli frekansı, (Ef) diğerlerinden daha yüksektir.

En büyük fark 3 D tablosunda N = 18 için bir yanlı testte = 0.05'e karşı gelen D=8 Dhesap=3 < Dtablo =8 H0 kabul