testy nieparametryczne

Testy nieparametryczne

dr hab. Dariusz Piwczyński

2

Ograniczenia testów parametrycznych

Testów parametrycznych nie stosujemy, gdy zmienne mają charakter jakościowy czy też uporządkowany.

3

Zastosowanie testów nieparametrycznych

Testy nieparametryczne wykorzystujemy w sytuacji, gdy nie są spełnione założenia wymagane przez testy parametryczne, jak:zmienne mierzalne, posiadające rozkład zgodny normalnym.

Stosujemy, gdy transformacja danych nie przynosi efektów, np. w zakresie normalizacji rozkładu.

4

Testy nieparametryczne a rozkład zmiennej

Testy nieparametryczne nie zależą od rozkładu zmiennej, od pewnych parametrów rozkładu populacji.

Na ogół obliczenia są proste i nie zajmują wiele czasu.

5

Analiza rang

Testy nieparametryczne pod względem rachunkowym oparte są na analizie rang (lokat).

Dane w porównywanych grupach porządkujemy rosnąco lub malejąco.

Rachunki matematyczne wykonujemy na rangach.

6

Moc testów

Niestety, siła testów nieparametrycznych (1-β) jest niższa niż siła testów parametrycznych –testy nieparametryczne stosujemy tylko wtedy, gdy nie są spełnione założenia, jakich wymagają testy parametryczne.

W odniesieniu do dużych populacji n > 100 zamiast testów nieparametrycznych możemy stosować testy parametryczne, mimo że sama zmienna nie posiada rozkładu normalnego. Jest to możliwe ze względu na fakt, że rozkład średnich z tych prób ulega normalizacji.

7

Statystyczna analiza

8

Statystyczna analiza

9

Statystyka opisowa

Średnia geometrycznaMedianaDominantaRozstępOdstęp międzykwartylowy

kkg xxxx ...21

10

Porównania grup – dobór testu

Cel

Zmienne posiadające

rozkład zgodny z normalnym

Zmienne nie posiadające rozkładu zgodnego z

normalnym lub też wyrażane w skali punktowej

Zmienne binominalne, jakościowe

Opis zmiennej średnia, SD Mediana, odstęp między-

kwartylowy Proporcje

Porównanie jednej grupy do

wartości hipotetycznej

test t dla jednej próby

test Wilcoxon Chi-kwadrat

Porównanie dwóch grup niezależnych

test t dla dwóch grup niezależnych

test U Mann-Whitney test chi-kwadrat dla

dużych prób test Fisher

Porównanie dwóch grup

sparowanych

test t dla dwóch grup zależnych

test kolejności par Wilcoxon, test znaków

test McNemary

Porównanie trzech lub

większej ilości niesparowanych

grup

jedoczynnikowa ANOVA

test Kruskal-Wallis, test mediany

test Chi-kwadrat

Porównanie trzech lub

większej ilości sparowanych

grup

powtarzalnościowy model ANOVA

Repeated test Friedman Cochrane Q

Zależności między cechami

współczynnik korelacji Pearson

współczynnik korelacji Spearman

współczynniki kontyngencji

11

Doświadczenie niezależne – 2 grupy

Test U Mann-Whitney Test ten jest najmocniejszą

nieparametryczną alternatywą dla testu t. Założenia testu: cecha posiada rozkład typu ciągłego, ale może być rozpatrywana również w skali porządkowej.

12

Test U Mann-Whitney

Porównujemy poziom ocenianych wskaźników ścieków zmierzony w czasie zimy i wiosny.

Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT stwierdzony zimą i wiosną jest taki sam:

H0: F(x) = G(x); H1: F(x) ≠ G(x)

F(x), G(x) – dystrybuanta ChZT zimą i wiosną

13

Test U – porównujemy pory roku

Porządkujemy rosnąco dane obydwu grup.

Poczynając od wartości najmniejszej przypisujemy im rangi.

14

Rangi wiązane

Rangi wiązane to sytuacja, w której sąsiednie, uporządkowane wcześniej wartości zmiennej są takie same.

15

Rangi wiązane

W tej sytuacji przyporządkowujemy im tzw. rangi wiązane, które powstają w wyniku obliczenia średnie arytmetycznej z numerów nadawanych kolejnym powtórzeniom tej samej wartości.

(8 + 9)/2 = 8,5

16

Kolejność obliczeń Obliczamy sumę rang dla obydwu grup: R1 i R2.

Ustalamy liczebności porówny-wanych grup

17

Wzór

R1, R2 – suma rang przyznanych 1 i 2 grupie;n1, n2 – liczebność grupy 1 i 2.

111

21 R2

1)(nnnnU

12

1nnnn2nn

Uz

2121

21

18

Wzór

R1, R2 – suma rang przyznanych 1 i 2 grupie;n1, n2 – liczebność grupy 1 i 2.

92482

1)(88138U

2,897

121138138

2138

92z

19

Wartości krytyczne

Obliczone wartości U i Z porównujemy z odpowiednimi wartościami krytycznymi z tabel statystycznych.

20

Wyniki

U = 92 z = -2,897

|-2,897| porównujemy z wartością u/2=1,96 (=0,05) Ze względu na fakt, iż obliczona wartość z jest

większa niż 1,96, odrzucamy hipotezę zerową. Wnioskujemy zatem, że poziom CHZT zmierzony zimą różni się statystycznie od poziomu zarejestrowanego wiosną.

Otrzymany wynik jest również większy niż u/2 odczytane przy =0,01. Wnioskujemy zatem, że między badanymi grupami różnica jest wysoko istotna.

21

Test U n1 i n2 > 20

1)/3(nnn

1)/2)(nn(nRRz

21

2121

22

SAS EG, Test U Mann Whitney

23

SAS EG, Test U Mann Whitney

24

SAS EG, U Mann Whitney, WYNIKI

25

Doświadczenie niezależne, k > 2

Test Kruskal-Wallis

Test mediany

26

Kruskal-WallisWeryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT w k populacjach

jest taki sam:

H0: F1(x) = F2(x) =... = Fk(x)H1: F1(x) ≠ F2(x) ≠ ...≠ Fk(x)

F1(x), F2(x), Fk(x) – dystrybuanty rozpatrywanych populacji.

Program SAS: Kruskal-Wallis Test Chi-kwadrat 8.4354 Stopień swobody 2 Pr > Chi-kwadrat 0.0147

Wartość testu Kruskal-Wallis wynosi 8,4354. Obliczone prawdopodobieństwo (p < 0,0147) pozwala odrzucić H0. Wyniki analizy pozwalają stwierdzić, że pora roku wpływa statystycznie istotnie

na poziom badanego wskaźnika.

27

Kruskal-Wallis

k

1i i

2i 1n3

nT

1nn12

H

n = n1 + n2 + … + nk – liczebność poszczególnych grup;

Ti (i = 1, 2, … k) – suma rang w każdej grupie oddzielnie

28

Test mediany

Test mediany jest mniej dokładną wersją K-W. Obliczenia wykonywane są w oparciu o tablicę kontyngencji 2.

H0 : mediany są takie same w obu próbach, czyli około połowy wszystkich przypadkach w każdej z grup przypada powyżej, a druga poniżej wspólnej mediany.H1 : mediany nie są takie same.

29

SAS EG, test K-W i mediany

30

SAS EG, test K-W

31

SAS EG, test mediany

32

Statistica, test K-W i mediany

33

Doświadczenie zależne, k =2

Test kolejności par WilcoxonaTest znaków

34

Test znaków

Test znaków jest nieparametrycznym odpowiednikiem testu t dla zmiennych zależnych. W teście tym brane jest pod uwagę ile razy wartości pierwszej zmiennej przewyższają wartości drugiej zmiennej i odwrotnie.

35

Test kolejności par Wilcoxona

36

Doświadczenia dwugrupowe zależne w SAS

W SAS konieczne jest wcześniejsze przygotowanie kolumny będącej różnicą jednej i drugiej serii danych!

37

SAS EG, Test znaków i kolejności par Wilcoxona

38


39


test znakówtest kolejności par Wilcoxona

40

Doświadczenia zależne, k > 2

Test Friedmana

41

Test Friedmana

42

Test Friedmana

43

Test Friedmana

testy nieparametryczne

Documents