testy nieparametryczne
DESCRIPTION
Testy nieparametryczne. dr hab. Dariusz Piwczyński. Ograniczenia testów parametrycznych. Testów parametrycznych nie stosujemy, gdy zmienne mają charakter jakościowy czy też uporządkowany. Zastosowanie testów nieparametrycznych. - PowerPoint PPT PresentationTRANSCRIPT
Testy nieparametryczne
dr hab. Dariusz Piwczyński
2
Ograniczenia testów parametrycznych
Testów parametrycznych nie stosujemy, gdy zmienne mają charakter jakościowy czy też uporządkowany.
3
Zastosowanie testów nieparametrycznych
Testy nieparametryczne wykorzystujemy w sytuacji, gdy nie są spełnione założenia wymagane przez testy parametryczne, jak:zmienne mierzalne, posiadające rozkład zgodny normalnym.
Stosujemy, gdy transformacja danych nie przynosi efektów, np. w zakresie normalizacji rozkładu.
4
Testy nieparametryczne a rozkład zmiennej
Testy nieparametryczne nie zależą od rozkładu zmiennej, od pewnych parametrów rozkładu populacji.
Na ogół obliczenia są proste i nie zajmują wiele czasu.
5
Analiza rang
Testy nieparametryczne pod względem rachunkowym oparte są na analizie rang (lokat).
Dane w porównywanych grupach porządkujemy rosnąco lub malejąco.
Rachunki matematyczne wykonujemy na rangach.
6
Moc testów
Niestety, siła testów nieparametrycznych (1-β) jest niższa niż siła testów parametrycznych –testy nieparametryczne stosujemy tylko wtedy, gdy nie są spełnione założenia, jakich wymagają testy parametryczne.
W odniesieniu do dużych populacji n > 100 zamiast testów nieparametrycznych możemy stosować testy parametryczne, mimo że sama zmienna nie posiada rozkładu normalnego. Jest to możliwe ze względu na fakt, że rozkład średnich z tych prób ulega normalizacji.
7
Statystyczna analiza
8
Statystyczna analiza
9
Statystyka opisowa
Średnia geometrycznaMedianaDominantaRozstępOdstęp międzykwartylowy
kkg xxxx ...21
10
Porównania grup – dobór testu
Cel
Zmienne posiadające
rozkład zgodny z normalnym
Zmienne nie posiadające rozkładu zgodnego z
normalnym lub też wyrażane w skali punktowej
Zmienne binominalne, jakościowe
Opis zmiennej średnia, SD Mediana, odstęp między-
kwartylowy Proporcje
Porównanie jednej grupy do
wartości hipotetycznej
test t dla jednej próby
test Wilcoxon Chi-kwadrat
Porównanie dwóch grup niezależnych
test t dla dwóch grup niezależnych
test U Mann-Whitney test chi-kwadrat dla
dużych prób test Fisher
Porównanie dwóch grup
sparowanych
test t dla dwóch grup zależnych
test kolejności par Wilcoxon, test znaków
test McNemary
Porównanie trzech lub
większej ilości niesparowanych
grup
jedoczynnikowa ANOVA
test Kruskal-Wallis, test mediany
test Chi-kwadrat
Porównanie trzech lub
większej ilości sparowanych
grup
powtarzalnościowy model ANOVA
Repeated test Friedman Cochrane Q
Zależności między cechami
współczynnik korelacji Pearson
współczynnik korelacji Spearman
współczynniki kontyngencji
11
Doświadczenie niezależne – 2 grupy
Test U Mann-Whitney Test ten jest najmocniejszą
nieparametryczną alternatywą dla testu t. Założenia testu: cecha posiada rozkład typu ciągłego, ale może być rozpatrywana również w skali porządkowej.
12
Test U Mann-Whitney
Porównujemy poziom ocenianych wskaźników ścieków zmierzony w czasie zimy i wiosny.
Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT stwierdzony zimą i wiosną jest taki sam:
H0: F(x) = G(x); H1: F(x) ≠ G(x)
F(x), G(x) – dystrybuanta ChZT zimą i wiosną
13
Test U – porównujemy pory roku
Porządkujemy rosnąco dane obydwu grup.
Poczynając od wartości najmniejszej przypisujemy im rangi.
14
Rangi wiązane
Rangi wiązane to sytuacja, w której sąsiednie, uporządkowane wcześniej wartości zmiennej są takie same.
15
Rangi wiązane
W tej sytuacji przyporządkowujemy im tzw. rangi wiązane, które powstają w wyniku obliczenia średnie arytmetycznej z numerów nadawanych kolejnym powtórzeniom tej samej wartości.
(8 + 9)/2 = 8,5
16
Kolejność obliczeń Obliczamy sumę rang dla obydwu grup: R1 i R2.
Ustalamy liczebności porówny-wanych grup
17
Wzór
R1, R2 – suma rang przyznanych 1 i 2 grupie;n1, n2 – liczebność grupy 1 i 2.
111
21 R2
1)(nnnnU
12
1nnnn2nn
Uz
2121
21
18
Wzór
R1, R2 – suma rang przyznanych 1 i 2 grupie;n1, n2 – liczebność grupy 1 i 2.
92482
1)(88138U
2,897
121138138
2138
92z
19
Wartości krytyczne
Obliczone wartości U i Z porównujemy z odpowiednimi wartościami krytycznymi z tabel statystycznych.
20
Wyniki
U = 92 z = -2,897
|-2,897| porównujemy z wartością u/2=1,96 (=0,05) Ze względu na fakt, iż obliczona wartość z jest
większa niż 1,96, odrzucamy hipotezę zerową. Wnioskujemy zatem, że poziom CHZT zmierzony zimą różni się statystycznie od poziomu zarejestrowanego wiosną.
Otrzymany wynik jest również większy niż u/2 odczytane przy =0,01. Wnioskujemy zatem, że między badanymi grupami różnica jest wysoko istotna.
21
Test U n1 i n2 > 20
1)/3(nnn
1)/2)(nn(nRRz
21
2121
22
SAS EG, Test U Mann Whitney
23
SAS EG, Test U Mann Whitney
24
SAS EG, U Mann Whitney, WYNIKI
25
Doświadczenie niezależne, k > 2
Test Kruskal-Wallis
Test mediany
26
Kruskal-WallisWeryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT w k populacjach
jest taki sam:
H0: F1(x) = F2(x) =... = Fk(x)H1: F1(x) ≠ F2(x) ≠ ...≠ Fk(x)
F1(x), F2(x), Fk(x) – dystrybuanty rozpatrywanych populacji.
Program SAS: Kruskal-Wallis Test Chi-kwadrat 8.4354 Stopień swobody 2 Pr > Chi-kwadrat 0.0147
Wartość testu Kruskal-Wallis wynosi 8,4354. Obliczone prawdopodobieństwo (p < 0,0147) pozwala odrzucić H0. Wyniki analizy pozwalają stwierdzić, że pora roku wpływa statystycznie istotnie
na poziom badanego wskaźnika.
27
Kruskal-Wallis
k
1i i
2i 1n3
nT
1nn12
H
n = n1 + n2 + … + nk – liczebność poszczególnych grup;
Ti (i = 1, 2, … k) – suma rang w każdej grupie oddzielnie
28
Test mediany
Test mediany jest mniej dokładną wersją K-W. Obliczenia wykonywane są w oparciu o tablicę kontyngencji 2.
H0 : mediany są takie same w obu próbach, czyli około połowy wszystkich przypadkach w każdej z grup przypada powyżej, a druga poniżej wspólnej mediany.H1 : mediany nie są takie same.
29
SAS EG, test K-W i mediany
30
SAS EG, test K-W
31
SAS EG, test mediany
32
Statistica, test K-W i mediany
33
Doświadczenie zależne, k =2
Test kolejności par WilcoxonaTest znaków
34
Test znaków
Test znaków jest nieparametrycznym odpowiednikiem testu t dla zmiennych zależnych. W teście tym brane jest pod uwagę ile razy wartości pierwszej zmiennej przewyższają wartości drugiej zmiennej i odwrotnie.
35
Test kolejności par Wilcoxona
36
Doświadczenia dwugrupowe zależne w SAS
W SAS konieczne jest wcześniejsze przygotowanie kolumny będącej różnicą jednej i drugiej serii danych!
37
SAS EG, Test znaków i kolejności par Wilcoxona
38
SAS EG, Test znaków i kolejności par Wilcoxona
39
SAS EG, Test znaków i kolejności par Wilcoxona
test znakówtest kolejności par Wilcoxona
40
Doświadczenia zależne, k > 2
Test Friedmana
41
Test Friedmana
42
Test Friedmana
43
Test Friedmana