dr. gombos tímea se, iii.sz. belgyógyászati klinika
DESCRIPTION
Paraméteres és nem paraméteres próbák alkalmazása több csoport összehasonlítására folytonos változók esetén. Dr. Gombos Tímea SE, III.sz. Belgyógyászati Klinika. Megválaszolandó kérdések. Különbözik-e egymástól a férfiak és a nők BMI-je? - PowerPoint PPT PresentationTRANSCRIPT
Paraméteres és nem paraméteres próbák alkalmazása több csoport összehasonlítására
folytonos változók esetén
Dr. Gombos Tímea
SE, III.sz. Belgyógyászati Klinika
Megválaszolandó kérdések
Különbözik-e egymástól a férfiak és a nők BMI-je?
Változik-e a vércukor szint egy gyógyszeres kezelés hatására?
Emelkedik-e a koleszterint szint a kor előrehaladtával?
Más-e a vérnyomás a különböző stádiumú betegekben?
►Létezik-e (szignifikáns) különbség két vagy több betegcsoport között?
Megfelelő statisztikai próba kiválasztása Hány csoportunk van?
2 3 vagy több
Függetlenek a mintáink? független csoportok – nők vs. férfiak, súlyos vs.
enyhébb betegek kapcsolt csoportok –
ua. kezelés előtt vs. kezelés után, ua. 10 év múlva valamilyen kritérium alapján előre felállított párok
Normál eloszlású a minta? normál eloszlás → paraméteres teszt nem normál eloszlás → nem paraméteres teszt
Paraméteres Nem paraméteres Normál eloszlás
A próba a tényleges értékekkel számol
Az orvosi gyakorlatban viszonylag ritka, de az adatok normál eloszlásúvá transzformálhatóak (pl. logaritmizálás)
Nem normál eloszlás esetén
A próba sorrendbe állítja az összes értéket, a sorszámokkal (rangok) számol
Az orvosi gyakorlatban gyakoribb
Normál eloszlású a mintám? Hisztogram készítése,
normál görbe ráfektetése, szemmel ellenőrzés
Shapiro-Wilks teszt Ho – az eloszlás normál
H1 – az eloszlás eltér a normálistól
► ha a próba szignifikáns, az eloszlás nem normál
Bizonytalanság esetén?
Histogram of HR_0adatbzis_1.sta 21v*195c
HR_0 = 192*10*normal(x; 80,974; 17,5351)
30 40 50 60 70 80 90 100 110 120 130 140 150 160
HR_0
0
10
20
30
40
50
60
No
of o
bs
HR_0: SW-W = 0,9351; p = 0,00000
tekintsük úgy, mintha nem normál eloszlású lenne a mintánk, mert ha normál eloszlású adatokon nem parametrikus tesztet végzünk, gyakorlatilag a parametrikus teszttel azonos eredményt kapunk, míg fordított esetben ez nem áll fent!
Mintaszám?Hány csoport?
2 minta 3 vagy több
Ismételt méréses ANOVA
1 szempontosAVOVA
Mann-Whitney t.
2 mintás t-próba Páros t-próba
Független minták?igen igennem nem
Normál eloszlásúa minta?
igenigenigen nemnemnem igen nem
Wilcoxon t. Kruskal-Wallis t. Friedman próba
Paraméteres próbák
Nem paraméteres próbák
Két mintás t-próba (unpaired T-test) Például? - A férfiak vagy a nők HGB szintje nagyobb? (felt. norm.) Két minta átlagát hasonlítja össze – ebből következtetünk a
populáció átlagára H0 – a két mintavételi populáció azonos H1’ – az egyik mintavételi populáció nagyobb H1” – az két mintavételi populáció különböző Képlettel számítjuk a t – értéket (minél nagyobb, annál
nagyobb eltérésre utal) Táblázatból ismert, hogy adott szabadságfok mellett
mekkora p (probability) érték tartozik hozzá Ha a p-érték kellően kicsi – elutasítjuk a H0-t Mi a kellően kicsi? – előre meghatározott érték, a
szignifikancia küszöb. Ált. 0,05, vagyis 5%. Ha a p ennél kisebb, mondhatjuk, hogy a két populáció
közötti különbség szignifikáns A p-érték annak a valószínűsége, hogy elsőfajú hibát
követek el (hibásan utasítom el a H0-t) ► p-érték annak a valószínűsége, hogy mégis igaz a H0
A kérdés (az alternatív hipotézis) határozza meg melyik szükséges
Egyoldali próba – egyirányú eltérést vizsgálok (H1’) pl. az egyik pop. nagyobb
Kétoldali próba – kétirányú eltérés (H1”) pl. a két pop. különbözik
Melyik a „szigorúbb”?
Egyoldali vagy két oldali próba (one-tailed, two-tailed)
A kétoldali próba! (az ábrán a piros)
A STATISTICA eleve kétoldali próbához tartozó p-értéket ad meg. Ha a kérdésfeltevésünk indokolja (lehetővé teszi) az egyoldali próbát, a kapott p-értéket osszuk el kettővel (az ábrán a kék intervallum)
Elérési útvonal STATISTICA-ban: Statistics // Basic statistics/Tables// t-test, independent, by groups
A számított statiszika értéke
Degree of freedom, szabadságfok. A két csoport esetszáma -2
A kétoldali próbához tartozó p-érték
Megj.: A t-próba akkor végezhető, ha a két csoport varianciája megegyezik. Ezt tesztelhetjük az F-próbával, ennek az eredménye látható itt. Ha a varianciák jelentősen különböznek (a próba szignifikáns), a t-próba helyett Welch-próba (STATISTICA-ban nem elérhető) vagy nem paraméteres teszt végzése javasolt.
Mann-Whitney teszt Például? –
férfiak vagy a nők BMI-je nagyobb? H0 – nincs különbség a két csoport között
Mintaszám?Hány csoport?
2 minta 3 vagy több
Ismételt méréses ANOVA
1 szempontosAVOVA
Mann-Whitney t.
2 mintás t-próba Páros t-próba
Független minták?igen igennem nem
Normál eloszlásúa minta?
igenigenigen nemnemnem igen nem
Wilcoxon t. Kruskal-Wallis t. Friedman próba
Elérési útvonal: Statistics (felső parancssor) // Nonparametrics //Compairing two independent samples (groups)
Ábra készítése
A próba
Boxplot by GroupVariable: HGB_0
Median 25%-75% Min-Max 1 0
sex
80
100
120
140
160
180
200
HG
B
Csoporttól függetlenül adott rangszámok csoportösszege
esetszámA rangszámösszegből számolt statisztika értéke és a hozzá tartozó p-érték
Ha az egyik csoport minden egyes eleméhez hozzárendeljük a másik csoport minden egyes elemét, akkor a két csoport esetszámainak szorzatával egyenlő számú párt kapunk (144x50=7200db-t). Az U azt mutatja meg, hogy hány ilyen párban nagyobb az első érték, mint a második (+ az egyenlő párok számának a fele). Ha egyforma lenne a HGB a férfiak és a nők között, az U 7200/2=3600 lenne.
Mivel az eredményekből csak nehézkesen állapítható meg, hogy melyik csoportban vannak a nagyobb értékek, érdemes grafikusan ábrázolni.
Páros t-próba Például?
- Változott-e egy év elteltével a betegek Na szintje (felt. norm. eloszlás)
H0 – a különbségek átlaga = 0Mintaszám?
Hány csoport?2 minta 3 vagy több
Ismételt méréses ANOVA
1 szempontosAVOVA
Mann-Whitney t.
2 mintás t-próba Páros t-próba
Független minták?igen igennem nem
Normál eloszlásúa minta?
igenigenigen nemnemnem igen nem
Wilcoxon t. Kruskal-Wallis t. Friedman próba
Elérési útvonal STATISTICA-ban: Statistics // Basic statistics/Tables // t-test, dependent samples
Itt is lehet ábrát kérni!
A mintapárok közötti különbségeken alapul a t-értéket meghatározó képlet, de szerepel benne a szórás (SD) is.
Megj.: hamis eredményt kaphatunk, ha a két mérés nem azonos módszerrel történik, vagy pl. nem azonos a mértékegység!
Jelen esetben a p-érték nagyobb, mint a küszöb érték, a H0-t nem vetjük el, a csoportok között nincs különbség.
(Megtévesztő lehet, de akár kis eltérés is lehet szignifikáns, ha az eltérések szórása kicsi. Könnyen belátható, hogy ha pl. 0,5 az átlagos eltérés, de az a 0,4-0,6 tartományba esik, az egy jelentős különbség. Míg abban az esetben, ha ugyancsak 0,5 az eltérések átlaga, de az értékek -1 és 2 között szórnak, akkor nincs tényleges különbség a két csoport között)
Wilcoxon próba Például?
- Változott-e egy év elteltével a betegek Na szintje ( nem norm. eloszlás)
H0 – a különbségek átlaga = 0Mintaszám?
Hány csoport?2 minta 3 vagy több
Ismételt méréses ANOVA
1 szempontosAVOVA
Mann-Whitney t.
2 mintás t-próba Páros t-próba
Független minták?igen igennem nem
Normál eloszlásúa minta?
igenigenigen nemnemnem igen nem
Wilcoxon t. Kruskal-Wallis t. Friedman próba
Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing two dependent samples (variables)
A próba előjeltől függetlenül rangsorolja a két minta közötti különbségeket, majd a negatív és a pozitív különbségekhez tartozó rangokkal számol.
Egyszempontos ANOVA Például?
- Különböznek-e egymástól a más-más NYHA stádiumban lévő szívelégtelen betegek kreatinin szintje? (felt. norm eloszlást)
Mintaszám?Hány csoport?
2 minta 3 vagy több
Ismételt méréses ANOVA
1 szempontosAVOVA
Mann-Whitney t.
2 mintás t-próba Páros t-próba
Független minták?igen igennem nem
Normál eloszlásúa minta?
igenigenigen nemnemnem igen nem
Wilcoxon t. Kruskal-Wallis t. Friedman próba
ANOVA = Analysis of VarianceTöbb csoport összehasonlításánál
kézenfekvő, de nem helyes a párokat alkotni és azokat t-teszttel összehasonlítani.
Ha a csoportok egy szempont szerint különböznek (pl. betegség
súlyossága)→ egyszempontos ANOVA több szempontot szerint is vizsgáljuk (pl. betegség
súlyossága és nem) → többszempontos ANOVA H0 – mindegyik minta ugyanolyan átlagú
sokaságból származik.A csoportokon belüli és a csoportok közötti
varianciát elemzi
Elérési útvonal STATISTICA-ban: Statistics // ANOVA // one-way ANOVA
Osztályozó vagy független változó
Függő változó – a mért vagy megfigyelt adatok
Ha a teszt szignifikáns eredményt ad, a csoportok közül legalább az egyik nem azonos populációból származik
A kísérleti tervtől függően választott elemzéssel meghatározhatjuk, hogy melyik csoport különbözik
NYHA_0; LS MeansCurrent effect: F(3, 190)=14,810, p=,00000
Effective hypothesis decompositionVertical bars denote 0,95 confidence intervals
1 2 3 4
NYHA
40
60
80
100
120
140
160
180
200
220kr
eat_
0
Kruskal-Wallis próba Például?
- Különböznek-e egymástól a más-más NYHA stádiumban lévő szívelégtelen betegek kreatinin szintje? (nem norm eloszlás)
Mintaszám?Hány csoport?
2 minta 3 vagy több
Ismételt méréses ANOVA
1 szempontosAVOVA
Mann-Whitney t.
2 mintás t-próba Páros t-próba
Független minták?igen igennem nem
Normál eloszlásúa minta?
igenigenigen nemnemnem igen nem
Wilcoxon t. Kruskal-Wallis t. Friedman próba
Median 25%-75% Min-Max 1 2 3 4
NYHA_0
0
100
200
300
400
500kr
eat_
0
Páronkénti össze-
hasonlítások eredményei
Median test – a K-W-t „egyszerűbb”
változata. Ha sok kiugró érték van, megbízhatóbb
Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics //
Comparing multiple indep. samples
Friedman próba Például?
- Változik-e a koleszterint szint 5 évenként mérve?
Mintaszám?Hány csoport?
2 minta 3 vagy több
Ismételt méréses ANOVA
1 szempontosAVOVA
Mann-Whitney t.
2 mintás t-próba Páros t-próba
Független minták?igen igennem nem
Normál eloszlásúa minta?
igenigenigen nemnemnem igen nem
Wilcoxon t. Kruskal-Wallis t. Friedman próba
Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing multiple dep. Samples (variables)
Általános vizsgálati szempontok Először fogalmazzuk meg a kérdést, ehhez keressük meg a
megfelelő próbát Ne csak a p-értéket nézzük, próbáljunk utánagondolni az
eredményeknek (pl. Mann-Whitney tesztnél U). Ábrázoljuk ellenőrzésképpen grafikusan is!
Orvosi gyakorlatban leggyakrabban nem paraméteres teszteket használunk
A programmal két csoportot könnyen több száz változó szerint is összehasonlíthatunk (szignifikancia vadászat). Ilyenkor ne felejtsük el lejjebb vinni a szignifikancia küszöböt (Bonferroni korrekció). Definícióból adódik, hogy 100 db 0,05 p-értékű tesztnél valószínűleg 5 szignifikáns eltérést mutat még akkor is, ha a két populáció nem különbözik!
folyamatos változók (pl. életkor, se Na)
normál eloszlású nem normál eloszlású
2 független csoport összehasonlítása
két mintás t-próba Mann-Whitney teszt
Basic stat./Tables//T test, independent, by groups
Nonparametrics//Comparing two independent samples (groups)
Szignifikánsan különbözik-e a súlyos és nem súlyos betegek vércukor értéke?
2 kapcsolt csoport összehasonlítása (pl. érték kezelés előtt és kezelés
után)
páros t próba Wilcoxon teszt
Basic stat./Tables//T test dependent samples
Nonparametrics//Comparing two dependent samples (variables)
Megváltozik-e a betegek fehérvérsejt száma a kezelés hatására? Változik-e a betegek koleszterinszintje 10 év követés alatt?
3 vagy több független csoport
összehasonlítása
egy szempontos ANOVA Kruskal-Wallis teszt
ANOVA//One-way ANOVA//All effects
Nonparametrics//Compairing multiple independent samples (groups)
Van-e különbség a különböző Dukes stadiumú betegek hemoglobin szintjében?
3 vagy több kapcsolt csoport
összehasonlítása
ismételt méréses ANOVA Friedman próba
ANOVA//Repeated measures ANOVA
Nonparametrics//Compairing multiple dependent samples (groups)
Az ismételt mérések során változik-e a betegek BMI-je?
Összefoglalás
Köszönöm a figyelmet!