teste parametrice
TRANSCRIPT
TESTE PARAMETRICE
SORANA D. BOLBOACĂ
12/1
1/2
020
1
TESTE PARAMETRICE VS, NON-PARAMETRICE
Parametric Neparametric
Distribuţia Normală oricare
Varianţa Omogene oricare
Scala de măsură Raţie / Interval oricare
Valoarea centrală Media mediana
Dispersia Deviaţia standard (Q1 to Q3)
Parametric Neparametric
2 grupuri independente
Testul Z
Independent t-test
Mann-Whitney
2 grupuri dependente Paired t-test Wilcoxon test
> 2 grupuri ANOVA Kruskal-Wallis test
Corelaţia Pearson Spearman, Kendall, etc,
… … …
Testele parametriceo Se aplică în cazul variabilelor cantitative sau calitative ordinale cu clase multipleo Datele urmează distribuția normalăo Se pot aplica pentru a compara două sau mai multe grupuri, dependente sau independente
TESTE PARAMETRICE - MEDII
Teste Z pentru medii
2 populații: test student pentru eșantioane independente sau dependente
Mai mult de 2 populații: testul ANOVA
12/11/2020 3
12/11/2020 4
MEDIA: 2 GRUPURI
Testul Z Testul Student (t)
Grupuri independente Grupuri independente
Talia fiecărui grup în parte ≥ 30 Talia fiecărui grup în parte < 30
Deviațiile standard cunoscute
12/11/2020 5
𝑍 =( ത𝑋1− ത𝑋2) − (𝜇1 − 𝜇2)
𝜎12
𝑛1+𝜎22
𝑛2
Varianţe egale
Varianţe inegale
TESTUL Z
HYPOTHESIS TESTING: PHANTOMS
Abb Ex: Efectul Nebivolului și al Atenololului asupra ritmului cardiac2 populații, unul tratat cu Nebivolol (n=39) și cel de-al doilea cu Atenolol (n=38)
P Media reducerii ritmului cardiac
H H0: Reducerea medie a ritmului cardiac la pacienții tratați cu Nebivolol nu diferă semnificativ față de cea a pacienților tratați cu AtenololH1 (test bilateral): Reducerea medie a ritmului cardiac la pacienții tratați cu Nebivolol diferă semnificativ față de cea a pacienților tratați cu Atenolol
A • Grupurile sunt independente (pacienți tratați cu Nebivolol față de cei tratați cu Atenolol)
• Randomizare: grupurile sunt alcătuite aleator și asignarea tratamentului este de asemenea aleatorie
• Ritmul cardiac pentru fiecare grup în parte (cei cu Nebivolol, respectiv cei cu Atenolol) urmează distribuția normală
Abb Ex: Efectul Nebivolului și a Atenololului asupra ritmului cardiac2 populații, unul tratat cu Nebivolol (n=39) și cel de-al doilea cu Atenolol (n=38)
N Test pentru grupuri independente:• Varianțe egale? Student t-test for equal variances• Varianțe inegale? Student t-test for unequal variances
T Nebivolol (n=39): 14,51±4,69Atenolol (n=38): 17,55±5,06Z = (14,51-17,55)/sqrt(4,69^2/39+5,06^2/38)) = -2,73
O Valoarea P = 0,0032 (=NORSDIST(Z))
M (-∞;-Zα)⋃(Zα;+∞) unde Zα=0.05 = 1,96 - 𝑍 ∈ −∞;−1,96 ⋃ 1,96;+∞ - avem suficiente dovezi să respingem H0
Deoarece valorea p < 0,05 → avem suficiente dovezi să respingem H0
Există diferențe semnificative statistic în reducerea ritmului cardiac la pacienții tratați cu Nebivolol comparativ cu cei tratați cu Atenolol
S Reducerea medie a ritmului cardiac este mai mare la pacienții tratați cu Atenolol comparativ cu cei tratați cu Nebivolol→ vom opta pentru administrarea Atenololului dacă dorim o reducere mai mare a ritmului cardiac
PANIC VS. PHANTOMS
o Nebivolol (n=39): 14,51±4,69
o Atenolol (n=38): 17,55±5,06
Este Nebivololul la fel de eficient ca și Atenololul în reducerea ritmului cardiac?
o PANIC: (14,51-17,55) ± t(n1+n2-2),α*sqrt(((39-1)*4,69^2+(38-1)*5,06^2)/(39+38-2)) = -3,04 ± 1,99*0,56 = -3,04 ±1,11 = (-4,15 la -1,93)
o Valoare zero nu este în intervalul de încredere al diferenței medii deci reducerea medie a ritmului cardiac la pacienții tratați cu Nebivolol este semnificativ diferită comparativ cu media reducerii la pacienții cu Atenolol
o PHANTOMS: P=0,0032 – avem suficiente dovezi să respingem H0
ത𝑋1 − ത𝑋2 ± 𝑡𝑛1+𝑛2−2;0,05𝑛1−1 𝑠1
2+ 𝑛2−1 𝑠22
𝑛1+𝑛2−2
TESTUL STUDENT PENTRU EȘANTIOANE INDEPENDENTE
TESTUL STUDENT PENTRU EȘANTIOANE INDEPENDENTE
o Scop: să determinăm dacă diferenţa dintre mediile eşantioanelor studiate indică o diferenţă reală între cele două populaţii sau dacă diferenţa obţinută este datorată erorii de eşantionare,o De reţinut! Dacă două eşantioane se extrag din aceeaşi populaţie şi la fiecare
eşantion se administrează acelaşi tratament, pot exista diferenţe între mediile celor două eşantioane
Formularea generică a ipotezelor statistice:o H0: Nu există diferenţe semnificative statistic între mediile celor două populaţii
o H1 (test bilateral): Există diferenţe semnificative statistic între mediile celor
două populaţii
6-Dec-167 12
6-Dec-167 13
Testarea egalităţii varianţelor se face cu testul LEVENE sau BARTLETT (teste bazate pe statistica F)
Dacă varianţele nu sunt semnificativ statistic diferite (p>0,05) atunci pot fi considerate egale ➔ test student pentru eşantioane independente varianţe egale
Sunt varianțele
egale?
t-test assuming unequal variances
t-test assuming equal variances
HYPOTHESIS TESTING: PHANTOMS
Abb Ex: Acidul uric la femei şi bărbaţi cu diabet zaharat
P Media acidului uric
H H0: media acidului uric a subiecţilor de gen feminin nu diferă semnificativ de medie acidului uric a subiecţilor de gen masculin (μM= μF)H1 (test bilateral): media acidului uric a subiecţilor de gen feminin diferă semnificativ de medie acidului uric a subiecţilor de gen masculin (μM≠ μF)
A • Femeile și bărbații nu provin din aceleași familii• Randomizare: subiecții sunt incluși aleatoriu• Acidul uric la subiecții de gen feminin și cei masculini cu diabet urmează distribuția
normală
N Testul student pentru varianțe egale - Student t-test for equal variances
M F
Media 5 4
Variaţia 2 2
n 16 16
Abb Ex: Acidul uric la femei şi bărbaţi cu diabet zaharat
T M (n=16): 5±4F (n=16): 4±4sqrt(15*4+15*4)/(16+16-2) = 2t = (5-4)/(2*sqrt(1/16+1/16)) = 1,41
O Valoarea P = 0,1676 (=TDIST(t, df, 2))
M (-∞;-tdf,α)⋃(tdf,α;+∞) unde tdf,α = 2,04 - 𝑡 ∈ −∞;−2,04 ⋃ 2,04;+∞ - nu avem suficiente dovezi să respingem H0
Deoarece valorea p > 0,05 → nu avem suficiente dovezi să respingem H0
S Media acidului uric nu diferă semnificativ statistic la pacienţii diabetici de gen feminin comparativ cu cei de gen masculin
M F
Media 5 4
Variaţia 2 2
n 16 16
TESTUL STUDENT PENTRU EȘANTIOANE DEPENDENTE
PHANTOMS: EȘANTIOANE PERECHI/DEPENDENTE
Abb Ex: Efectul Nebivolului asupra ritmului cardiac (n=39)
P μdif
Media reducerii ritmului cardiac (2 evaluări perechi, înainte și după tratamentul cu Nebivolol)
H H0: Nu există o scădere semnificativă statistic a ritmului cardiac după administrarea Nebiololului (μdif = 0)H1 (test unilateral): Ritmul cardiac se reduce semnificativ după tratamentul cu Nebivolol(μdif < 0)
A • Independența: observațiile sunt dependente• Randomizare: includerea subiecților în eșantion este prin randomizare• Ritmul cardiac înainte și după tratamentul cu Nebivolol urmează distribuția normală
N Testul student pentru eșantioane perechi
PHANTOMS: EȘANTIOANE PERECHI/DEPENDENTE
Abb Ex: Efectul Nebivolului asupra ritmului cardiac (n=39)
T Înainte de tratament: 78,05±5,84După tratament: 63,53±3,86Diferența: 14,51±4,69t = avem nevoie de datele brute pentru a obține acest parametru (estimat: 14,51/(4,69/sqrt(38)) = 19,07
O P-value = 9,86E-21 (0,000000000000000000009860)
M o tcritic (df, α) = 2,03→ t (19,07) > tcritic (2,03) → avem suficientedovezi să respingem ipoteza nulă
o p < 0,05 → avem suficiente dovezi să respingem H0
o → diferența între frecvența cardiacă înainte și după tratament cu Nebivolol este semnificativ diferită de zero
S Tratamentul cu Nebivolol este eficient în reducerea frecvenței cardiace
TESTUL ANOVA
12/11/2020 20
Abb Ex:
P Diferențe între mediile variabilei de tip răspuns
H H0: μA = μB = ...= μx
H1: μA ≠ μB ≠ ... ≠ μx
A • Factorul (variabila independentă) este o variabilă calitativă cu cel puțin 3 valori distincte• Variabila de tip răspuns este cantitativă (scala interval sau rație/raport) iar datele în
populațiile de unde s-au extras eșantioanele fiecărui grup urmează o distribuție aproximativ normală
• Independența observațiilor: nu există nici o relație între observațiile unui grup sau între observațiile grupurilor diferite (același subiect într-un singur grup)
• În fiecare subgrup nu există valori extreme (date individuale care nu urmează pattern-ulcelorlalte date)
• Varianțele sunt omogene: Test Levene
N One way ANOVA test
T Testul ANOVA utilizează testul F de semnificație statistică
O Valoarea p este calculată de programul statistic utilizat
M o Nivelul de semnificație trebuie ajustat. Ajustarea Bonfferoni se face în conformitate cu numărul de grupuri evaluate: dacă variabile independentă are 3 grupuri α* = α/3 (0,05/3 = 0,017)
ANOVA
ANOVA: EXEMPLU
o Este masa grasă asociată cu deficitul devitamină D la copii care practică atletism?
o Masa grasă (kg, variabila dependentă sau detip răspuns) și nivelul seric de vitamină D(variabila independentă) la copii carepractică atletism
o Variabila de grupare (factorul) = clasa înconformitate cu nivelul seric al vit D: deficit(<30 nmol/L, 5 copii), insuficient (30–50nmol/L, 30 copii), adecvat (50 nmol/L, 12copii)
12/11/2020 21
PHANTOMS: ANOVA
12/11/2020 22
Abb Ex: Masa grasă (kg) și nivelul seric de vitamină D (variabila independentă) la copii care practică atletism
P Diferențe între mediile masei grase (kg)
H H0: μdeficit = μinadecvat = μadecvat
H1: μdeficit ≠ μinadecvat≠ μadecvat
A • Clasa vit. D: deficit, inadecvat, adecvat• Masa grasă (rație/raport) • Masa grasă în populație urmează distribuția normală• Independența observațiilor: un copil este într-o singură clasă• Varianțele sunt omogene (test Levene p > 0,05)
N One way ANOVA test
T F = 4,62
O P=0,0151
M o F (4,62) > Fcritic (3,20) → avem suficiente evidenție să respingem H0
o P < 0,017 → avem suficiente evidențe să respingem H0 - avem diferențe semnificative a masei de grăsime între grupurile de copii realizate în conformitate cu valoarea serică a Vit. D
S o Există o asociere între masă grasă și nivelul seric al vitaminei D la copii care practică atletism
ANOVA
Putem spune între care perechi de grupuri avem diferențe semnificative?
PHANTOMS: ANOVA PENTRU MĂSURĂTORI REPETATE
Abb Ex: Efectul Nebivololului asupra presiunii arteriale sistolice (cinci evaluări)
P Diferența mediilor în evaluări multiple (5 evaluări)
H H0: Mediile PAS nu sunt semnificativ diferite la evaluările repetate. H0: μ0(baseline) = μ1(2 weeks) = μ2(4 weeks) = μ3(8 weeks) = μ4(12 weeks)
H1 (test bilateral): O diferență semnificativă există undeva printre evaluările PAS atuncicând pacienții sunt tratați cu NebivololH1:μ0 ≠ μ1 ≠ μ2 ≠ μ3 ≠ μ4
A • Dependența: aceeași pacienți sunt evaluați în momente diferite de timp• Randomizare: subiecții sunt incluși aleator în eșantion• PAS la includerea în studiu, la 2, 4, 8 și 12 luni după inițierea tratamentului cu Nebivolol
urmează distribuția normală• Varianțele sunt omogene
N Testul Anova pentru măsurători repetate
T Avem nevoie de datele brute pentru aceste calcule ...
O P < 0,0001
M P < 0,0001 (0,05/5 = 0,01)→ avem suficiente evidențe să respingem H0
S Există diferențe semnificative în tensiunea arterială sistolică printre evaluări dupătratamentul cu Nebivolol (nu putem spune însă care perechi de evaluări au avut diferențesemnificative – pentru aceasta trebuie să aplicăm analiza post-hoc)
TESTAREA IPOTEZELORVS. INTERVALUL DE ÎNCREDERE
PHANTOMS VS. PANIC
12/11/2020 27
Ce? Valoarea P Intervalul de încredere
Decizia Binar: respingem sau nu respingem H0
Nivel de semnificație (α=0,05) stabilit a
priori
Un interval de valori care include
parametrul adevărat al populației cu o
probabilitate definită în prealabil
Nivel de încredere stabilit a priori (ex. 95%)
Semnificația Statistică Statistică
Relevanța clinică
Efectul Nu se aplică Direcția și puterea efectului
Depinde de Magnitudinea asocierii factor-rezultat și
precizia estimării (talia eșantionului)
Erori și factori de confuzie
Precizia statistică (talia eșantionului și
marginile de eroare)
PHANTOMS VS. PANIC
12/11/2020 28
Ce? Valoarea P Intervalul de încredereSemnificativstatistic
Valoarea P < nivelul de semnificație (α) Intervalul de încredere nu conține valoareaipotezei nule
Utilizat atunci când este de interes o comparație strictă a unei ipoteze la un nivel de semnificație predefinit
pentru a descrie magnitudinea efectuluisaucând dorim să descriem un singur grup
Semnificația statistică arată probabilitatea ca rezultatul unui studiu să fie datorat întâmplării →
diferența observată în eșantion există și în populație.
Relevanța clinică se referă la magnitudinea clinică a efectului și reflectarea acesteia în practica
medicală curentă.
SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA CLINICĂ
12/11/2020 29
SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA CLINICĂ
12/11/2020 30
• Mărimea efectului ? <7,5 ore/săpt → 0,15 kg în plus față de grupul cu ≥21 • Extrapolare: dacă studiul se continuă 13 ani grupul cu ≥21 va acumula în greutate cu
0,635 kg mai puțin comparativ cu grupul cu < 7,5!
Studiu de cohortă n=34,079 femei → greutatea câștigată de grupul care a efectuat exercițiu fizic >21 ore/săptămână față de grupul cu <7,5 ore de exercițiu fizic/săptămână (p<0,001)
SEMNIFICAȚIA STATISTICĂ VS. RELEVANȚA CLINICĂ
Rezultatele unui studiu pot fi:
o Nesemnificative statistic și fără relevanță clinică
o Semnificative statistic dar fără relevanță – aceasta poate să apară când talia eșantionului este mare și o diferență mică este semnificativă statistic. Un tratament semnificativ statistic comparativ cu un tratament alternativ nu înseamnă neapărat că diferențele observate sunt importante din punct de vedere clinic sau că sunt relevante pentru pacient.
o Semnificative statistic și relevante clinic
o Nesemnificative statistic dar relevante clinic – apare atunci când puterea studiului este mică și diferențe mici între grupuri nu sunt clasificate ca semnificative statistic.
12/11/2020 31
ALEGEREA TESTULUI STATISTIC
12/11/2020 33
23-Oct-2015 34
o Compararea mediilor se face doar în cazul variabilelor de tip rezultat cantitative sau calitative ordinale cu clase multiple ce urmează o distribuție aproximativ normală.
o Testul Z sau t se utilizează pentru a compara două grupuri.
o Dacă grupurile sunt independente, înaintea comparării mediilor trebuie să testăm varianțele.
o Nu testăm varianțele dacă eșantioanele sunt dependente.
o Utilizăm testul ANOVA pentru a compara mai mult de două eșantioane, fiecare cu date normal distribuite.
12/11/2020 35