repetita iuvant
DESCRIPTION
Repetita iuvant. La relazione simmetrica (lineare) tra due variabili quantitative. GRAFICAMENTE. Scatter plot (diagramma di dispersione). > 0. < 0. > 0. < 0. Concordanza: prevalenza di ‘+’ Discordanza: prevalenza di ‘-’. Concordanza. Discordanza. Se X e Y fossero indipendenti…. - PowerPoint PPT PresentationTRANSCRIPT
14 giugno 2008 1 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Repetita iuvant
Relazione simmetrica tra variabili (X ←→ Y)
Variabili qualitative
Associazione
1. Rischio Relativo [a / (a+b)] / [c / (c+d)]
2. Odds Ratio ad/bc
3. γ di Goodman-Kruskal (C-D)/(C+D) (var. ordinali)
Indipendenza
Test X2 O vs E p-value (prob. sbagliare rifiutando H0, vera)
YTotale
X Y1 Y2
X1 a b a+b
X2 c d c+d
Totale a+c b+d n
14 giugno 2008 2 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
La relazione simmetrica (lineare) tra due variabili quantitative
Scatter plot(diagramma di dispersione)
GRAFICAMENTE
14 giugno 2008 3 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
ii
ii
xx x x
n
yy y y
n
> 0
< 0
> 0
< 0
14 giugno 2008 4 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
0
0i
i
x x
y y
0
0i
i
x x
y y
0
0i
i
x x
y y
0
0i
i
x x
y y
Concordanza: prevalenza di ‘+’
Discordanza: prevalenza di ‘-’
14 giugno 2008 5 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Concordanza
Discordanza
14 giugno 2008 6 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Se X e Y fossero indipendenti…
Se X e Y non fossero in legame lineare
14 giugno 2008 7 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
ANALITICAMENTE
Covarianza: consente di verificare se fra due variabili statistiche X e Y esiste un legame lineare e, in caso affermativo, se vi è concordanza oppure discordanza
N.b. Cov(X, X) = Var(X)
=
2 2 2
1 1
1 1( )
n n
i ii i
Var X x x x xn n
Concordanza → prevalenza di ‘+’ → Cov(X,Y) = σXY >0
Discordanza → prevalenza di ‘-’ → Cov(X,Y) = σXY <0
Se X e Y sono indipendenti → Cov(X, Y) = σXY = 0
Se X e Y in legame non lineare → Cov(X, Y) = σXY = 0
14 giugno 2008 8 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Per distribuzioni congiunte / tabelle di contingenza
=
Altre proprietà:• dipende dall’unità di misura!• - σX σY ≤ σXY ≤ σX σY
14 giugno 2008 9 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Coefficiente di correlazione lineare di Bravais-Pearson:
indice dell’intensità del legame lineare
( , ) XY
X Y
Corr X Y
Proprietà:1. -1 ≤ ρ ≤ 1
2. è un numero puro
3. Y=a±bX ←→ ρ= ± 1
4. Se X e Y sono indipendenti → ρ = 0
14 giugno 2008 10 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
14 giugno 2008 11 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
rXY = 0
14 giugno 2008 12 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Esempio
Correlazione tra ‘lunghezza media espressioni vocali (MLU)’ e ‘numero di espressioni formate da un’unica parola (OWL)’
21 bambini con sindrome di Down di età compresa tra 2 e 12 anni
(Rondal J.A. et al., 1988)
MLU
0,99
1,12
1,18
1,21
1,22
1,39
1,45
1,53
1,74
1,76
1,77
1,90
2,10
2,15
2,36
2,63
2,71
3,02
3,05
3,06
3,46
OWL
99 88 84 81 59 51 49 70 52 50 50 51 43 38 51 33 24 21 25 33 16
14 giugno 2008 13 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Diagramma di dispersione:
14 giugno 2008 14 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Diagramma di dispersione:
14 giugno 2008 15 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Correlazione
XYXY
X Y
2
1
n
ii
y y
1
n
i ii
x x y y
n
2
1
n
ii
x x
n
2
1
n
ii
y y
n
2
1
n
ii
x x
1
n
i ii
x x y y
Codevianza
Devianza
14 giugno 2008 16 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
2 22 2
i i i i
XY
i i i i
n x y x y
n x x n y y
X Y XY X^2 Y^20,99 99 98,01 0,9801 98011,12 88 98,56 1,2544 77441,18 84 99,12 1,3924 70561,21 81 98,01 1,4641 65611,22 59 71,98 1,4884 34811,39 51 70,89 1,9321 26011,45 49 71,05 2,1025 24011,53 70 107,1 2,3409 49001,74 52 90,48 3,0276 27041,76 50 88 3,0976 25001,77 50 88,5 3,1329 2500
1,9 51 96,9 3,61 26012,1 43 90,3 4,41 1849
2,15 38 81,7 4,6225 14442,36 51 120,36 5,5696 26012,63 33 86,79 6,9169 10892,71 24 65,04 7,3441 5763,02 21 63,42 9,1204 4413,05 25 76,25 9,3025 6253,06 33 100,98 9,3636 10893,46 16 55,36 11,9716 256
somme 41,8 1068 1818,8 94,4442 64820somme^2 1747,24 1140624
ρXY = - 0,8934
X = MLU
Y = OWL
n = 21
14 giugno 2008 17 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Correlazione a blocchi
Osservazione su un gruppo di unità statistiche che può essere suddiviso in due sottogruppi
Es. insieme di pazienti affetti da un disturbo, distinguibili per genere.
Attenzione! Correlazione di gruppo
≠
corr. dei sottogruppi
Es. X=età Y=altezza
ρXY = 0,189
ρXY | M = -0,108 ρXY | F = -0,10
14 giugno 2008 18 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
rXY = 0,03
14 giugno 2008 19 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Correlazione spuria
X ←→ Y
X ←→ Z ←→Y
Es.: # mensile di turisti canadesi a Roma e vendita di gelati
X Y
Z periodo caldo dell’anno
(stagione)
Ambito sanitario: relazione complessa tra organi…
14 giugno 2008 20 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Correlazione parziale
Coefficiente di correlazione parziale tra X e Y “tenendo costante” Z: rXY|Z
Misuriamo il grado di interdipendenza (lineare) tra X e Y ‘rimuovendo’ (artificialmente)l’influenza della variabile Z
14 giugno 2008 21 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Y
X Y1 Y2
X1 a b
X2 c d
X Y Osserv.
X1 Y1 a
X1 Y2 b
X2 Y1 c
X2 Y2 d
CampioneTotale
Fattore Cancro Non cancro
Fumatore 90 20 110
Non fumatore 10 80 90
Totale 100 100 200
Fumatore Malato Osserv.
Sì Sì 90
Sì No 20
No Sì 10
No No 80
14 giugno 2008 22 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
Mini Mental State Evaluation (MMSE, Folstein et al. 1975)
Test per la valutazione dei disturbi dell’efficienza intellettiva e della presenza di deterioramento intellettivo.
E’ costituito da 19 item che fanno riferimento a 7 aree cognitive differenti: orientamento nel tempo, nello spazio, registrazione di parole, attenzione e calcolo, rievocazione, linguaggio e prassia costruttiva.
E’ somministrato a soggetti di età superiore ai 64 anni. Il punteggio totale è compreso tra 0 e 30.
14 giugno 2008 23 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
In quale struttura ci troviamo? (0-1)
14 giugno 2008 24 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
O - 79
14 giugno 2008 25 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
≤ 18 è indice di una grave compromissione delle abilità cognitive; tra 18 e 23 è indice di una compromissione da moderata a lieve;23-26 è considerato borderline
14 giugno 2008 26 / 20
Master in Neuropsicologia Clinica Elementi di Statistica I
1. Descrittive su: numero auto, tumore, scolarizzazione
2. Grafico su nazionalità
3. Calcolare il punteggio al test
4. Quale è più variabile: tumore o nazionalità?numero di figli o numero di vani?
4. Box-plot numero di figli | genere
5. RR e OR tumore x esito test (in classi: <25 e >24)
6. γ tra figli e auto
7. Indipendenza tra tumore e esito al test (verificare)
8. Correlazione tra Numero di figli e Numero di vani
9. Verificare che la corr. Del punto 8 = a corr. #vani e #figli