1_lezione_concetti statistici di base_2°anno 2010-2011
TRANSCRIPT
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
1/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
2/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
3/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
4/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
5/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
6/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
7/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
8/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
9/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
10/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
11/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
12/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
13/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
14/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
15/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
16/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
17/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
18/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
19/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
20/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
21/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
22/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
23/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
24/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
25/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
26/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
27/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
28/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
29/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
30/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
31/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
32/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
33/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
34/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
35/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
36/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
37/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
38/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
39/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
40/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
41/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
42/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
43/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
44/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
45/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
46/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
47/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
48/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
49/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
50/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
51/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
52/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
53/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
54/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
55/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
56/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
57/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
58/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
59/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
60/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
61/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
62/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
63/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
64/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
65/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
66/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
67/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
68/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
69/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
70/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
71/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
72/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
73/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
74/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
75/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
76/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
77/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
78/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
79/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
80/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
81/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
82/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
83/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
84/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
85/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
86/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
87/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
88/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
89/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
90/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
91/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
92/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
93/146
LA MODA
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
94/146
LA MODA
La moda lindice di tendenza centrale che minimizza lperdite di informazioni.In alcune distribuzioni pu accedere che siano presentiuna o pi mode allaumentare del numero diosservazioni:distribuzioni unimodale, bimodale, plurimodale
Lamoda
un indice di tendenza centrale che individua ilgruppo o il dato che compare con maggior frequenza
Per caratteriqualitativi:
Per caratteriquantitativi:
la moda la modalit che sipresenta con maggior frequenza
la moda il valore che sipresenta con maggior frequenza
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
95/146
Dove:
Nel caso di distribuzioni in classi di diversa ampiezzala classe modale quella con la pi altadensit difrequenza (la frequenza assoluta in rapporto allampiezza della class
Per le distribuzioni in classi di uguale ampiezza, sicalcola la classe modale come segue:
successivalaemodaleclassedellafrequenzalatradifferenza
precedentelaemodaleclassedellafrequenzalatradifferenza
modaleclassedellaampiezzac
modaleclassedellainferioreconfine
moda
2
1
21
1
1
1
====
++=
L
c L
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
96/146
Cause di morte Frequenze assoluteTumori 315Malattie sistema circolatorio 418Malattie sistema respiratorio 82
Malattie sistema digerente 49Non definite 19Accidentali 57
La moda Malattie sistema circolatorio
1 Esempio di calcolo della moda (carattere qualitativo)
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
97/146
Tab. 5 - Distribuzione dei mesi secondo le ore di straordinario effettuateda un infermiere di un ospedale
Ore di lavoro straordinario Frequenzaassoluta
Frequenzarelativa
0 1 0,0835 2 0,1677 3 0,250
10 3 0,25011 1 0,083
12 2 0,167Totale 12 1
La prima moda 7, la seconda moda 10
2 Esempio di calcolo della moda (carattere quantitativo)
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
98/146
Classi peso Frequenza assoluta Valore centrale[69,5 72,5) 3 71[72,5 75,5) 4 74[75,5 78,5) 22 77[78,5 81,5) 53 80[81,5 84,5) 92 83[84,5 87,5) 71 86[87,5 90,5) 46 89[90,5 93,5) 15 92
[93,5 96,5) 4 95Totale 310
)[
( ) ( )[ ] 4,833719253925392
5,81
84,5-81,5
21
1
1 =+
+=
+ c L moda-
modaleclasse-
=
=
3 Esempio di calcolo della classe modale e della moda in unadistribuzione in classi (classi della stessa ampiezza)
4 Esempio di calcolo della classe modale in una distribuzione in
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
99/146
Numero posti letto Frequenzaassoluta
Ampiezza dellaclasse
Densit difrequenza
26-50 251 25 10,0451-100 368 50 7,36101-150 288 50 5,76151-200 159 50 3,18201-300 304 100 3,04301-500 173 200 0,87501-800 99 300 0,33
La classe modale apparente 51-100
La classe modale corretta 26-50
Tab. 6
- Strutture di degenza classificate in base al numero di posti letto
30099
33,0 =
4 Esempio di calcolo della classe modale in una distribuzione inclassi (classi con ampiezze diverse)
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
100/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
101/146
LA MEDIANA
La mediana per definizione occupa il valore centralein una serie ordinata di dati.
Le osservazioni vengono separate dal valoremediano in due parti numericamente uguali, il 50%con valori inferiori e il 50% con valori superiori.
La mediana non risente dei valori estremi di unaserie ordinata ed preferita in tali casi alla mediaaritmetica.
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
102/146
Il procedimento di calcolo della mediana
passa per 3 fasi:
1. ordinamento dei dati in modo crescente2. calcolo della posizione della mediana
3. identificazione del valore corrispondente a taleposizione
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
103/146
Per ilcalcolo della posizione mediana bisogna tener conto della numerosit delle osservazioni n
Se n dispari si avruna sola posizione mediana
Se n pari si avrannodue posizioni mediane
+
+
12
2
21
n
n
n
Lamediana data dal valore/modalit/classe corrispondealla posizione mediana (o alle posizioni mediane).
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
104/146
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
105/146
Paziente Et Sesso Titolo di studio 1 54 M Nessun titolo 2 57 F Laurea 3 62 F Laurea 4 46 F Nessun titolo 5 39 F Diploma 6 54 M Licenza elementare 7 57 F Licenza elementare 8 60 M Nessun titolo
9 51 F Licenza media
1 Esempio di calcolo della mediana (carattere qualitativo)
dispari)numero(9n =
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
106/146
Posizione Titolo di studio
1 Nessun titolo2Nessun titolo3Nessun titolo4 Licenza elementare5 Licenza elementare6 Licenza media7 Diploma8 Laurea9 Laurea
Paziente Titolo di studio
1 Nessun titolo2 Laurea3 Laurea4 Nessun titolo5 Diploma6 Licenza elementare7 Licenza elementare8 Nessun titolo9 Licenza media
"ELEMENTARELICENZA" medianaLa 52
192
1
dispari)numero(9n
=+=+
=
n
I N ORDI NE
C RE
S C E NT E
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
107/146
Paziente Et Sesso Livello Creatininemia
1 54 M Basso 2 57 F Basso 3 62 F Alto 4 46 F Medio
5 39 F Medio 6 54 M Basso 7 57 F Medio 8 60 M Medio 9 51 F Alto
10 54 F Alto
2 Esempio di calcolo della mediana (carattere qualitativo)
pari)numero(10n =
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
108/146
Posizione Livello Creatininemia
1 Basso
2 Basso3 Basso4Medio5Medio6Medio7Medio8 Alto9 Alto
10 Alto
Paziente Livello Creatininemia
1 Basso2 Basso3 Alto4 Medio5 Medio6 Basso
7 Medio8 Medio9 Alto
10 Alto
Medio"" MedianaLa
Medio""entecorrispondmodalitla 612
101
2
Medio""entecorrispondmodalitla 52
102
pari)(numero10n
=+=+
==
=
n
n
I N ORDI NE
C RE
S C E NT E
d l l d ll d ( l )
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
109/146
Paziente Et Sesso Umore
1 54 M Buono 2 57 F Buono 3 62 F Ottimo 4 46 F Ottimo
5 39 F Normale 6 54 M Basso 7 57 F Discreto 8 60 M Buono 9 51 F Discreto
10 54 F Basso
3 Esempio di calcolo della mediana (carattere qualitativo)
pari)numero(10n =
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
110/146
Posizione Umore
1 Basso
2 Basso3 Normale4 Discreto5 Discreto6 Buono7 Buono8 Buono9 Ottimo
10 Ottimo
Paziente Umore
1 Buono
2 Buono3 Ottimo4 Ottimo5 Normale6 Basso7 Discreto8 Buono9 Discreto
10 Basso
Buono""eDiscreto""sonomedianemodalitLe
Buono""entecorrispondmodalitla 612
101
2
Discreto""entecorrispondmodalitla 52
102
pari)(numero10n
=+=+
==
=
n
n
4 E i di l l d ll di ( li i ) i
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
111/146
Titolo di studio Frequenza assoluta
Nessun titolo 1.862
Licenza elementare 9.903
Licenza media 4.491
Diploma 3.093
Laurea 1.160
Totale 20.509
4 Esempio di calcolo della mediana (carattere qualitativo) in unadistribuzione di frequenza
Tit l di t di F Frequenza assoluta
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
112/146
Titolo di studio Frequenzaassoluta
Frequenza assolutacumulata
Nessun titolo 1.862 1.862
Licenza elementare 9.903 11.765
Licenza media 4.491 16.256
Diploma 3.093 19.349
Laurea 1.160 20.509
Totale 20.509
1.862 + 9.903
1.862 + 9.903 + 4.491
1.862
"ELEMENTARELICENZA" medianaLa 255.102
1509.202
1
dispari)numero(509.20n
=+=+
=
n
La modalit licenza elementare la mediana.La mediana della distribuzione la modalit relativa al dato statistico che
nellordinamento stabilito occupa il posto di mezzo.
LA MEDIANA PER CARATTERI QUANTITATIVI:
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
113/146
LA MEDIANA PER CARATTERI QUANTITATIVI:
1. Nel caso di unaserie di misure singole e ordinate(o caratteri continui)per n dispari la medianacorrisponde al valore in posizione
per n pari la medianasi colloca tra le due posizioni centrali e(si parla di modalit mediane)
il valore mediano viene calcolato come mediaaritmetica dei valori corrispondenti a queste dueposizioni
21+n
2n
12
+n
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
114/146
2. Per ledistribuzioni in classi si identifica la classemediana; nel caso di classi di uguali ampiezzasi calcola il valore mediano tra quelli compresinellintervallo di classe utilizzando la formula:
medianaclassedellafrequenza
medianaclassela precedonocheclassidellecumulatafrequenza
medianaclassedellaampiezzac
medianaclassedellainferioreconfine
2 mediana
1
1
====
+=
med
cum
med
cum
f
f
L
c f
f n L
5 E i di l l d ll di ( tt tit ti )
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
115/146
Paziente Sesso Et PA diastolica(mmHg) PA sistolica(mmHg)
1 M 63 70 110
2 F 56 90 95
3 F 48 80 130
4 F 48 85 85
5 M 50 70 95
6 F 54 70 85
7 M 58 65 100
8 M 67 90 130
9 F 61 90 85
5 Esempio di calcolo della mediana (carattere quantitativo)
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
116/146
Posizione PA sistolica(mmHg)
1 85
2 85
3 85
4 95
5 956 100
7 110
8 130
9 130
52
192
1 =+
=+n
95 la modalit mediana
50%
50%
I N ORDI NE
C RE
S C E NT E
6 Esempio di calcolo della mediana nel caso di
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
117/146
Classi peso Valore centrale Frequenzaassoluta Frequenzacumulata[69,5 72,5) 71 3 3[72,5 75,5) 74 4 7[75,5 78,5) 77 22 29
[78,5 81,5) 80 53 82[81,5 84,5) 83 92 174[84,5 87,5) 86 71 245[87,5 90,5) 89 46 291[90,5 93,5) 92 15 306[93,5 96,5) 95 4 310
Totale 310
9,83392
821555,812 mediana 1 =
+=
+= c f
f n
Lmed
cum
6 Esempio di calcolo della mediana nel caso diuna distribuzione in classi
Esercizio 1 (e.)Corso di Statistica 3
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
118/146
Foglie 1 2 3 4 5 6 7 8 9 10
Lunghez. in cm 1 2 2 3 4 1 2 1 3 2
Moda = 2
Mediana: dopo aver ordinato in senso crescente le unit
calcoliamo le due posizioni mediane n/2 = 5 (n/2)+1 = 6,al posto 5 e 6 corrispondono i valori 2 e 2,Trattandosi di un carattere qualitativo si fa la media aritmeticadei due valori mediani: Me= 2
Foglie 1 2 3 4 5 6 7 8 9 10Lunghez. in cm 1 1 1 2 2 2 2 3 3 4
(e)
Nella seguente tabella sono riportate le lunghezze di 10 foglie di menta,registrate al centimetro piu prossimo. Si definisca la variabile X di interesse,
(a). si dica se equantitativa o qualitativa, discreta o continua.(b). dopo aver definito opportunamente le classi di modalita, calcolare(c) le frequenze assolute e le frequenze relative;(d) la media aritmetica di X;(e) la moda, la mediana.
I QUANTILI
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
119/146
I QUANTILI
I quantili sono unestensione della mediana. Iquantili suddividono la distribuzione in q distribuzioni parziali,aventi ognuno la q-esima parte della numerosit totale.
I pi utilizzati sono sono i :
Percentili/Centili con q = 100Decili con q = 10Quartili con q = 4
Ilquartile divide la distribuzione in quattro parti, aventiognuna il 25% della numerosit
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
120/146
I Quartile ripartisce la distribuzione in due distribuzioni, laprima costituita dal 25% della distribuzione complessiva,laltra dal 75%2 Quartile coincide con la Mediana
3 Quartile ripartisce la distribuzione in due distribuzioni, laprima costituita dal 75% della distribuzione complessiva,laltra dal 25%
Il procedimento di calcolo simile al calcolo della mediana:
Quartili Decili Percentili
( )14
+= N i
Qi ( )110
+= N i Di ( )110+= N
i P i
RELAZIONI TRA INDICI DI TENDENZA
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
121/146
Le possibili relazioni tra i valori medi di una distribuzione dipendondalla sua forma e nel caso di una distribuzione unimodale sipresentano tre casi:
1_curva simmetrica
media = moda = mediana
2_curva obliqua a destra, con asimmetria positiva (a destra)
moda < mediana < media 3_In una curva obliqua a sinistra, con asimmetria negativa (a
sinistra)
media < mediana < moda
RELAZIONI TRA INDICI DI TENDENZACENTRALE
RELAZIONI TRA INDICI DI TENDENZA CENTRA
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
122/146
RELAZIONI TRA INDICI DI TENDENZA CENTRA
INDICI DI TENDENZA CENTRALE E LORO
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
123/146
UTILIZZAZIONEIN RELAZIONE ALLA SCALA DI MISURA DEI DATI
INDICI DI TENDENZACENTRALE UTILIZZABILI
Qualitativi sconnessi moda
Qualitativi ordinati indici di posizioneQuantitativi medie analitiche, indici di posizione
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
124/146
I Facolt di Medicina e ChirurgiaCORSO DI STATISTICA 2
Dott. Laura Perrotta- Lezione 3 - Gli indici di dispersione -
A.A. 2006/2007
INDICI DI DISPERSIONECorso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
125/146
INDICI DI DISPERSIONE
Gliindici di dispersione sono indici che danno unamisura della variabilit dei termini della distribuzionerispetto ad una media.
Un indice di tendenza centrale non sufficiente, infatti,a descrivere completamente un fenomeno.
Indici di tendenza centrale e indici di dispersione
devono essere associati per fornire uninformazionecompleta.
Gli indici di dispersione sono sempre associati ad unamedia per indicare la variabilit intorno ad essa.
Tab. 1 Non c dispersione rispetto alla variabile
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
126/146
Paziente Sesso Et PA diastolica(mmHg)
PA sistolica(mmHg)
1 M 50 70 1102 F 50 90 953 F 50 80 1304 F 50 85 855 M 50 70 95
Paziente Sesso Et PA diastolica(mmHg)
PA sistolica(mmHg)
1 M 20 70 1102 F 20 90 95
3 F 50 80 1304 F 80 85 855 M 80 70 95
ab.
Tab. 2
( ) ( ) 505
80...20 Tab.2 50
55050505050
Tab.1 1 =++==++++==
=
n
xn
i
i
C dispersione rispetto alla variabile et
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
127/146
166,00
168,00
170,00
172,00
174,00
176,00
178,00
180,00c m
S A R D E G N A
S I C I L I A
C A L A B R I A
B A S I L I C A T A
P U G L I A
C A M P A N I A
M O L I S E
A B R U Z Z O
L A Z I O
M A R C H E
U M B R I A
T O S C A N A
E M I L I A R O M A G N A
L I G U R I A
F R I U L I V E N E Z I A G I U L I A
V E N E T O
T R E N T I N O
A L T O
A D I G E
L O M B A R D I A
V A L L E D ' A O S T A
P I E M O N T E
S A R D E G N A
S I C I L I A
C A L A B R I A
B A S I L I C A T A
P U G L I A
C A M P A N I A
M O L I S E
A B R U Z Z O
L A Z I O
M A R C H E
U M B R I A
T O S C A N A
E M I L I A R O M A G N A
L I G U R I A
F R I U L I V E N E Z I A G I U L I A
V E N E T O
T R E N T I N O
A L T O
A D I G E
L O M B A R D I A
V A L L E D ' A O S T A
P I E M O N T E
Media italiana
Grafico 1 - Stature degli iscritti nelle liste di leva dei nati nellanno 1969
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
128/146
INTERVALLO DI VARIAZIONE
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
129/146
INTERVALLO DI VARIAZIONE
(o RANGE)Lintervallo di variazione la pi elementare misura didispersione riferita ai dati quantitativi ed calcolato comedifferenza tra il valore pi alto e quello pi basso di una serie di
intervallo di variazione = valore pi alto valore pi basso(o Range)
I due valori estremi (max e min) forniscono lindicazione del domdella variabile e indicano un primo approccio descrittivo
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
130/146
Paziente Sesso Et PA diastolica(mmHg)
PA sistolica(mmHg)
1 M 20 70 1102 F 20 90 953 F 50 80 1304 F 80 85 855 M 80 70 95
Lintervallo di variazione calcolato per la variabile PA diastolica il seguente 90 70 = 20
Min = 70Max = 90Range = 20
INDICI DI VARIABILITA ASSOLUTACorso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
131/146
INDICI DI VARIABILITA ASSOLUTAPER MISURE QUANTITATIVE
SCARTO MEDIO SEMPLICE ASSOLUTO
DEVIANZA VARIANZA
DEVIAZIONE STANDARD
Sono gli indicatori statistici di fondamentale importanza per la statistica descrittiva
VARIABILITA COMPLESSIVACorso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
132/146
VARIABILITA COMPLESSIVA
Lavariabilit complessiva costituita dallinsieme degliscarti di tutte le misure dalla media.Per la propriet delle medie la somma degli scarti dalla medi nulla a causa della compensazione tra scarti positivi enegativi.Utilizzando lartificio del valore assoluto, possiamoconsiderare lentit dello scarto senza tener conto del segnonegativo.La variabilit complessiva data da:
Nota:calcolare gli N(N-1) / 2 scarti tra tutte le osservazioni diventa troppolaborioso
|| m X
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
133/146
Se rapportiamo la variabilit complessiva al numero delleosservazioni otteniamo loscarto medio semplice assoluto
Che costituisce il pi elementare indice di dispersione consignificato statistico, poco considerato per via dellartifizio delvalore assoluto
N m X i i ||
SCARTO MEDIO SEMPLICE ASSOLUTO
DEVIANZA
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
134/146
DEVIANZA
In alternativa al valore assoluto si ricorre al quadrato degliscarti dalla media e si perviene alla formula delladevianza :
Definita come la somma dei quadrati degli scarti dalla media
La devianza sempre maggiore o uguale di zero e costituisce
il numeratore della varianza
( )( )2
22
N
X X m X i i
i ii i
=
( ) 0 X DEV
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
135/146
Domanda:
Di fronte a due serie di misure di una stessa variabile c
medie uguali, ma devianze diverse, la devianza dellaprima serie maggiore perch i suoi dati sono pidispersi o semplicemente perch il numero degli scarti
pi elevato?
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
136/146
L d i ti li f i d l di
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
137/146
VARIANZA
Definiamovarianza il rapporto tra la devianza e ilnumero delle osservazioni:
( ) N
m X i i =
22
La devianza non contiene linformazione del numero di
osservazioni N utilizzate nel calcolo
Paziente Sesso Et PA diastolica PA sistolica
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
138/146
(mmHg) (mmHg)1 M 40 70 110
2 F 40 90 953 F 50 80 130 70 M 55 70 95
Paziente Sesso Et PA diastolica(mmHg)
PA sistolica(mmHg)
1 M 50 75 1002 F 60 90 953 F 75 88 974 F 40 86 945 M 25 84 95
050.1 50620.10 50
22
11
====
devdev
Var 1 = 151,71Var 2 = 210
La seconda distribuzione per et presenta unamaggiore dispersione intorno alla media
VARIANZA CAMPIONARIACorso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
139/146
In campo biostatistico si preferisce utilizzare la formula dellavarianza campionaria
Per N molto grande ininfluente ai fini del risultato dellavarianza dividere per N o N-1.Per N molto piccolo se dividiamo la devianza per N-1 rispetta N otterremo una varianza campionaria maggiore rispetto aquella semplice.Le N-1 osservazioni costituiscono i gradi di libert, cio leosservazioni indipendenti nel calcolo della varianza.
( )
1
2
2
=
N
m X S i i
DEVIAZIONE STANDARDCorso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
140/146
DEVIAZIONE STANDARD
La variabilit deve essere associata alla tendenza centrale per fornire una descrizione completa di un fenomeno.Il valore della varianza deriva dal quadrato degli scarti dalla med ha un ordine di grandezza differente dal dato originale.Per un problema di interpretazione del dato convenienteesprimere la variabilit con lo stesso ordine di grandezza dellemedie: trasformiamo la varianza sotto il segno di radice eotteniamo la
Deviazione standard oscarto quadratico medio
che rappresenta la dispersione di una serie di dati
( )
n
m X n
ii
= =1
2
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
141/146
i S A di li A i li ( )
1_Esempio di confronto tra variabilitCorso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
142/146
Paziente Sesso Et PA diastolica(mmHg)
PA sistolica (mmHg)
1 M 50 75 1002 F 47 90 953 F 74 88 974 F 40 86 945 M 61 84 95
Paziente Sesso Et PA diastolica(mmHg)
PA sistolica (mmHg)
1 M 28 70 1102 F 45 90 953 F 50 80 1304 F 63 85 855 M 80 75 95
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )9,7
5
80758085808080908070
8,55
6,84846,84866,84886,84906,8475
805
75...70 6,84
5
4868889075
22222
2
222221
2
1
21
1
=++++
=
=++++
=
=
=++
==++++
==
=
=
n
x
n
x
n
ii
n
i
i
2_Esempio di confronto tra variabilit
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
143/146
Paziente Sesso Et Glicemia(mg/100ml)
Calcemia(mg/100ml)
1 M 50 85 8
2 F 37 80 10
3 F 63 70 9
4 M 41 90 5
5 M 36 100 13
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( )91,2
5
913959991098
18,115
851008590857085808585
95
1359108 85
5
10090708085
22222
2
222221
2
1
21
1
=++++
=
=++++
=
=
=++++
==++++
==
=
=
n
x
n
x
n
ii
n
i
i
mg/100ml1811mg/100ml85Glicemia 11 ==
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
144/146
%39,32100991,2100CV% (2)
%15,1310085
18,11100CV% (1)
mg/100ml 91,2 mg/100ml 9 Calcemia
mg/100ml18,11 mg/100ml85 Glicemia
2
2
1
1
22
11
===
===
==
Confrontando i coefficienti di variazione risulta pi variabila calcemia
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
145/146
codice paziente et Posizione et CENTRALETENDENZADIINDICI
Corso di Statistica
-
8/8/2019 1_LEZIONE_Concetti statistici di base_2anno 2010-2011
146/146
1 62 1 30
2 39 2 39
3 46 3 464 53 4 46
5 54 5 47
6 68 6 52
7 63 7 53
8 62 8 54
9 67 9 5710 30 10 60
11 66 11 61
12 46 12 62
13 67 13 62
14 70 14 62
15 60 15 6316 57 16 66
17 62 17 67
( )
( ) ( ) ( )
( ) ( ) ( )4,13...6,176,2620
6,5670...6,56396,5630
10,63st.deviazione
40 range70 massimo30 minimo
A'VARIABILITDIINDICI
6,56
5,60Mediana62 Moda
222
222
1
2
=+++=
=+++=
=
=
=
===
=
==
=
n
an
ii