indici di sintesi - - università degli studi di cassino · indici di variabilità la variabilità...
TRANSCRIPT
![Page 1: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/1.jpg)
Indici di sintesi
![Page 2: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/2.jpg)
Indici (Statistiche)� Gran parte della analisi statistica consiste nel condensare
complessi pattern di osservazioni in un indicatore che sia
capace di riassumere una specifica caratteristica di tutte
le rilevazioni in un singolo numero
� In statistica descrittiva distinguiamo:
� Indici di tendenza centrale (o indici di posizione)
� che esprimono il valore “tipico”
� Indici di dispersione (o indici di variabilità)
� che esprimono quanto i dati si raggruppano strettamenteintorno al valore ”tipico”
� Indici di forma
� che esprimono le caratteristiche di “simmetria” e
“curvatura” della distribuzione dei dati
![Page 3: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/3.jpg)
Indici (Statistiche)� Indici di tendenza centrale
�Moda
�Mediana
�Media
� Indici di dispersione
� Range
� Range interquartile
� Percentili
�Deviazione standard, varianza
![Page 4: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/4.jpg)
Indici di tendenza centrale
![Page 5: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/5.jpg)
Moda, media
e mediana
![Page 6: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/6.jpg)
Moda� È il valore che si verifica più
frequentemente�Per quale tipologia di dati è calcolabile?
� dati categorici binomiali, nominali e ordinali
� Dati numerici discreti� (quando le modalità osservate siano poche)
� dati numerici continui� è la classe di valori osservata più frequentemente
� …..è quindi necessario prima raggruppare in classi le
osservazioni
![Page 7: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/7.jpg)
Moda
� Si determina contando la frequenza
delle modalità
� Non tiene conto di tutte le altre modalità,
utilizza un solo elemento della distribuzione
� Ci può essere più di un valore modale in una
distribuzione
� Due valori con la stessa frequenza
� Due valori con frequenze simili
![Page 8: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/8.jpg)
Moda� Esempio: Il volume espiratorio forzato in 13 adolescenti
asmatici (in litri)
� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3
� Si costruisce una tabella di frequenza
� Il valore 2.8 si presenta tre volte, i valori 2.6 e 4.0 si presentano
2 volte ciascuno, tutti gli altri valori si presentano una volta sola
� 2.8 è la moda della distribuzione
� N.B. La moda si riferisce al valore più frequente (2.8), non alla
frequenza di tale valore (3)
![Page 9: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/9.jpg)
Mediana
� Il valore, che, dopo aver posto le
osservazioni in ordine crescente, divide il
campione in due gruppi di eguale
numerosità�Per quale tipologia di dati è calcolabile?
� dati categorici ordinali
� dati numerici discreti
� dati numerici continui
![Page 10: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/10.jpg)
Mediana� Si calcola individuando
� Nelle serie dispari il valore al centro della distribuzione ordinata
(valore nella (n+1)/2 esima posizione)
� Nelle serie pari è la media dei due valori al centro della
distribuzione ordinata (media tra il valore nella n/2 esima e il valore
nella (n/2)+1 esima posizione)
� E’ detta anche 50° percentile
� Utilizza le relazioni di posizione dei dati (>,<)
� Non è sensibile ai valori estremi
� E’ il migliore indice di sintesi nelle distribuzioni
asimmetriche
![Page 11: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/11.jpg)
Mediana� Esempio: Il volume espiratorio forzato in 13 adolescenti
asmatici (in litri)
� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3
� Ordina i 13 valori xi� 2.1, 2.2, 2.3, 2.6, 2.6, 2.8, 2.8, 2.8, 3.0, 3.3, 3.5, 4.0, 4.0
� Calcolo:� Nelle serie dispari (N=13 è dispari) è il valore al centro della
distribuzione ordinata
• valore nella (n+1)/2 esima posizione = 7a posizione
� 2.1, 2.2, 2.3, 2.6, 2.6, 2.8, 2.8, 2.8, 3.0, 3.3, 3.5, 4.0, 4.0
![Page 12: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/12.jpg)
Media aritmetica� La somma di tutti i valori rilevati in un campione divisaper la numerosità
� Utilizza le proprietà delle relazioni aritmetiche (quantità,operazioni)� Esiste solo per i dati numerici continui e discreti
� Sintetizza tutti i dati: è il valore più vicino a tutte lesingole osservazioni
� E’ invariante per trasformazioni affini� +k, - k, *k, /k sui dati
• spostano nello stesso senso la media
� E’ valida soprattutto per i dati che seguono unadistribuzione di frequenza normale
� E’ sensibile ai valori estremi
![Page 13: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/13.jpg)
La Media aritmetica� Significato:
�Quanto sarebbero alti i soggetti che abbiamo studiato,se fossero tutti uguali?
∑=
n
i
ix
1
ix
1x
2x 3x
n
x
x
n
i
i∑=
=1
x x x
![Page 14: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/14.jpg)
Media aritmetica
� Esempio: Il volume espiratorio forzato in 13
adolescenti asmatici (in litri)� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3
� Somma dei 13 valori xi� 2.3+2.1+3.5+2.6+2.8+2.8+4.0+2.2+2.6+3.0+4.0+2.8+3.3= 38
� Divisione per n=13
� 38 / 13 = 2.9
n
x
x
n
i
i∑=
=1
![Page 15: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/15.jpg)
Valutare una distribuzione di frequenza
� Simmetrica Unimodale�Media = Mediana = Moda
� Simmetrica Bimodale�Moda1 < Media = Mediana < Moda2
� Asimmetrica a destra�Moda < Mediana < Media
� Asimmetrica a sinistra�Media < Mediana < Moda
![Page 16: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/16.jpg)
Media per dati raggruppati
� La media aritmetica si può calcolare anchesenza avere i valori di ogni singolaosservazione, basandosi su dati aggregati�Es. consideriamo la seguente tabella, che riporta ladistribuzione di frequenza del n° di sigarettefumate ogni giorno da un campione di 20 persone
N° sig. Frequenza0 65 810 520 1
![Page 17: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/17.jpg)
Media per dati raggruppati
� La media aritmetica può esserecalcolata come media “pesata” deidiversi valori�I pesi sono rappresentati dalla frequenza diciascun valore
�N° sig. medio=(0*6+5*8+10*5+20*1)/20=5.5
![Page 18: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/18.jpg)
Media per dati raggruppati� La media aritmetica può essere calcolata, con una certaapprossimazione, anche quando, invece dei singoli valori,sono riportati degli intervalli di valori della variabile diinteresse� Es. consideriamo la seguente tabella, che riporta ladistribuzione di frequenza dei valori di frequenza cardiaca ariposo in un campione di 20 persone
Freq. Card. Frequenza40-49 250-59 460-69 670-79 480-89 390-99 1
![Page 19: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/19.jpg)
Media per dati raggruppati
� In questo caso, si prende il valorecentrale di ogni intervallo e si usa laformula descritta in precedenza�Freq. Card. media =(45*2+55*4+65*6+75*4+85*3+95*1)/20=67.5
![Page 20: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/20.jpg)
Esercitazione
� Di un gruppo di atleti raccogliamo delleinformazioni relative al tipo di sportpraticato, al peso, all'altezza ed alnumero di infortuni subiti
� Calcolare:
�L'altezza media e mediana
�Lo sport più praticato
�La media, la mediana e la moda del numero di
infortuni
![Page 21: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/21.jpg)
Il dataset
![Page 22: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/22.jpg)
Esercitazione
� Calcolare il valore medio del n° di sit-upseffettuati da un campione di 30 atletiin un giornoN° sit-ups Frequenza5 610 815 620 230 550 3
![Page 23: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/23.jpg)
Esercitazione
� Calcolare il valore medio della PressioneArteriosa Sistolica negli stessi atletiN° sit-ups Frequenza<100 2100-109 3110-119 3120-129 5130-139 8140-149 4150-159 2160-169 3
![Page 24: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/24.jpg)
Esercitazione
� Hai raccolto i valoridel peso (espresso inlibbre) dei canottieridi Oxford eCambridge
![Page 25: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/25.jpg)
Esercitazione
� Di seguito sono riportati i valori medi emediani (in libbre) per i due equipaggi�Cambridge: media=182, mediana=186�Oxford: media=180, mediana=185
� Ti aspetti che la distribuzione siasimmetrica?
![Page 26: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/26.jpg)
Esercitazione
� La distribuzione del peso dell’equipaggio diCambridge (9 canottieri)
1** | 091** |1** |1** | 791** | 83, 85, 86, 89, 952** | 04, 14
![Page 27: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/27.jpg)
Esercitazione� La distribuzione del peso dei due equipaggi(18 canottieri)
02
46
Fre
qu
en
cy
100 150 200weight
![Page 28: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/28.jpg)
Indici di variabilità
![Page 29: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/29.jpg)
La variabilità
![Page 30: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/30.jpg)
Misurare la variabilità di una distribuzioneDistribuzione A Distribuzione B
xi ni fi
10 1 0.01
20 2 0.02
30 94 0.94
40 2 0.02
50 1 0.01
tot 100 1.00
xi ni fi
10 10 0.10
20 20 0.20
30 40 0.40
40 20 0.20
50 10 0.10
tot 100 1.00
Moda(A)= 30
Mediana(A)=30
Media (A) =30
Moda(B)= 30
Mediana(B)=30
Media (B) =30
Le due distribuzioni si possono dire uguali?
![Page 31: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/31.jpg)
Misurare la variabilità di una distribuzionedistribuzione frequenze A e B
0
20
40
60
80
100
10 20 30 40 50
distribuzione A
distribuzione B
Le osservazioni della distribuzione A sono per la maggior parte in corrispondenza del valore medio
Le osservazioni della distribuzione B sono più disperse rispetto al valore medio
![Page 32: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/32.jpg)
Misurare la variabilità di una distribuzione
� I dati delle due distribuzioni hanno undiverso livello di dispersione
� I dati delle due distribuzioni sonodifferentemente distribuiti intorno alloro valore medio
� Le due distribuzioni hanno una diversavariabilità
![Page 33: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/33.jpg)
Indici di variabilità
� La variabilità o dispersione è unconcetto chiave in statistica�Molte analisi vengono condotte allo scopo di
studiare le cause della variabilità di un
fenomeno
� Indici di variabilità sono:�Il range, o intervallo massimo-minimo�Il range inter-quartile�La varianza�La deviazione standard
![Page 34: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/34.jpg)
Il range
� Il range, o intervallo massimo-minimo,individua le due osservazioni estremedi una distribuzione, ovvero la piùgrande e la più piccola�È quindi molto facile calcolare il range
�Il limite di questa misura è che è facilmenteinfluenzabile da osservazioni anomale, cioèmolto più grandi o molto più piccole dellamaggior parte delle osservazioni
![Page 35: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/35.jpg)
Il Range
Campo di variazione
R = Max - Min
Distribuzione A
xi ni fi
10 1 0.01
20 2 0.02
30 94 0.94
40 2 0.02
50 1 0.01
tot 100 1.00
R = 50 - 10
![Page 36: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/36.jpg)
Esercitazione
� Hai raccolto i valoridel peso (espresso inlibbre) dei canottieridi Oxford eCambridge�Calcola il range di valori,per i due team
![Page 37: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/37.jpg)
Quantili� Per QUANTILI si intende la suddivisionedi una distribuzione in gruppi ordinati e dieguale numerosità
� Decili: dieci gruppi� Quintili: cinque gruppi� Quartili: quattro gruppi� Centili (o percentili): cento gruppi
�Per PERCENTILE si intende la suddivisione in 100parti uguali di una serie di valori continui� ad esempio pesi o altezze di bambini
� Un bambino che superi il 90% percentile avrà dunque un valore(es. di altezza) superiore al 90% di tutti i bambini considerati
![Page 38: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/38.jpg)
PercentiliConsideriamo una variabile Y, ordinabile, conmodalità:
y1, y2 , y3 , …, yk
� 1° percentile= valore di y che separa il primo 1%delle osservazioni
�2° percentile= valore di y che separa il primo 2%delle osservazioni
�n° percentile= valore di y che separa il primo n%delle osservazioni
![Page 39: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/39.jpg)
� Calcolo del p-esimo Percentile�Considerando n osservazioni ordinate�ed intendendo calcolare il valore del p-esimo percentile� valutiamo l’ espressione (n*p)/100
� se NON è un intero• il p-esimo percentile sarà l’ osservazione che sitrova alla posizione data da np/100 approssimatoper eccesso
� se è un intero• il p-esimo percentile sarà la media tra l’osservazione che si trova nella posizione np/100 e l’osservazione che si trova nella posizione successiva
Percentili
![Page 40: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/40.jpg)
� Calcolo del p-esimo Percentile�75° percentile nel nostro esempio di 13 osservazioni
� valutiamo l’ espressione (n*p)/100
� 75*13/100 = 9.75 � NON è un intero
• il p-esimo percentile sarà l’ osservazione che si
trova alla posizione data da np/100 approssimato
per eccesso
• e cioè la 10a osservazione dopo aver ordinato i dati
� 2.1, 2.2, 2.3, 2.6, 2.6, 2.8, 2.8, 2.8, 3.0, 3.3, 3.5, 4.0, 4.0
Percentili
![Page 41: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/41.jpg)
Le curve di crescita
� Le curve riportate nel
grafico rappresentano
alcuni percentili del
peso in bambine e
ragazze (10-20 anni)
negli USA
![Page 42: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/42.jpg)
1°°°° quartile = 25°°°° percentile
2°°°° quartile = 50°°°° percentile
3°°°° quartile = 75°°°° percentile
Mediana
Quartili di una distribuzione
![Page 43: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/43.jpg)
Il range inter-quartile
� E’ la differenza tra il terzo quartile(75° percentile) e il primo quartile (25°percentile)
� E’ l’ampiezza dell’intervallo checontiene il 50% centrale dei dati
� Non è influenzato dai valori estremi
�N.B. sia il range che la differenza interquartile
sono singoli numeri, non intervalli
![Page 44: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/44.jpg)
Esercitazione
� Hai raccolto i valoridel peso (espresso inlibbre) dei canottieridi Oxford eCambridge�Calcola i quartili delladistribuzione
![Page 45: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/45.jpg)
Diagrammi a scatola
� Sono utili per verificare la asimmetria delle distribuzioni di frequenza
� La scatola centrale si estende dal 25° percentile al 75° percentile (i “quartili” dei dati)
� La linea dentro la scatola rappresenta la mediana
� Le linee al di fuori della scatola si estendono ai valori adiacenti, osservazioni più estreme che non superano più di 1,5 volte l’altezza della scatola esternamente ad ognuno dei quartili
![Page 46: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/46.jpg)
Diagrammi a scatola1
00
15
02
00
25
0w
eig
ht
![Page 47: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/47.jpg)
Diagrammi a scatola1
00
15
02
00
25
0Cambridge Oxford
we
igh
t
Graphs by team
![Page 48: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/48.jpg)
Misurare la variabilità di una distribuzione
� Come migliorare ulteriormente lemisura della variabilità?�Utilizzare misure che tengano conto di tutti itermini della distribuzione in studio
�Calcolare lo scarto tra il valore di ciascunaosservazione ed il valore medio di tutte leosservazioni
�Calcolare la media di tutti gli scarti� Distanza media dei punti della distribuzionedalla media della distribuzione stessa
![Page 49: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/49.jpg)
� E’ un valore sintetico che vuole esprimere la distanza media diogni singola osservazione dalla media aritmetica del campione
� Idealmente, la distanza media delle osservazioni dallamedia artimetica del campione si potrebbe studiarecalcolando la media aritmetica dei semplici scarti.� Tuttavia, per la stessa definizione della media aritmetica, la somma degli
scarti è pari a zero
� Allora, per evitare l’ azzeramento della somma degliscarti, si calcola la media dei quadrati degli scarti� per la varianza di una popolazione:
� per la varianza in un campione• si tende ad essere più conservativi:
Varianza
n
x
n
i
i∑=
−
=1
2
2
)( µ
σ
1
)(1
2
2
−
−
=
∑=
n
xx
s
n
i
i
![Page 50: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/50.jpg)
Varianza� Utilizza le proprietà delle relazioniaritmetiche (quantità, operazioni)
� Esiste solo per i dati numerici continui ediscreti
� E’ valida soprattutto per i dati che seguonouna distribuzione di frequenza normale
� E’ sensibile ai valori estremi� La sua unità di misura non è quella dellamedia�è al quadrato!
![Page 51: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/51.jpg)
Varianza� Esempio
�Si calcolano gli scarti� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3� 2.3-2.9, 2.1-2.9, 3.5-2.9, …� -0.6, -0.8, +0.6, -0.3, -0.1, -0.1, +1.1, -0.7, -0.3, +0.1, +1.1, -0.1, +0.4
� si calcolano i quadrati degli scarti� 0.36, 0.64, 0.36, 0.09, 0.01, 0.01, 1.21, 0.49, 0.09, 0.01, 1.21, 0.01, 0.16
� Si calcola la media dei quadrati degli scarti (con i gradi dilibertà)� 0.36+0.64+0.36+0.09+0.01+0.01+1.21+0.49+0.09+0.01+1.21+0.01+0.16
� 4.65/(13-1) = 0.3875 litri 2
• attenzione: è in una scala al quadrato !
1
)(1
2
2
−
−
=
∑=
n
xx
s
n
i
i
![Page 52: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/52.jpg)
Deviazione standard� E’ un valore sintetico che vuole esprimerela distanza media di ogni singolaosservazione dalla media aritmetica delcampione
� E’ la radice quadrata della varianza, e ne ha lestesse proprietà
� Ha la stessa unità di misura della mediaaritmetica
![Page 53: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/53.jpg)
Deviazione standard� Esempio
�Si calcolano gli scarti� 2.3, 2.1, 3.5, 2.6, 2.8, 2.8, 4.0, 2.2, 2.6, 3.0, 4.0, 2.8, 3.3� 2.3-2.9, 2.1-2.9, 3.5-2.9, …� -0.6, -0.8, +0.6, -0.3, -0.1, -0.1, +1.1, -0.7, -0.3, +0.1, +1.1, -0.1, +0.4
� si calcolano i quadrati degli scarti� 0.36, 0.64, 0.36, 0.09, 0.01, 0.01, 1.21, 0.49, 0.09, 0.01, 1.21, 0.01, 0.16
� Si calcola la media dei quadrati degli scarti (con i gradi dilibertà)� 0.36+0.64+0.36+0.09+0.01+0.01+1.21+0.49+0.09+0.01+1.21+0.01+0.16
� 4.65/(13-1) = 0.3875 litri 2
� Sqrt(0.3875)=0.622 litri
![Page 54: Indici di sintesi - - Università degli Studi di Cassino · Indici di variabilità La variabilità o dispersione è un concettochiaveinstatistica Molte analisi vengono condotte allo](https://reader031.vdocuments.pub/reader031/viewer/2022022720/5c65f67d09d3f2d8348b8300/html5/thumbnails/54.jpg)
Esercitazione
� Hai raccolto i valori delpeso (espresso in libbre)dei canottieri di Oxforde Cambridge�Calcola varianza edeviazione standard perl’equipaggio di Cambridge
�Media=182