gli indici di variabilita ’
DESCRIPTION
Gli Indici di VARIABILITA ’. Elementi di Statistica descrittiva. - Campo di variazione Scarto dalla media Varianza Scarto quadratico medio Coefficiente di variazione. Indici di Variabilità. I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/1.jpg)
GLI INDICI DI VARIABILITA’
- Campo di variazione- Scarto dalla media- Varianza- Scarto quadratico medio- Coefficiente di variazione
1
Elementi di Statistica descrittivaElementi di Statistica descrittiva
![Page 2: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/2.jpg)
INDICI DI VARIABILITÀ
I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico
Hanno però il limite di non darci alcuna informazione sulla distribuzione dei dati
2
![Page 3: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/3.jpg)
EsempioIn tre differenti prove di matematica 4 studenti
hanno riportato le seguenti valutazioni
3
1a Prova 2a Prova 3a Prova1° studente 3 5 62° studente 5 7 73° studente 8 6 64° studente 9 7 6
media 6,25 6,25 6,25
In tutte e tre le prove la media è 6,25 ma i dati sono chiaramente distribuiti in modo diverso
![Page 4: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/4.jpg)
4
Diagramma di distribuzione delle tre prove
Diagramma dispersione dati
0123456789
10
0 1 2 3 4
num prova
valu
tazi
oni
1 studente
2 sttudente
3 studente
4 studente
media
![Page 5: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/5.jpg)
nel caso della 1a prova e 2a prova sarà opportuno
fare un recupero per alcuni studenti
nel caso della 3a prova l’insegnante può ritenere che gli obiettivi siano stati raggiunti dalla classe, anche se ad un livello solo sufficiente 5
Diagramma dispersione dati
0123456789
10
0 1 2 3 4
num prova
valu
tazi
oni
1 studente
2 sttudente
3 studente
4 studente
media
![Page 6: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/6.jpg)
6
• Campo di variazione (Range)• Scarto medio dalla media• Varianza e scarto quadratico medio• Coefficiente di variazione
In statistica è possibile valutare in modo sintetico la distribuzione dei dati mediante gli
indici di variabilità (o dispersione)
Vedremo i seguenti indici
![Page 7: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/7.jpg)
7
CAMPO DI VARIAZIONE
Campo variazione = x max – x min
E’ il più semplice degli indici di variazione:
Si calcola facendo la differenza tra il dato più grande e il dato più piccolo
Rappresenta l’ampiezza dell’intervallo dei dati
![Page 8: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/8.jpg)
8
Esempio
Consideriamo le valutazioni della prima prova
1a Prova1° studente 32° studente 53° studente 84° studente 9
media 6,25
Xmax = 9;
Xmin = 3 Range = 9 – 3 = 6
![Page 9: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/9.jpg)
9
Calcoliamo il Range per tutte le tre prove
1a Prova 2a Prova 3a Prova1° studente 3 2 62° studente 5 7 73° studente 8 8 64° studente 9 8 6
media 6,25 6,25 6,25range 6 6 1
Range 1a prova = 6 dati più dispersi, risultati più eterogenei
Range 3a prova = 1 dati più concentrati, risultati più omogenei
Range 2a prova = Range 1a prova = 6 Stessa Distribuzione?
![Page 10: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/10.jpg)
10
Campo di variazione delle tre prove
0123456789
10
0 1 2 3 4
num prova
valu
tazi
oni
1 studente
2 sttudente
3 studente
4 studente
range
Vediamo graficamente
![Page 11: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/11.jpg)
11
Osservazioni:
1. Il campo di variazione dà informazioni sulla distribuzione dei dati:
• più R è piccolo più i dati sono concentrati; • più R è grande più i dati sono dispersi.
2. R è espresso nella stessa unità di misura dei dati
3. Tuttavia R tiene conto solo dei dati estremi della distribuzione e non di tutti i dati, pertanto distribuzioni diverse ma con gli stessi valori estremi hanno range uguali Es. Range 1aprova = Range 2a prova.
ma distribuzione 1a prova Distribuzione 2a prova
![Page 12: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/12.jpg)
12
SCARTO MEDIO DALLA MEDIA ARITMETICA
Un altro modo per calcolare la variabilità dei dati (tenendo conto di tutti i dati) consiste nel calcolare la distanza di tutti i dati dalla media e fare la media aritmetica di tali distanze
Scarto medio = Distanza media dei dati dalla media
n
xxxxxxn
.....
S medio Scarto 21
m
![Page 13: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/13.jpg)
1a Prova scarti da M1° studente 3 -3,252° studente 5 -1,253° studente 8 1,754° studente 9 2,75
media 6,25 0,00
Osservazione
n
xxxxxx n
.....s m da Scarto 21
m
Scarto sm = 0
![Page 14: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/14.jpg)
14
Esempio
Consideriamo le valutazioni della prima prova
1a Prova1° studente 32° studente 53° studente 84° studente 9
media 6,25
x1 = 3 – 6,25 = 3,25; x2 = 5 – 6,25 = 1,25;
x3 = 8 – 6,25 = 1,75; x4 = 9 – 6,25 = 2,75;
Sm = 3,25 + 1,25 + 1,75 + 2,75 = 2,25
4
![Page 15: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/15.jpg)
15
Calcoliamo lo Scarto medio per tutte le tre prove
Scarto 1a prova = 2,25 dati più dispersi, risultati più eterogenei
Scarto 3a prova = 0,38 dati più concentrati, risultati più omogenei
Scarto 2a pr. Scarto 1a pr. “Le Distribuzioni Differiscono”
1a Prova 2a Prova 3a Prova1° studente 3 2 62° studente 5 7 73° studente 8 8 64° studente 9 8 6
media 6,25 6,25 6,25scarto medio 2,25 2,13 0,38
![Page 16: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/16.jpg)
16
Diagramma degli scarti dalla media
Diagramma degli scarti dalla media
-5,00-4,00
-3,00-2,00
-1,000,00
1,002,00
3,004,00
1 2 3
num. prova
Sca
rto
dalla
med
ia
stud.1
stud.2
stud.3
stud.4
![Page 17: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/17.jpg)
17
Osservazioni:
1. Lo scarto medio dalla media dà informazioni sulla distribuzione dei dati:
• più SM è piccolo più i dati sono concentrati; • più SM è grande più i dati sono dispersi.
2. SM è espresso nella stessa unità di misura dei dati
3. Non ha l'inconveniente del “Campo di variazione” in quanto SM tiene conto di tutti i dati della distribuzione
![Page 18: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/18.jpg)
18
VARIANZA E SCARTO QUADRATICO MEDIO
Sono gli indici di variabilità più utilizzati, e tengono conto della distribuzione di tutti i dati.
Varianza
Rappresenta la media aritmetica dei quadrati delle distanze dei dati dalla media M
n
xxxxxx n22
22
12 ..... Varianza
![Page 19: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/19.jpg)
19
n
x
n
xxn
i
n
i
1
2
1
2
2 Varianza
![Page 20: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/20.jpg)
20
Esempio - Varianza
Consideriamo le valutazioni della prima prova
1a Prova1° studente 32° studente 53° studente 84° studente 9
media 6,25
(x1)2 = (3 – 6,25 )2 = 10,5625; (x2)2 = (5 – 6,25 )2 = 1,5625;
(x3)2 = (8 – 6,25 )2 = 3,0625; (x4)2 = (9 – 6,25 )2 = 7,5625;
2 = 10,5625+1,5625+3,0625+7,5625 = 5,6875
4
![Page 21: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/21.jpg)
21
Calcoliamo la Varianza per tutte le tre prove
Varianza 1aprova = 5,69 dati più dispersi, risultati più eterogenei
Varianza 3a prova = 0,19 dati più concentrati, risultati più omogenei
Varianza 2a pr. Varianza 1a pr “Le Distribuzioni Differiscono”
1a Prova 2a Prova 3a Prova1° studente 3 2 62° studente 5 7 73° studente 8 8 64° studente 9 8 6
media 6,25 6,25 6,25varianza 5,69 6,19 0,19
![Page 22: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/22.jpg)
22
SCARTO QUADRATICO MEDIO O DEVIAZIONE STANDARD
È uguale alla radice quadrata della varianza
n
x
n
xxn
i
n
i
1
2
1
2
medioquadr Scarto
n
xxxxxx n
22
2
2
1 ..... medio quadr. Scarto
![Page 23: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/23.jpg)
23
Esempio - Scarto quadratico medio
Riprendiamo le valutazioni della prima prova
1a Prova scarti da M scarti2
1° studente 3 -3,25 10,5625
2° studente 5 -1,25 1,5625
3° studente 8 1,75 3,0625
4° studente 9 2,75 7,5625
media 6,25 0,00 5,6875
3848,26875,521
2
n
xn
i
![Page 24: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/24.jpg)
24
Calcoliamo lo Scarto quadratico medio per tutte le prove
Scarto q. 1aprova = 2,38 dati più dispersi, risultati più eterogenei
Scarto q. 3aprova = 0,43 dati più concentrati, risultati più omogenei
Scarto q. 2a pr. Scarto q. 1a pr “Le Distribuzioni Differiscono”
1° studente 3 2 62° studente 5 7 73° studente 8 8 64° studente 9 8 6
media 6,25 6,25 6,25scarto quadratico 2,38 2,49 0,43Scarto dalla media 2,25 2,13 0,38
![Page 25: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/25.jpg)
25
Osservazioni:
1. La varianza 2 e lo scarto quadratico medio danno
informazioni sulla distribuzione dei dati:
• più 2 e sono piccoli più i dati sono concentrati; • più 2 e sono grandi più i dati sono dispersi.
2. Entrambi gli indici tengono conto di tutti i dati della distribuzione
![Page 26: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/26.jpg)
26
3. Entrambi si basano sulla proprietà della media per cui
la somma dei quadrati degli scarti dalla media è
minima
4. La varianza è espressa mediante il quadrato dell’unità
di misura dei dati
5. Lo scarto quadratico nella stessa unità di misura dei
dati e pertanto viene preferito alla varianza
![Page 27: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/27.jpg)
27
Il coefficiente di variazione CV
Il CV è una misura relativa di dispersione (le precedenti sono misure assolute) ed è una grandezza adimensionale.
E’ particolarmente utile quando si devono confrontare le distribuzioni di due gruppi con medie molto diverse o con dati espressi in scale differenti (es. confronto tra variazione del peso e variazione dell’altezza).
%100
xCV
![Page 28: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/28.jpg)
28
Se i valori di CV sono esterni a quelli indicati
« o si è in presenza di errori di rilevazione,
« oppure il fenomeno presenta aspetti particolari.
« se CV è molto basso (2 – 3 %) bisogna sospettare l’esistenza di fattori limitanti la variabilità,
« se CV è molto alto (intorno al 40% o più) è molto probabile l’esistenza di fattori che aumentano la variabilità
In natura il coeff. di variazione tende a rimanere costante per ogni fenomeno: i valori normalmente variano dal 5% al 15%
![Page 29: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/29.jpg)
29
Calcoliamo il Coeff. di variazione delle tre prove
CV 1a prova = 38,16% dati più dispersi, risultati più eterogenei
CV 3a prova = 6,93% dati più concentrati, risultati più omogenei
CV 2a pr. CV 1a pr “Le Distribuzioni Differiscono”
1a Prova 2a Prova 3a Prova1° studente 3 2 62° studente 5 7 73° studente 8 8 64° studente 9 8 6
media 6,25 6,25 6,25scarto quadratico 2,38 2,49 0,43coeff. variazione 38,16% 39,80% 6,93%
![Page 30: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/30.jpg)
EsempioNel reparto di ginecologia e ostetricia di un ospedale è stato rilevato il peso di un campione di 80 neonati maschi e contemporaneamente il peso dei rispettivi papà. I dati ottenuti sono espressi nella seguente tabella:
Coefficiente di variazione
Gruppo Media Deviazione Standard
Neonati 3,4 kg 0,8
Babbo 82 kg 15
Ci si chiede se, rispetto alla variabile peso, esiste più variabilità nel gruppo dei neonati o in quello dei papà.
![Page 31: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/31.jpg)
Per poter operare un confronto sulla variabilità dei due gruppi è opportuno calcolare i rispettivi coefficienti di variazione:
Osservando i risultati si può concludere che il gruppo dei bambini presenta una maggiore variabilità rispetto a quella del gruppo dei Papà.
![Page 32: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/32.jpg)
32
LE MISURE DI FORMA
Sono indici sintetici utilizzati per evidenziare particolarità nella forma della distribuzione.
Noi esamineremo:Noi esamineremo:
• l’asimmetrial’asimmetria
• la curtosila curtosi
![Page 33: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/33.jpg)
33
ASIMMETRIA
Una distribuzione è simmetrica quando la sua curva di frequenza presenta un asse di simmetria
In una distribuzione simmetrica media, mediana e moda sono coincidenti.
Confronto di distrib. normali
0
0,05
0,1
0,15
0,2
0,25
0 2 4 6 8 10 12 14 16
valori della variabile
fre
qu
en
za
1° distrib. normale
media = mediana = moda
In una distribuzione asimmetrica media, mediana e moda non sono più coincidenti
La differenza (distanza) tra la media e la moda può essere considerata una misura della asimmetria
![Page 34: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/34.jpg)
34
ii
ii
i
f
fxxa
3
3
1
Un altro coeff di asimmetria è il Coeff. di asimmetria (di Fisher)
= scarto quadratico medio
Se a = 0 distribuzione simmetrica
Se a > 0 asimmetria destra
Se a < 0 asimmetria sinistra
Sono state proposte diverse misure dell’ asimmetria, per esempio le più semplici sono:
modax
medio quadratico scarto
modaeticamediaaritmasimmetria
mediana)x
medio quadratico scarto
edianamtmetica3(mediaariasimmetria
(3)
Dette rispettivamente: primo e secondo coeff. di asimmetria di Pearson
![Page 35: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/35.jpg)
35
ASIMMETRIA POSITIVA (AS. DESTRA)
moda < mediana < mediamoda < mediana < media
La distribuzione è asimmetrica quando non presenta nessun asse di simmetria.Si ha un’asimmetria positiva o destra quando il ramo destro della curva è più lungo di quello sinistro
In questo caso si ha:
Asimmetria positiva o destra
0
2
4
6
8
10
12
0 20 40 60 80 100 120 140 160
valori
frequenza
media=63,65
moda = 48mediana =58
![Page 36: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/36.jpg)
36
ASIMMETRIA NEGATIVA (AS. SINISTRA)
media < mediana < modamedia < mediana < moda
Si ha un’asimmetria negativa o sinistra quando il ramo sinistro della curva è più lungo di quello destro
In questo caso si ha:
Asimmetria negativa o as. sinistra
0
2
4
6
8
10
12
14
0 20 40 60 80 100 120 140
valori
freq
uenz
a
media = 85,24
moda = 100mediana = 90
![Page 37: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/37.jpg)
37
CURTOSISe una distribuzione è simmetrica o quasi simmetrica allora può esser più o meno appuntita o più o meno appiattita rispetto alla distribuzione normale (o di Gauss)
Se la curva è
• più appuntita si dice curva Leptocurticacurva Leptocurtica
• più appiattita si dice curva Platicurticacurva Platicurtica
ii
ii
i
f
fxxK
4
4
1
Coeff. di curtosi di Pearson
= scarto quadratico medio 0 K < + Se K = 3 distribuzione normalese K > 3 curva leptocurticaSe K < 3 curva platicurtica.
![Page 38: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/38.jpg)
38
CURTOSI
Confronto delle Curtosi
-0,05
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 2 4 6 8 10 12 14 16
valori della variabile
fre
qu
en
za
leptocurtosi K = 8,57
platicurtosi K = 2,8
curva normale K = 3
![Page 39: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/39.jpg)
39
CURTOSI
Spesso il coeff. di curtosi viene indicato con b2 che, come visto, nel caso della distribuzione normale è = 3
pertanto, talvolta, la curtosi viene indicata con (b2 – 3)
Allora:
se la distribuzione è normale (b2 – 3 ) = 0
se la distribuzione è leptocurtica (b2 – 3 ) > 0
se la distribuzione è platicurtica (b2 – 3 ) < 0
![Page 40: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/40.jpg)
Esempio 1Data la seguente distribuzione unitaria del carattere X:
X: 4 2 4 2 6 4 0 4 0 2 4 4a. Calcolare la media aritmetica utilizzando la distribuzione di frequenza;b. Verificare che la somma degli scarti dalla media è zero;c. Verificare che la somma degli scarti al quadrato dalla media ( varianza) è più piccola della somma dal valore 2 ( ciò vale per ogni altro valore diverso dalla media aritmetica ).
xi fi xifi
0 2 0 -3 -6 18 -2 8
2 3 6 -1 -3 3 0 0
4 6 24 1 6 6 2 24
6 1 6 3 3 9 4 16
Media =3 12 36 0 0 36 4 48
![Page 41: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/41.jpg)
Esercizio 2Con riferimento alla seguente distribuzione di un gruppo di 60 aziende, secondo la classe di fatturato, calcolarea.La media e la classe modale;b.La varianza e lo scarto quadratico medio della distribuzione di fatturato.
![Page 42: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/42.jpg)
![Page 43: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/43.jpg)
033,05
167,0167,0
60
10
i
iii A
fhf
Quando i valori si presentano raggruppati in classi si parla di classi modali.
Se la distribuzione delle unità statistiche hanno intervalli di ampiezza diversa, allora la classe modale è quella classe a cui corrisponde la massima densità di frequenza hi. Nel nostro caso:
Nel nostro caso è la classe modale 0 – 5
![Page 44: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/44.jpg)
b) La varianza e lo scarto quadratico medio della distribuzione di fatturato.
![Page 45: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/45.jpg)
45
Fine Lezione
![Page 46: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/46.jpg)
La deviazione standard è particolarmente significativa nelle distribuzioni gaussiane (grafico simmetrico rispetto alla media).
Si può dimostrare che se la distribuzione è gaussiana, si ha che:
Confronto di distrib. normali
0
0,05
0,1
0,15
0,2
0,25
0 2 4 6 8 10 12 14 16
valori della variabile
fre
qu
en
za
1° distrib. normale
σ è un parametro che caratterizza la distribuzione normale (Gaussiana)
3%74,993
2%45,952
%27,68
XvalorideiX
XvalorideiX
XvalorideiX
![Page 47: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/47.jpg)
576,2%99576,2
96,1%9596,1
MvalorideiM
MvalorideiM
In una distribuzione perfettamente simmetrica con media M
valorideiM
valorideiM
%9957,2
%9596,1
![Page 48: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/48.jpg)
![Page 49: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/49.jpg)
![Page 50: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/50.jpg)
![Page 51: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/51.jpg)
Il costo mensile del trasporto scolastico in una popolazione di 800 studenti, ha una distribuzione gaussiana.Il costo medio mensile è CM=56 € e la deviazione standard = 5 €;a.Quanti sono gli studenti che hanno un costo tra 56 – 61 €?b.Quanti studenti hanno un costo superiore a 66€? ( M+2 )c.Quanti sono gli studenti che hanno un costo tra 56 – 61 €?
Risposta a.865,15
2
27,68100546
100
27,68800
Risposta b. 275,2
2
45,9510018
100
275,2800
Risposta c.
86,812
27,68
2
45,95655
100
86,81800
![Page 52: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/52.jpg)
La popolazione e il campione
E’ la ricerca dei valori dell’universo attraverso un suo campione.
Il campione deve riprodurre in piccola scala la popolazioneI nostri campioni vengono dedotti mediante estrazione anche ripetuta.
Questo significa che ogni elemento della popolazione ha la stessa possibilità di essere nuovamente estratto.
Le formule sono più semplici.
![Page 53: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/53.jpg)
La popolazione e il campione
Esempio:
Una azienda agricola produce 25.000 polli da rosticceria ogni 40 giorni del peso di 1,6 kg con una tolleranza di 0,1 kg. I polli da scartare sono lo 0,2% del totale.
![Page 54: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/54.jpg)
La popolazione e il campione
I dati che fornisce il campione rappresentano la stima della popolazione.Gli eventuali differenze andranno discusse ed eventualmente modificate.
Riassumiamo i parametri in una tabella.
![Page 55: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/55.jpg)
La sistribuzione campionaria
![Page 56: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/56.jpg)
![Page 57: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/57.jpg)
![Page 58: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/58.jpg)
Stima della media
Come si può stimare la media dell’universo utilizzando la media del campione?
Questa procedura si chiama stima puntualeMeglio accompagnarla anche dalla deviazione standard del campione
![Page 59: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/59.jpg)
In questo caso posso utilizzare la deviazione standard del campione s, che però non essendo uno stimatore corretto, va modificata in questo modo:
![Page 60: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/60.jpg)
intervallo di confidenza: intervallo di valori plausibili per quel parametro, che viene definito intervallo di confidenza (o intervallo di fiducia).
Se la confidenza deve essere del 95%, significa che il 95% dei campioni estratti deve avere una altezza compresa nell’intervallo qualcosa
![Page 61: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/61.jpg)
Mi aspetto che questi 57 studenti abbiano un’altezza compresa nell’intervallo:
La media del campione considerato è compresa nell’intervallo delle medie campionarie
![Page 62: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/62.jpg)
ES: Stimiamo l’altezza media in una popolazione di ragazzi di 19 anni sapendo che da un campione di 65 di essi, abbiamo rilevato che l’altezza media e la deviazione standard sono rispettivamente:
effettuiamo una stima puntuale a un livello di confidenza del 99%
Errore standard
L’intervallo di confidenza pari al 99% sarà:
![Page 63: Gli Indici di VARIABILITA ’](https://reader035.vdocuments.pub/reader035/viewer/2022062721/56813788550346895d9f2395/html5/thumbnails/63.jpg)
Il reddito annuo (in migliaia di euro) di 7 fratelli è il seguente:
La concentrazione
Individui A B C D E F G
Reddito in migliaia di €
15 20 12 10 18 30 35