statistica descrittiva
DESCRIPTION
Statistica Descrittiva. Alcune precisazioni. Come si calcola «a mano» la moda?. si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione si conta il numero di valori che stanno in ciascuna posizione si determina la posizione «più affollata» - PowerPoint PPT PresentationTRANSCRIPT
Statistica DescrittivaAlcune precisazioni
Come si calcola «a mano» la moda?
• si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione• si conta il numero di valori che stanno in ciascuna posizione• si determina la posizione «più affollata»• il valore relativo a questa posizione è la modaN.B. Nel caso in cui si trovi più di un valore, si sceglie il più piccolo
15 5 7 5 16 12 3 5 8 12
3 5 5 5 7 8 12 12 15 16
1 2 2 2 3 4 5 5 6 7
1 3 1 1 2 1 1
Moda= 5
Come si calcola «a mano» la mediana?
• si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione
• se il dataset è composto da un numero dispari di valori, la mediana è il valore che sta nella posizione (n+1)/2
• se il dataset è composto da un numero pari di valori, la mediana è dato dalla media dei due valori che stanno nelle posizioni n/2 e (n/2)+1
15 5 7 5 16 12 3 5 8 12
3 5 5 5 7 8 12 12 15 16
1 2 3 4 5 6 7 8 9 10
Mediana= (8+7)/2=7,5
Come si calcola «a mano» il percentile di ordine m ?
• si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione
• si arrotonda il risultato della formula
• il risultato che si ottiene è la posizione nella serie ordinata del percentile desiderato
N.B. Questo è solo uno dei tanti modi disponibili
21
100%
nm
15 5 7 5 16 12 3 5 8 12
3 5 5 5 7 8 12 12 15 16
1 2 3 4 5 6 7 8 9 10
63-esimo percentile = 12
78,621
1010063
Analisi della varianza
Campione di n*m elementi:
mnm
n
n
xx
xx
xx
,,
,,
,,
1
221
111
n: numero di replichem: numero di trattamenti
La situazione in teoria
Media del trattamento:n
xX
n
iji
j
1 Media totale:
m
X
X
m
j
j 1
mnmdev
s ININ
*2
m
j
jTRA XXndev1
2)(*Devianza dovuta ai trattamenti (TRA):
m
j
n
iji Xxdev
1 1
2)(Devianza totale:
1*2
nmdev
s
Devianza interna ai trattamenti (IN):
m
j
n
i
jji
m
jjTRAIN Xxdevdevdevdev
1 1
2
1
)(
12
mdev
s TRATRA
Le formule
L’analisi della varianza è una metodologia per verificare se due o più popolazioni sono caratterizzate dalla stessa media (o più
medie sono estratte dalla stessa popolazione)
Nell’analisi della varianza a una via si considera una sola causa di variazione (detta Fattore, Trattamento, Livello,
etc…) nell’esito di ciascun esperimento
In generale
In particolare
Ipotesi Nulla:Le popolazioni da cui sono stati estratti i campioni hanno tutte la stessa media
μ1= μ2 = … = μm
Statistica del test:Se i campioni possono venir considerati estratti
dalla stessa popolazione (o da popolazioni con media uguale, il Rapporto F dev’essere circa
uguale a 1 e si comporta come una distribuzione di Fisher con m-1 e n-m gdl
IN
TRA
ss
FRapporto 2
2
Se il valore calcolato Rapporto F è più grande del valore tabulato Fα(m-1, m-k), allora si può rifiutare l’ipotesi nulla all’ α
% di significatività
• Osservazioni indipendenti• Distribuzione Normale della
popolazione• Varianza omogenea per ciascuno dei
campioni
N.B. Quando questo si verifica, significa soltanto che almeno uno dei campioni si comporta in maniera
diversa dagli altri.
L’analisi della varianza si può usare quanto sono soddisfatte le seguenti 3 condizioni: