statistica descrittiva

7
Statistica Descrittiva Alcune precisazioni me si calcola «a mano» la moda? dataset in maniera crescente e si assegna a ciascun valore l numero di valori che stanno in ciascuna posizione la posizione «più affollata» lativo a questa posizione è la moda in cui si trovi più di un valore, si sceglie il più piccolo 15 5 7 5 16 12 3 5 8 12 3 5 5 5 7 8 12 12 15 16 1 2 2 2 3 4 5 5 6 7 1 3 1 1 2 1 1 Moda= 5

Upload: illiana-kaufman

Post on 03-Jan-2016

28 views

Category:

Documents


0 download

DESCRIPTION

Statistica Descrittiva. Alcune precisazioni. Come si calcola «a mano» la moda?. si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione si conta il numero di valori che stanno in ciascuna posizione si determina la posizione «più affollata» - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Statistica Descrittiva

Statistica DescrittivaAlcune precisazioni

Come si calcola «a mano» la moda?

• si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione• si conta il numero di valori che stanno in ciascuna posizione• si determina la posizione «più affollata»• il valore relativo a questa posizione è la modaN.B. Nel caso in cui si trovi più di un valore, si sceglie il più piccolo

15 5 7 5 16 12 3 5 8 12

3 5 5 5 7 8 12 12 15 16

1 2 2 2 3 4 5 5 6 7

1 3 1 1 2 1 1

Moda= 5

Page 2: Statistica Descrittiva

Come si calcola «a mano» la mediana?

• si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione

• se il dataset è composto da un numero dispari di valori, la mediana è il valore che sta nella posizione (n+1)/2

• se il dataset è composto da un numero pari di valori, la mediana è dato dalla media dei due valori che stanno nelle posizioni n/2 e (n/2)+1

15 5 7 5 16 12 3 5 8 12

3 5 5 5 7 8 12 12 15 16

1 2 3 4 5 6 7 8 9 10

Mediana= (8+7)/2=7,5

Page 3: Statistica Descrittiva

Come si calcola «a mano» il percentile di ordine m ?

• si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione

• si arrotonda il risultato della formula

• il risultato che si ottiene è la posizione nella serie ordinata del percentile desiderato

N.B. Questo è solo uno dei tanti modi disponibili

21

100%

nm

15 5 7 5 16 12 3 5 8 12

3 5 5 5 7 8 12 12 15 16

1 2 3 4 5 6 7 8 9 10

63-esimo percentile = 12

78,621

1010063

Page 4: Statistica Descrittiva

Analisi della varianza

Campione di n*m elementi:

mnm

n

n

xx

xx

xx

,,

,,

,,

1

221

111

n: numero di replichem: numero di trattamenti

La situazione in teoria

Page 5: Statistica Descrittiva

Media del trattamento:n

xX

n

iji

j

1 Media totale:

m

X

X

m

j

j 1

mnmdev

s ININ

*2

m

j

jTRA XXndev1

2)(*Devianza dovuta ai trattamenti (TRA):

m

j

n

iji Xxdev

1 1

2)(Devianza totale:

1*2

nmdev

s

Devianza interna ai trattamenti (IN):

m

j

n

i

jji

m

jjTRAIN Xxdevdevdevdev

1 1

2

1

)(

12

mdev

s TRATRA

Le formule

Page 6: Statistica Descrittiva

L’analisi della varianza è una metodologia per verificare se due o più popolazioni sono caratterizzate dalla stessa media (o più

medie sono estratte dalla stessa popolazione)

Nell’analisi della varianza a una via si considera una sola causa di variazione (detta Fattore, Trattamento, Livello,

etc…) nell’esito di ciascun esperimento

In generale

In particolare

Ipotesi Nulla:Le popolazioni da cui sono stati estratti i campioni hanno tutte la stessa media

μ1= μ2 = … = μm

Statistica del test:Se i campioni possono venir considerati estratti

dalla stessa popolazione (o da popolazioni con media uguale, il Rapporto F dev’essere circa

uguale a 1 e si comporta come una distribuzione di Fisher con m-1 e n-m gdl

IN

TRA

ss

FRapporto 2

2

Page 7: Statistica Descrittiva

Se il valore calcolato Rapporto F è più grande del valore tabulato Fα(m-1, m-k), allora si può rifiutare l’ipotesi nulla all’ α

% di significatività

• Osservazioni indipendenti• Distribuzione Normale della

popolazione• Varianza omogenea per ciascuno dei

campioni

N.B. Quando questo si verifica, significa soltanto che almeno uno dei campioni si comporta in maniera

diversa dagli altri.

L’analisi della varianza si può usare quanto sono soddisfatte le seguenti 3 condizioni: