c. di l. specialistica lauree per le professioni sanitarie corso integrato di informatica statistica...

97
C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi Dip. Scienze Biomediche e TT.AA. [email protected] www.aulaf5.unife.it/Default.html http://utenti.unife.it/claudio.bonifazzi/

Upload: mirella-miceli

Post on 01-May-2015

220 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

C. di L. SpecialisticaLauree per le Professioni

Sanitarie

Corso Integrato di Informatica Statistica ed Epidemiologia

StatisticaProf. Claudio BonifazziDip. Scienze Biomediche e [email protected]/Default.html

http://utenti.unife.it/claudio.bonifazzi/

Page 2: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Indice degli Argomenti• Statistica descrittiva. Dati Univariati

– Rappresentazione grafica dei dati– Indici di posizione e dispersione

• Probabilità e Distribuzioni di Probabilità – Distribuzione Normale e Binomiale

• Elementi di Statistica Inferenziale. – Stime puntuali e di Intervallo

• Verifica di Ipotesi sulla Media di popolazione – Grandi e piccoli campioni

• Verifica di Ipotesi sulla differenza fra due popolazione – Confronto fra medie

• Test di Indipendenza o Omogeneità (test 2)– dati categoriali

• Verifica di Ipotesi sulla differenza fra più di due popolazione (ANOVA)

Page 3: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Testi Utilizzati• Norman-Steiner

– BIOSTATISTICA (Ambrosiana 2000)

• M.R. Middleton. – ANALISI STATISTICA CON EXCEL (Apogeo 2004)

• David S. Moore– Statistica di Base (Apogeo 2005)

• Esempi ed Esercizi in Excel – Funzioni statistiche predefinite– Work Book ‘Analisi dei dati’– XL-Stat

Page 4: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Basi della Statistica• Statistica Descrittiva

– Organizzazione, presentazione e sintesi dei dati.

• Statistica Inferenziale– Generalizzazione delle informazioni ricavate da piccoli

campioni a grandi popolazione.

• Variabili o Caratteri statistici – Quantità o entità misurate o osservate (Dati)

– PO2 nel sangue, pH delle urine, peso, …

– Genere (Maschile/Femminile); Parere (Favorevole/Contrario/Non so); Responsività ad una terapia (Migliorato/Invariato/Peggiorato),

ecc..

• Variabili Dipendenti e Indipendenti– Variazione ottenuta (dipendente) in risposta a un qualche

intervento (indipendente). – Somministrazione di un diuretico e riduzione della pressione.

Page 5: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Rappresentazione Grafica dei Dati

• Diagramma a Barre; Dot-Plot

• Istogramma; Ogiva• Grafico tipo Torta (Pie Chart)

• Diagramma Gambo-Foglia (Steam-Leaf display)

• Box-and-Wiskers plot

•Tipo di Dato–Variabili Quantitative e Qualitative–Dati grezzi (Raw Data), –Dati Raggruppati (Distribuzione delle frequenze)–Dati Ordinati

Page 6: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Tipi di DatiQuantitativo

Continuo DiscretoPressione sanguigna, pH, [Na+], volume polmonare, altezza, peso, età, ecc..

Numero figli in una famiglia; frequenza degli attacchi d’asma; sedute terapeutiche; frequenza cardiaca; gg di assenza dal lavoro, ecc..

Qualitativo o CategoricoOrdinale Nominale

Stato del Paziente (MM, M, I, P, MP, D); stadio del Tumore (I, IA, II, IIA, …); grado di soddisfazione (Insufficiente, Sufficiente, Buono, …)

Sesso (M/F); stato civile (Ce, Nu, Co, Di); gruppo sanguigno (A, B, AB, 0); Vivo/Morto.

Variabile di Intervallo Variabile di RapportoVariabile ordinale con intervalli costanti e “zero” arbitrario. Stadio della patologia: pari gravità fra I e IA, IA e II,…; Quoziente di intelligenza (QI). Soglia di povertà.

Variabile di Intervallo con “zero” rappresentativo. Variabile quantitativa

Page 7: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Diagramma a Barre; Dot-PlotVariabili Qualitative o Categoriali

• Ciascuna domanda è un esperimento; la risposta il risultato dell’esperimento.

• Variabile categorica: il corso. Osservazioni: No. studenti

• Tab. 2-1 distribuzione delle frequenze.

• I grafico a barre è una rappresentazione grafica della distribuzione delle frequenze

Esempi: Anagrafe.xls

Page 8: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Istogramma, PoligonaleVariabili Quantitative

FIGURA 2-5Istogramma con il No. di attività seguite dai 100 studenti del DU per Infermiere

•Variabile quantitativa Discreta– Dati grezzi Ordinati per

Rango– Individuazione delle Classi

•Frequenza e Fr. Cumulativa per Classe

•Istogramma e Poligono– No. Studenti Altezza barra– Barre Contigue– Poligono Valori ContinuiEsempi: Tirocinio, EsStatDesc,

StudentiSM

Page 9: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Diagramma Gambo-Foglia

Concentrazione urinaria di Pb in 15 bambini di un insediamento residenziale (mol/24h).

0.6 2.6 0.1 1.1 0.4 2.0 0.8 1.3 3.2 1.7 1.9 1.9 1.5 2.2 1.2

Gambo

Foglie

0 1 4 6 8

1 1 2 3 5 7 9 9

2 0 2 6

3 21.Intervallo. Min=0.1, Max = 3.62.Gambi. [Pb] per unità discrete: 0, 1, 2, 3 mol/24h3.Foglie. Decimali della [Pb] in [0.1, 0.9], [1.0, 1.9], [2.0, 2.9], [3.0,

3.9]

Lo Steam-Leaf display (Tukey 1977), è una Tabella con l’aspetto di un Istogramma che mantiene il dettaglio dei valori originali.

Indici di tendenza centrale, dispersione e posizione.Mediana = 1.5; valore centrale (8°); Range = Max - Min = 3.5. Quartili: Q1 = 0.8 (4° valore), Q2 = 1.5 (8° valore), Q3 = 2.0 (12° valore)

Procedura in 3 passi 1.Intervallo. Valori Max e Min

2.Gambi. Classi di valori che sintetizzano i dati.

3.Foglie. Valori misurati in modo ordinato. Esempi:

DurezzaPunte

Page 10: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Pie-Charte (Torta)Pie Chart. Confronta il contributo di ciascuna categoria rispetto al totale. È formato da un cerchio (Totale) la cui area è suddivisa in settori di area è proporzionale al Singolo Contributo. L’area di ciascun settore è pari a (Singolo Contributo/Tot)*360; la somma dei settori è pari all’area del cerchio

Ex. Pre Iscrizioni ai C.d.L. Triennali.

Esempi: AnalisiDS1

Scienze di Base7%

Medico Sanitario

17%

Ingegneria17%

Altri39%

Economia20%

Page 11: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Indicatori Riassuntivi1. Notazioni

• Data-Set, Singolo Dato, Sommatoria, ….2. Indicatori di Tendenza centrale

• Media, Mediana e Moda.3. Indicatori di Dispersione

• Intervallo Minimo-Massimo (Range),

• Intervallo Interquartile (IQR),

• Varianza e Deviazione Standard.4. Indicatori di Asimmetria e Forma

• Skewness e Curtosi5. Indicatori di Posizione

• Quartili, Percentili, Rango Percentile.6. Esempi

Page 12: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Notazioni Algebriche

• Data-set X: insieme di valori risultato di un’analisi, di un esperimento, di un questionario, ….

– [Pb] Urinaria nei bambini in M/24h. Insediamento Urbano.

– X={0.6, 2.6, 0.1, 1.1, 0.4, 2.0, 0.8, 1.3, 3.2, 1.7, 1.9, 1.9, 1.5, 2.2, 1.2}

• Singolo dato Xi ; X1 = 0.6; X12 = 1.9 M/24h

• Dimensione: numero di valori (soggetti) nel data-set

– popolazione N, campione n, (n =15), più campioni nj , j=1,2,

..

– somma dei valori ([Pb] totale nei 15 soggetti)

n

iiX

1

Page 13: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Indici di Tendenza CentraleMedia, Mediana, Moda

•La Mediana è il valore che separa il data-set in due parti uguali: metà delle osservazioni e inferiore alla mediana, l’altra metà è superiore alla mediana

–n dispari valore centrale; n pari media dei valori centrali

–Regola generale: valore in posizione (n+1)/2 •La Moda è il valore del data-set (o la categoria) che si

presenta con maggiore frequenza

n

i

•La Media Aritmetica o Media è l’indice di tendenza centrale “tipico”, utilizzato per descrivere un data set Quantitativo, (Qualitativo con valori di Intervallo o di Rapporto).

–Popolazione ; Campione

N

Xi

1

X

X

n

n

ii

1

Page 14: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Uso di Media e Moda

Attività di Tirocinio degli studenti

Gruppo 1: n1= 100; X = 3083; X = 30.83

Gruppo 2: n2= 100; X = 4583; X = 45.83

Gruppo 3: n3= 50; X = 2291; X = 45.82Esame di Analisi superiore. Test

di metà semestre. Valutazioni: A, …,D….

La valutazione assegnata agli studenti ha una distribuzione bimodale; le mode sono i giudizi (A) e (D)Esempi: Tirocinio, EsStatDesc

Page 15: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Confronto fra Ind. Pos. Cent.

[Pb] urinaria mM/24h A) Urbano nA=15, B) Extraurbano nB=16

A={0.1, 0.4, 0.6, 0.8, 1.1, 1.2, 1.3, 1.5, 1.7, 1.9, 1.9, 2.0, 2.2, 2.6, 3.2}

B={0.2, 0.3, 0.6, 0.7, 0.8, 1.5, 1.7, 1.8, 1.9, 1.9, 2.0, 2.0, 2.1, 2.8, 3.1, 3.4}

•Media Aritmetica: XA= 1.49; XB= 1.68 M/24h

•Mediana: A) n=15 MedA = 1.5; B) n=16, MedB = (1.8+1.9)/2=1.85;

•Moda: A) Moda = 1.9; B) Moda = 1.9, 2.0•La Media dipende dai valori Estremi (Outliers)

C = {0.1, 0.2, 0.4, 1.1}; D = {0.1, 0.2, 0.4, 1.1, 21.9};

XC= 0.45, XD= 4.74 M/24h; MedA = 0.3, MedB = 0.4 M/24h

Esempi: Tirocinio, StDescrittiva_Pb

Data set qualitativo: quale indice di posizione centrale utilizzare?

Page 16: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Indici di DispersioneUna misura di dispersione indica quanto vicino si

posizionano (raggruppano), i valori presenti nel data-set, intorno ad una misura di tendenza centrale.

•Intervallo minimo-massimo (100% dei dati)

Range = Massimo - Minimo

•Intervallo interquartile (50% dei dati)

IQR = Q3 - Q1= 1° Quartile – 3° Quartile

N

x

N

XXMDMedioScarto

i

•Scarto Medio. Somma degli scarti intorno alla media

•Varianza e Deviazione Standard

2

2

2 ;1

ssn

XXs i

2

2

2 ;

N

XX i N, n-1 ?

Page 17: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Dispersione

Pause X - X | X - X| (X - X)^2 1 1 -8 8 64 2 3 -6 6 36 3 4 -5 5 25 4 7 -2 2 4 5 9 0 0 0 6 9 0 0 0 7 11 2 2 4 8 12 3 3 9 9 16 7 7 49 10 18 9 9 81

Somma 90 0 42 272

No. pause caffè in un giorno lavorativo • N = 10 ;

• X = 90

• X = X / N = 9

• (X – X) = 0

• |X – X| / N = 4.2

• (X – X)2 / N = 27.2

• s = 27.2 = 5.2

• La media è il baricentro dei valori di X la somma delle differenze rispetto alla media é = 0.

• La somma delle differenze in valore assoluto o delle differenze elevate al quadrato è un valore > 0.

•Scarto medio MD=|X-X|/N e varianza s2 =(X-X)2/N calcolano la distanza media di Xi dalla

media X.

• La deviazione standard s è la distanza media di ciascun valore dalla media in unità di misura di XiEsempi: Tirocinio, StDescrittiva_Pb

Page 18: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Asimmetria e Curtosi

La curtosi descrive quantitativamente il grado di appiattimento della curva

Curve simmetrica

A.Mesocurtica

B.Leptocurtica

C.Platicurtica

Il grado asimmetria (skewness) descrive quantitativamente la dispersione dei valori a Dx e Sx della media.

•Asimmetrica verso Dx o positiva

•Asimmetrica verso Sx o negativa

Page 19: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Uso degli Indicatori

Esempi: Studenti Note: Indicatori di Asimmetria e Forma

Page 20: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Box-and-Wiskers plotIndicatori di Posizione per Dati Ordinati

•Minimo e Massimo •Percentili

•Quartile Q1, Q2 (Mediana), Q3

•Rango percentile

Esempi: dboxp_Pb, durezzabox

Page 21: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Uso Ind. Posizione Lunghezza 91 169 305 330 389 393 394 402 410 420

449 452 455 459 465 468 471 472 474 475479 481 485 486 487 505 508 509 511 512517 519 530 537

n 34Minimo 91

Massimo 537Intervallo 446

Q1 412.5Q2=Mediana 471.5

Q3 500.5IQR 88

lover inner fence 280.5upper inner fence 632.5

lover outer fence 148.5upper outer fence 676.5

Esempi: Iris Flowers; Molluschi

•Il 50% dei valori è racchiuso in IQR;

•Valore anomalo (169) < Q1 – 1.5*IQR

•Valore Estremamente Anomalo (91) < Q1 –3*IQR

Page 22: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Statistica DescrittivaStrumenti di Calcolo

A. Funzioni predefiniti di Excel

B. Work-book Analisi dei Dati

C. Add-In XLStat

Page 23: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Funzioni Statistiche Predefinite

•Statistica descrittiva•Frequenza, Indicatori, …

•Distribuzioni Probabilità•Dirette e Inverse

Page 24: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Work Book ANALISI DATI

Esempi: Tirocinio, Molluschi

Page 25: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

XLStat

Page 26: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Probabilità

Probabilità. Valore numerico che da informazioni sulla verosimiglianza che un dato evento possa o non possa accadere in rapporto agli altri eventi.

La probabilità di un evento è un valore compreso fra 0 ed 1; ad un evento certo si assegna il valore P(E)=1, ad un evento impossibile il valore P(E)=0

0 P(E) 1; 0 P(A) 1

La somma delle probabilità degli eventi semplici di un esperimento è sempre uguale a 1

P(E) = P(E1) + P(E2)+…+ P(E4) =1

Spazio dei campioni S, Evento E

•Lancio di un dado a 4 facce. Esperimento S={E1, E2, E3, E4} = {1, 2, 3, 4}

•S = spazio dei campioni campionario; Ei = eventi, osservazioni, risultati.

•Evento semplice A={1,2, 3, 4}; Eventi composti A={Pari}; B={Dispari}

•Qual è la probabilità che il risultato del lancio sia

•Esattamente uguale a 1, P(Ei=1)?

•Sia un numero pari, P(A) = P(Ei = 2 oppure Ei = 4) ?

Page 27: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Calcolo delle ProbabilitàApproccio teorico

Lancio di un dado onesto a 4 facce: P(Ei)=1/4 ; P(A)=P(pari) = P(dispari) = 1/2

Eventi equiprobabili. Due o più eventi che hanno la medesima probabilità di verificarsi sono detti equiprobabili.

Numero Totale degli Eventi

Numero di Eventi AAP

Numero Totale degli Eventi EP i

1

Esempi.

Lancio di una moneta bilanciata: P{Testa}=?; P={Croce}=?. 

Associazione con 100 iscritti 40 Donne e 60 Uomini. Si elegge il presidente per estrazione casuale di un nominativo: P{Donna}=?; P={Uomo}=?.

Page 28: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Calcolo delle ProbabilitàApproccio empirico

Frequenza relativa

Tentativi di Corteggiamento

Motivo Tentativi Successi % Successo

A Fisico 10 3 30.00

B Intelligenza 12 5 41.67

C Ricchezza 5 1 20.00

D Disperazione 23 21 91.30

Totale 50 30 60.00

Totale

ASuccessiAP

I valori calcolati della probabilità P possono essere utilizzati per fare previsioni solo assumendo che nulla sia cambiato.

N

Frequenza AAP

Famiglie che possiedono la casa in cui abitano

Evento Frequenza Fr.Relativa

Proprietario 630 0.63

Inquilino 370 0.37

Totale 1000 1.00

Legge dei grandi numeri. Se un esperimento è ripetuto molte volte la probabilità calcolata come frequenza relativa approssima il valore della teorico della probabilità

Page 29: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Calcolo delle ProbabilitàEventi mutuamente esclusivi. Due eventi X ed Y sono mutuamente

esclusivi se l’occorrenza dell’uno esclude l’occorrenza dell’altro.

•Esempi: A) Espressione di voto: partito D o partito S. B) Acidosi ed alcalosi respiratoria (?). C) dolore toracico: riflusso gastro-esofageo o sospetto infarto (?).

Eventi Condizionati. Due eventi X ed Y sono condizionati se il verificarsi di Y dipende da X o il verificarsi di X dipende da Y.

•Probabilità che 5 sia il risultato del lancio simultaneo di due dadi

–N = 36 eventi possibili: A={1,2,3,4,5,6}; B={1,2,3,4,5,6};

–P(E) = 1/36

–P(5) = P(1 e 4) + P(2 e 3) + P(3 e 2) + P(4 e 1) = 4/36= 11.1%

•Probabilità 5 che sia il risultato del lancio del secondo dado B se il dado A ha dato valore 1

–N = 6 eventi possibili: A={1}; B={1,2,3,4,5,6};

–P(E) = 1/6

–P(5) = P(B|A) = 1/6= 16.7%

•ESEMPI: A) Aspettativa di vita media (luogo e anno di nascita, sesso, razza, …); B) Successi nel corteggiamento; C) Orario di Lavoro

Page 30: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Calcolo delle ProbabilitàEventi mutuamente esclusivi e proprietà additiva della

probabilità

Ricoverati Medicina I VPA, UII, SIS patologie mutuamente esclusive

Probabilità che il prossimo ricoverato sia affetto da VPC o UII? Eventi mutuamente esclusivi

P(VPC o UII) = P(VPC) + P(UII) = 0.40 o 40%

Se X ed Y sono eventi mutuamente esclusivi la probabilità che accada X o Y è la somma della probabilità P(X) più la probabilità P(Y)

P(X o Y) = P(X) + P(Y)

Esempio. Nel lancio di una dado a 6 facce: P(pari) = P(2) + P(4) + P(6).

Page 31: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Calcolo delle ProbabilitàEventi condizionati e proprietà moltiplicativa della

probabilità

Ricoverati Medicina I VPA, UII, SIS patologie mutuamente

esclusive

•Calcolare la Probabilità che il prossimo ricoverato sia maschio e affetto da SIS?.

Probabilità condizionata

A)Calcolo della Tabella per 100 pazienti

48 uomini ricoverati per SIS. P(U|SIS) = 48%

B)Totali di Riga e di Colonna. Dati marginali

• P(SIS) = 60/100

• P(U) = 48/60

• P(U|SIS) = 60/100 x 48/60 = 0.48

Proprietà Moltiplicativa. Se X ed Y sono eventi legati, la probabilità che accadano entrambi gli eventi è data da

P(X e Y) = P(X) x P(Y|X)

Esempio: Orario di Lavoro

Page 32: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Calcolo delle ProbabilitàEventi Indipendenti e Complementari

Test di Laboratorio. Falsi Positivi

Evento indipendente

S = {N, P}; N = Negativo; P = Positivo

P(P)=0.05; P(N)=0.95; P(P)+P(N)=1

Il medico ha richiesto 3 esami, qual’è la probabilità che si verifichi almeno un falso positivo?

Evento complementare

P(Almeno 1 sia P) = 1 – P(Nessuno P)

Nessun esame P equivale ad ottenere 3 esami con esito N.

P(Nessuno P) = P(N) x P(N) x P(N) = 0.953

P(Almeno 1 sia P) = 1 – 0.953 =0.857

Page 33: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Distribuzione NormaleDistribuzione Normale o di Gauss. Curva a

campana

•Le variabili casuali sono distribuite secondo la Normale?

–Si. Misura di Peso e Altezza. Valore della Pressione Arteriosa in soggetti normali. Tempo del percorso Automobilistico casa-Lavoro. Parametri di un processo industriale in “controllo”, ecc.

–No. Aspettativa di vita media. Tempo di remissione di una malattia, Efficienza di una apparecchiatura elettronica. Opinioni espresse in un questionario, ….

–Non è possibile determinarlo test di normalità

•La media campionaria X é distribuita secondo la Normale

–Qualunque sia la distribuzione originale della variabile (X) presa in esame, se prendiamo M di campioni di dimensioni ragionevoli (n), e costruiamo la distribuzione di probabilità delle medie campionarie , Xi i=1,2, …, M, questa distribuzione è normale

Page 34: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

La curva NormaleProprietà della Normale

1. Media, mediana e moda hanno il medesimo valore

2. La curva è simmetrica rispetto alla media : simmetria = 0; curtosi = 0

3. La curva è asintotica all’asse delle X

4. L’area al di sotto della curva Normale è uguale a 1.•L’area sottesa alla Normale fra X= ed X=1 è pari al 34.1%

dell’area totale

–L’area sottesa alla Normale fra X=1 ed X=1 è pari al 68.2% dell’area totale

•L’area sottesa alla Normale fra X= ed X=2 è pari al 47.7% dell’area totale

–L’area sottesa alla Normale fra X=2 ed X=2 è pari al 95.4% dell’area totale

–L’area sottesa alla Normale fra X=-3s ed X=3s è pari 99.8% dell’area totale

-3-4

Page 35: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Distribuzione Normale standardDistribuzione con media 0 e Deviazione Standard 1, ottenuta dalla

trasformazione della variabile casuale X in unità di deviazione standard (variabile z).

No. Pause caffè. X = 9, s=5.22

X 1 3 4 7 9 9 11 12 16 18

z -1.53 -1.15 -0.96 -0.38 0.0 0.0 0.38 0.57 1.34 1.72

s

XXiz

variabile z:

sz

X s) – X – –

X = X s :

5.22z

X = X = 9 :

Reparto A: X = 9; s = 5.22

NB. Se X = 3.5; s = 2.71, o z-score per X = X ed X = X s non cambia

Dati z = – 0.8, X = 3.5 ed s=2.71 è possibile calcolare X: X = zs+X = 5.7

Page 36: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Tabella della Curva Normale

Calcolo dell’Area (Probabilità) nota z. L’Area al di sotto della normale standard per valori di z = 0 e z = 1.95. Il valore z = 1.95 è diviso in una radice 1.9, intero e I decimale, ed il II decimale 0.05. Individuiamo 1.9 nella colonna etichettata z e seguendo la riga z=1.9 individuiamo la colonna etichettata 0.05. Il valore individuato dalla intersezione fra la riga 1.9 e la colonna 0.05 è l’area sottesa nell’intervallo [0, 1.95] ed è pari a 0.4744. Calcolo di z nota l’area o Probabilità. Valore di z per il quale l’area sottesa dalla Normale standard compresa fra 0 e z è pari 0.4251. Il valore dell’area 0.4521 all’interno della tabella è l’intersezione di una riga ed una colonna dalle quali si ricava la radice ed il II decimale dello z-score. Dalla Tabella 6.4 si ricava facilmente che l’area pari a 0.4251 è compresa nell’intervalli z=0, z=1.44. Calcolo di X data l’area e noti X ed s. Dal valore di z-score è possibile risalire al valore di X noti il valore medio e la deviazione standard della distribuzione normale:

X = zs + X

Page 37: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Esempio di Uso della NormaleIndagine sull’uso di un Sistema contraccettivo: n = 2000 persone, media

annuale X= 100, s =15.

A) Quante persone usano questo metodo almeno 115 volte all’anno?

00.1

15

100115

z

Area colorata = 0.5000 + 0.3413

84% delle persone usa il metodo al più 115 volte in un anno. B) Quante persone usano questo metodo meno (al più) di

70 volte all’anno?

-2.00

15

100 70

z

Area colorata = 0.5000 - 0.4772

2.28% delle persone usa il metodo meno 70 volte in un anno.

C) Quante persone usano questo metodo fra le 106 e 112 volte all’anno?

Area colorata = 0.2881 - 0.1544

13.3% delle persone usa il metodo fra le 106 e 112 volte in un anno.

z1= 0.40, z2= 0.80

Esempi: DN_Esempi, DN_Esercizi

Page 38: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Distribuzione BinomialeLa distribuzione binomiale mostra la probabilità che si verifichino diversi eventi casuali fra loro indipendenti, ognuno dei quali può assumere solo uno fra due valori diversi: Successo o Fallimento.

Infilare le scarpe correttamente. S={Giusto, Sbagliato}. Supponiamo che gli eventi siano indipendenti e che la probabilità di ciascun evento p=0.5. Un solo tentativo P(G) = P(S) = 0.5

•2 tentativi S={GG,GS,SG,SS}. P(SS)=P(S)xP(S)= 0.5*0.5=0.25; P(GS o SG) = 0.5

•3 tentativi S={GGG,GGS,GSG,SGG,SSG,SGS,GSS,SSS}

•10 tentativi, qual è la probabilità che 7 siano sbagliati e 3 giusti? Sviluppo Binomiale •Due Eventi: {Successo, Fallimento}

•Numero di tentativi n= 10

•Numero di risultati favorevoli r=7

•La probabilità di Successo p=0.5 e q = 1- p la probabilità di Fallimento

121!!!

!

nnndoveqpr

nqp

rnr

n rnrrnr

Esempio: Sviluppo_Binomiale

Page 39: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Proprietà della BinomialeInfezioni postoperatorie

1. n= 15 , p = 0.2, q = 1- p = 0.8

2. n = 15 ,p = 0.3, q = 1- p = 0.7

3. n = 30, p = 0.3, q = 1- p = 0.7

Media = np

Varianza = npq

Deviazione standard = npq

Esempio: Sviluppo_Binomiale

Page 40: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Binomiale e Normale

Per p=0.5 all’aumentare del numero di tentativi n la distribuzione binomiale tende alla distribuzione normale

Esempi: dbinomiale_forma, dbinomiale_esvolti

Page 41: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Statistica Inferenziale• Popolazione e Campione

• Inferenza Statistica– Verifica di significatività statistica

• Ipotesi zero H0 e Ipotesi alternativa H1– Inferenza statistica con Livello di Significatività

• Test a una coda e a due code• Errori tipo I (), Tipo II (), Potenza del Test• Intervallo di confidenza

Inferenza sulla media di popolazione – Dimensioni del campione: Test z e Test t. – Distribuzione Normale Standard e t-student

• Inferenza sulla differenza fra medie di popolazione – No 2 popolazioni: campioni indipendenti o appaiati– No k>2 popolazioni: Analisi della varianza ANOVA

• Test di Indipendenza e Omogeneità (2)

Page 42: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Basi della Statistica Inferenziale

A partire dall’analisi eseguita su un campione, la statistica inferenziale permette di dare indicazioni quantitative (calcolare media, varianza, …) sulla popolazione soggetto dell’indagine (target).

Popolazione e Campione

La stima della media (varianza, …) calcolata a partire da un campione estratto casualmente dalla popolazione che vogliamo esaminare, differirà dal valore vero della media di una piccola quantità, questa differenza è prodotta da una serie di eventi casuali.

Il caso produce differenze di entità diversa, quindi se confrontiamo due campioni questi sono sempre in una qualche misura diversi. Quindi, se non si considerano gli effetti dovuti al caso non è possibile

A.dedurre dal campione informazioni sulla popolazione

B.dedurre se i due campioni sono uguali entro le fluttuazioni

del caso. Esempio: Prova in Itinere

Page 43: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Teorema del Limite CentralePresa una serie di campioni di uguali dimensioni da una distribuzione

normale o non normale, la distribuzione delle medie di questi campioni sarà comunque normale purché la dimensioni del campione, n, sia “abbastanza” grande(*).

•Lancio un dado 600 volte la distribuzione dei valori è uniforme (LimCen)

•Lancio due dadi 2, 4, 8 volte per successivi 600 esperimenti e calcolo la media dei valori ottenuti in ciascun lancio. La distribuzione della media assume la forma di una campana all’aumentare della numerosità del campione

(*) Se la distribuzione è approssimativamente normale n può essere molto piccolo (n=5); se non è normale è consigliabile utilizzare campioni di dimensioni n 30.

Page 44: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Media di Popolazione Verifica d’Ipotesi

•Gli esami degli elettroliti eseguiti su un gruppo di “dirigenti sanitari” indicano che la [Na+] nel siero di un campione di 25 soggetti è pari a 138 mM/l. In letteratura è riportato che i valori di [Na+] nella popolazione hanno distribuzione normale con media =140 mM/l e =2.5 mM/l. Possiamo affermare che tutti i dirigenti sanitari soffrono di iponatriemia?

•Sulla etichetta di una lattina contenente una bibita analcolica è dichiarato un contenuto medio pari a 12 once (circa 330 ml). In un campione 100 lattine prelevate a caso si è riscontrato un contenuto medio medio di 11.89 once. Possiamo dedurre che tutte le lattine contengono meno di quanto dichiarato?

• La regione ha rilevato nel passato che le persone di età compresa fra 18-24 anni vanno dal medico in media 3.6 volte all’anno. Nel 2003 è stato messo in evidenza, su un campione di 350 giovanotti, che questi hanno consultato il medico in media X=3.9 volte con una deviazione standard di s=1.6. Possiamo affermare che tutte le persone di questa fascia di età hanno maggiore necessità del medico rispetto al passato?

•Una compagnia telefonica ha valutato che la durata media di una telefonata fuori distretto è pari a 12.44 minuti. Una verifica fatta su un campione di 150 telefonate ha messo in evidenza una durata media X=13.71 ed una deviazione standard s=2.65 minuti. Possiamo affermare che tutte le telefonate interurbane sono significativamente più lunghe di quanto rilevato in precedenza, ed è necessario aumentare le tariffe?

Page 45: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Verifica d’Ipotesi StatisticaData la stima (media campionaria X, differenza d= X1- X2, varianza s2) del

parametro di una popolazione (, , 2), si accetta il parametro come vero/falso confrontando il valore calcolato con una regione di evidenza sperimentale (intervallo di valori) che tiene conto dell’incertezza presente nella stima del parametro. La regione di evidenza sperimentale è caratterizzata una curva di distribuzione di probabilità: distribuzione normale, distribuzione t-student (, 1-2), distribuzione 2.

Data una Ipotesi Iniziale (H0) ed una Ipotesi Alternativa (H1), la regione di evidenza sperimentale é divisa in una regione di Non Rifiuto e una regione di Rifiuto; la separazione è eseguita a partire da una valore di probabilità detto livello di significatività del test. Scelto il valore di probabilità ad esso corrisponde un valore critico (limite) della statistica utilizzata per il test, z-limite (zc), t-limite (tc), 2-limite (c

2), che separa la regione di evidenza sperimentale in regione di Non Rifiuto e regione di Rifiuto di H0.

La regione di Rifiuto può essere a sinistra o a destra del valore critico (Test ad una coda); la regione di Non Rifiuto del test è posta al centro di due regioni di rifiuto del test (Test a due code). Dalla stima del parametro si calcola il valore della Statistica del Test (z0, t0, 2), se questo cade nelle regione di Non Rifiuto l’ipotesi H0 è accettata sulla base della evidenza sperimentale, se cade nella regione di Rifiuto è rigettata a favore di H1.

Page 46: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Ipotesi Nulla ed Alternativa

Non c’è sufficiente evidenza sperimentale per dire che l’etichetta dichiari il falso, quindi non rifiutiamo l’ipotesi nulla

C’è sufficiente evidenza sperimentale per dire che l’etichetta dichiara il falso, quindi rifiutiamo l’ipotesi nulla

Regione di non rifiuto

Regione di rifiuto

Valore critico

Grado di evidenza sperimentale.

Valore critico di separazione una regione di non rifiuto ed una regione di rifiuto

L’evidenza sperimentale è il valore della media campionaria X, cioè una variabile casuale distribuita secondo la distribuzione di probabilità normale.

Controllo di qualità sul contenuto della lattina di soda. Il contenuto medio corrisponde a quanto dichiarato? Possiamo dedurre che l’etichetta dichiara il vero?

Ipotesi nulla: H0: 12 once

Ipotesi alternativa: H1: < 12 once

Ipotesi Nulla H0. Assumiamo che le lattine contengano quanto dichiarato. L’asserzione fatta considerata vera sino a che l’evidenza sperimentale non la contraddice

Ipotesi Alternativa H1. Se l’evidenza sperimentale dimostra che H0 è falsa si assume che sia vera l’ipotesi alternativa, H1, cioè che le lattine contengano meno di quanto dichiarato

Page 47: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test a due code. Nel 1998 la famiglia media americana era composta da 3.18 unità. Attualmente la sua dimensione è variata?

H0: =3.18 dimensione media invariata

H1: 3.18 dimensione media variata

Verifichiamo se la dimensione media è aumentata o diminuita, scegliendo due valori critici: c1 e c2 nella coda Sx e Dx che delimitano le regioni di rifiuto.

Test d’Ipotesi – Code del Test

Left-Tail Test. Quanto dichiarato sulla etichetta della lattina di soda corrisponde al contenuto medio dichiarato, o è inferiore?

H0: =12 il contenuto medio è pari a 12 once

H1: <12 il contenuto medio è minore di 12 once

Verifichiamo la correttezza del contenuto scegliendo un valore critico c nella coda Sx della distribuzione, valori di Xc cadono nella regione di rigetto

Right-Tail Test. Nel 2002 lo stipendio medio lordo di un insegnate di scuola era 28000€. Attualmente è aumentato?

H0: =28000€ è invariato

H1: >28000€ è aumentato

Verifichiamo la correttezza del contenuto scegliendo un valore critico c nella coda Dx della distribuzione, valori di Xc cadono nella regione di rigetto

Page 48: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test d’Ipotesi - ProceduraEsecuzione di un Test di Ipotesi. Un test di ipotesi statistica è una

procedura in cinque passi

1.Definire l’ipotesi nulla e l’ipotesi alternativa

2.Scegliere la distribuzione da utilizzare

3.Definire le regioni di rifiuto e di non rifiuto

4.Calcolare il valore della Statistica del test

5.Prendere una decisione

Esempio. Vogliamo verificare se l’età media degli studenti iscritti al C.d.L. in Medicina e Chirurgia è pari a 24 anni. Valore stimato X = 25.2 anni, test a due code.

1)H0 = 24 l’età media non è variata, H1 24 l’età media è variata

2)Gli studenti sono n=500 cioè il campione ha grandi dimensioni, ed utilizziamo la Normale standard

3)Scelgo quale livello di affidabilità del test; individuo l’area nella coda Dx e Sx della distribuzione

4)Calcolo il valore della Statistica del Test

5)Il valore della Statistica del Test cade nella regione di rifiuto o di non rifiuto?

Page 49: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test d’ipotesi per la media Grandi Campioni – Test z

Per il teorema del limite centrale la distribuzione della media campionaria X è approssimativamente normale per n30.

Statistica del Test. Nel Test d’ipotesi per grandi campioni (n 30) la variabile casuale z0 è detta Statistica del Test.

La Statistica del Test è il criterio in base al quale accettiamo o rifiutiamo l’ipotesi H0.

Xn

ss

n

s

Xz

Xz

XX

XX

diStandardDeviazionelaèedove

notaènonsenota;èse

,

,,

Esempio 1. Durata delle Telefonate Interurbane. Test a due code con =0.05

Esempio 2. Iponatriemia dei dirigenti. Test ad una coda (Sx) con =0.01

Page 50: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Statistica z. Test d’ipotesi per

Esempio 1. Una compagnia telefonica ha valutato che la durata media di una telefonata fuori distretto è pari a 12.44 minuti. Una verifica fatta su un campione di n=150 telefonate ha messo in evidenza una durata media X=13.71 ed una deviazione standard s=2.65 minuti. Possiamo affermare con livello di significatività =0.05 che la durata media delle telefonate è significativamente cambiata?

1.H0: = 12.44; H1: 12.44

2.Usiamo la distribuzione normale (n30)

3.Regione di Rifiuto e Non rifiuto.

• Livello di significatività del test = 0.05

• Test a due code zc=±1.96

4.Valore della statistica test z0 = 5.87

5.Rifiuto H0:

22.0150

65.2

87.522.0

44.1271.13

0

0

n

ss

s

Xz

X

X

ll valore della statistica del test z=5.87 è molto maggiore del valore critico zc2 =1.96 che delimita la regione di rifiuto nella coda di Dx, quindi rifiutiamo H0 e diciamo che, sulla base dell’evidenza sperimentale, la lunghezza media delle telefonate interurbane non è uguale a 12.44 minuti.

Esempio: Telefono

Page 51: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Piccoli Campioni n < 30 Verifica d’ipotesi per la media di

popolazioneNel caso in cui il campione sia di piccole dimensioni (n<30), che la

distribuzione di X sia approssimativamente normale e la deviazione standard s non nota, è sempre possibile eseguire la verifica di ipotesi per la media della popolazione utilizzando la distribuzione t-Student

Statistica del Test. Nel Test d’ipotesi per la media campionaria X nel caso in cui n <30 la Statistica del Test è rappresentata dalla variabile casuale t

n

ss

s

Xt X

X

dove,

Distribuzione t-Student (1, 2) (W. S. Gosset nel 1908 )

Simulazione: Verifica d’Ipotesi

Page 52: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

La distribuzione-t ha code più alte, fianchi più stretti e varianza maggiore rispetto alla Gaussiana standard:

all' aumentare dei gradi di libertà la distribuzione "t" di Student tende rapidamente alla Gaussiana standard

x

s/ n

~ t di Student (con =n-1 g.d.l.)

0

0.1

0.2

0.3

0.4

-8 -6 -4 -2 0 2 4 6 8

f(t)

t di Student (n=2)

l l

1.891.28 t

gaussiana

p=0.1

p=0.1

Page 53: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Statistica t. Test d’ipotesi per Uno studio pubblicato di recente da una rivista di Psicologia ha dimostrato

che l’età media alla quale i bambini iniziano a camminare è 12.5 mesi. Da un campione di n=18 bambini degli asili nido della città si è calcolato che l’età media dei primi passi è X=12.9 mesi con una deviazione standard s di 0.8 mesi. Possiamo dire con un livello di significatività = 1% che il valore di X è diverso dal dato pubblicato.

1.H0: = 12.5; H1: 12.5

2.Usiamo la distribuzione t con df = n -1 = 17

3.Regione di Rifiuto e Non rifiuto.

• Livello di significatività del test = 0.01

• Test a due code zc1=-2.898, zc2=+2.898

4.Valore della statistica test t = 2.12

5.Accetto H0: Il valore della statistica del test t=2.12 cade fra i punti critici zc1 e zc2 cioè

nella regione di Non Rigetto. Quindi l’evidenza sperimentale non ci permette di rigettare H0 e affermiamo che la differenza fra media campionaria X=12.9 e media di popolazione =12.5 è piccola ed è dovuta ad errori di campionamento.

Esempio: Primi passi

19.018

8.0

12.219.0

5.129.12

X

X

s

s

Xt

Tabella della Distribuzione t

Page 54: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Rapporto Segnale RumoreLa sostanza di una verifica di ipotesi statistica sta nell’assegnare una

probabilità ad una quantità che chiamiamo rapporto segnale rumore: il segnale è una quantità legata alla differenza media campionaria (X) e media della popolazione (); il rumore è una quantità che indica la variabilità delle osservazioni tra gli individui appartenenti al medesimo campione.

Segnali provenienti da un satellite ai quali si sovrappongono rumori casuali di diversa natura. Segnale media +1.1 V, Rumore media +0.7 V: il “blip” ha un valore intermedio fra questi due

1.Abbiamo creduto di ascoltare il segnale che non c’era

2.Abbiamo creduto di ascoltare il segnale che c’era effettivamente

3.Abbiamo ritenuto che non ci fosse alcun segnale quando invece c’era effettivamente

4.Non abbiamo sentito alcun segnale ed effettivamente non c’era alcun segnale

rumore

segnale

ns

X

Page 55: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Errore Tipo I () e Tipo II ()

1. Il contenuto della lattina è in media pari a 12 once, il campione esaminato ha media campionaria pari a 11.83 once e quindi correttamente accettiamo H0

2. Il contenuto della lattina è in media inferiore a 12 once ma il campione estratto ha media campionaria pari a 12.36 once ed erroneamente non rifiutiamo H0

L’errore di Tipo II è l’errore commesso quando una ipotesi nulla falsa è non rigettata. Il valore rappresenta la probabilità di commettere un errore di Tipo II.

= P(H0 è non rifiutata | H0 è falsa)

Il valore 1- è detto Potenza del test e rappresenta la probabilità di non commettere un errore di Tipo II

L’errore di Tipo I è l’errore commesso quando una ipotesi nulla vera è rigettata.

= P(H0 è rifiutata | H0 è vera)

Il valore è detto livello di significatività del test, e rappresenta la probabilità di commettere un errore Tipo I

1. Il contenuto della lattina è in media 12 once, ma la media del campione analizzato è minore del valore dichiarato ed erroneamente rifiutiamo H0

2. Il contenuto della lattina è realmente inferiore a 12 once, la media del campione esaminato lo ha messo in evidenza e correttamente rifiutiamo H0

H0: 12; H1: 12

Page 56: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Errori e - Potenza del Test

Ridurre la probabilità di commettere un errore di Tipo I o II?

Gli errori che si possono verificare in un test di ipotesi, errori di Tipo I e di Tipo II sono fra loro dipendenti.

In un test di ipotesi eseguito su un campione di dimensione pari ad n non è possibile diminuire simultaneamente i valori di e di : se diminuiamo il valore di contemporaneamente aumenta il valore di e viceversa.

Tuttavia, è possibile diminuire contemporaneamente i valori di e aumentando le dimensioni del campione.

Situazione Effettiva

H0 è vera H0 è falsa

Decisione

Non rifiuto H0

Decisione corretta

Errore Tipo II o

Rifiuto H0 Errore Tipo I o Decisione corretta

Page 57: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Errore - Conclusioni Errate

Gli esami degli elettroliti eseguiti su un gruppo di “dirigenti” indicano che la [Na+] nel siero di un campione di 25 soggetti è pari a 138 mM/l. Sapendo dalla letteratura che i valori della popolazione sono distribuiti secondo la normale con valore medio =140 mM/l e =2.5 mM/l, possiamo affermare che tutti i dirigenti soffrono di iponatriemia?

1.H0: Non c’è differenza; H1: C’è differenza

2.Usiamo la distribuzione normale (n=25)

3.Regione di Rifiuto e Non rifiuto.

• Livello di significatività del test = 0.05

• Test a una coda Sx

4.Valore della statistica test z = - 4.00

5.Rifiuto H0: C’e differenza! La probabilità di concludere che il campione deriva da

un’altra popolazione, cioè che esiste una differenza significativa quando questo non è vero (Errore Tipo I o Errore ) è pari al 5%.

Page 58: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Errore tipo e tipo Potenza del Test

Non possiamo conoscere la distribuzione alternativa ma facciamo l’ipotesi che il campione “dirigenti” provenga da una popolazione con media 137.5mM/l e =2.5.

L'area della campana di Sx a destra di zc si protrae sotto la curva di H0, questa è il valore di probabilità dell’errore di Tipo II o , cioè di dichiarare che non c’è alcuna differenza quando questa esiste.

= 0.16 La potenza del Test P = 1 –

La Potenza del Test è funzione delle dimensioni del campione n. Maggiore è il valore di n più elevata è la potenza del Test. Esempio: Dirigenti

1.H0: Non c’è differenza

2.Usiamo la distribuzione normale di Sx (n=25)

3.Regione di Rifiuto e Non rifiuto. = 0.05

4.Valore della statistica test z0 = 1.00

5.La [Na+] media rilevata nel campione è la medesima misurata nella popolazione dei dirigenti

Rifacciamo il Test di ipotesi per H1

Page 59: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Confronto fra MedieVerifica d’Ipotesi

•La Regione ha rilevato che lo stipendio medio lordo annuale dei Radiologi e dei Chirurghi è rispettivamente pari a 130000€ e 125000€ con s1=28000€ e s2=32000€; i valori sono ricavati da campioni di dimensioni n1=300 e n2=400. Possiamo affermare che le due categorie hanno la stessa retribuzione?

Farmaco n Latenza

XDev. St.

A 25 44 ore 11

B 23 49 ore 9

Prima 210 180 195 220 231 199 224

Dopo 193 186 186 223 220 183 233

•Per verificare l’efficacia di una dieta sul contenimento della pressione sistolica, un campione di adulti ipertesi è stato sottoposto a questo regime alimentare per tre mesi. La pressione sistolica in mmHg dei pazienti registrata prima e dopo la dieta è la seguente:

Possiamo affermare che la pressione sistolica dopo la dieta è in media più bassa? Con quale livello di significatività?

su due gruppi di pazienti ha dato i seguenti valori. Possiamo affermare che il farmaco A è più efficace del farmaco B?. Con quale livello di significatività

•Una casa farmaceutica ha dichiarato che il farmaco A, un analgesico da essa prodotto, agisce più rapidamente del farmaco B prodotto da una ditta concorrente. Un test eseguito

Page 60: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Una/Due Popolazioni

Una popolazione• Media • Deviazione standard• Stima di X; stima di s

• Dimensioni n• Errore standard

X = /n, sX = s/n

• Statistica del Test z0=(X – )/X ; z=(X – )/ sX

Due popolazioni• Media e ; Differenza • Deviazione Standarde • Stima X1 e X2, X1X2

• Dimensioni n1 ed n2

• Errore standard X1 = 1/n1, X2 = 2/n2

sX1 = s1/n1, sX2 = s2/n2

X1-X2 e sX1-X2 …. • Statistica del Test

Z0 = [(X1 – X2)-( – )] /X1-X2

Page 61: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Distribuzione campionaria di X1-X2

2121 XX

• Media

• Media

2

22

1

21

21 nnXX

•Teorema del limite centralePer campioni di grandi dimensioni n1 ed n2, la distribuzione della variabile casuale

differenza, X1–X2, ha approssimativamente la forma di una normale, indipendentemente dalla forma delle distribuzioni di X1 ed X2.

Se n1 ed n2 sono grandi, la differenza fra due variabili casuali , X1–X2,, è una variabile

casuale distribuita secondo la normale.

2

22

1

21

21 n

s

n

ss XX

• Deviazione standard

• Deviazione standard campionaria

Page 62: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test di Ipotesi su 12 Campioni Indipendenti – n1>30, n2>30

1.H0: - H1: -

2.Distribuzione normale

3.Regione di Rifiuto e Non rifiuto.

= 0.01, = 0.005

• zc1 = -2.58, zc2 =+2.58

4.Valore della statistica test z0 = 2.20

5.Non Rifiuto H0: -

•La Regione ha rilevato che lo stipendio medio lordo annuale dei Radiologi e dei Chirurghi è rispettivamente pari a 230000€ e 225000€ con s1=28000€ e s2=32000€; i valori sono ricavati da campioni di dimensioni n1=300 e n2=400. Possiamo affermare con livello di significatività =0.01 che le due categorie hanno la stessa retribuzione?

50.22742

22

1

21

21 n

s

n

ss XX

20.2

50.2274

022500023000021

21210

XXs

XXz

Esempio: DifferenzaMedie

Page 63: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test su 12 - Campioni Indipendenti

(n1<30, n2<30; distribuzione t) – 1 = 2 , non note

Deviazione standard raggruppata. Possiamo raggruppare le deviazioni standard dei campioni. La deviazione standard raggruppata (pooled) sp è

Dati n1,n2 ed s1,s2 le dimensioni e la deviazione standard dei campioni, i valori n1-1 ed n2-2 sono rispettivamente i gradi di libertà del I e del II campione; ed il valore n1+n2-2 indica i gradi di libertà dei campioni raggruppati

2

11

21

222

211

nn

snsnsp

Deviazione standard di X1-X2. Data la deviazione standard raggruppata, sp, la stima della deviazione standard campionaria sX1-X2 è data dalla formula.

21

1121 nn

ss pXX

Statistica di test t per X1-X2. La statistica di test t è data dalla formula a lato e stima il rapporto Segnale/Rumore. Il valore 1-2 è sostituito dalla ipotesi nulla.

21

2121

XXs

XXt

Page 64: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test d’ipotesi su 12 con 1=2

Vogliamo verificare il contenuto calorico di due bibite dietetiche. I campioni hanno dimensioni n1 = 14 ed n2 = 16, i valori di media e deviazione standard campionaria sono rispettivamente: X1= 23, s1 = 3 e X2= 25, s2 = 4. Il livello di significatività richiesto è = 0.01.

1.H0: - H1: -

2.Distribuzione t

3.Regione di Rifiuto e Non rifiuto.

= 0.01, = 0.005

Gradi di libertà n1+n2-2=28

tc1 = -2.763, tc2 =+2.763

4.Valore della statistica test t = -1.531

5.Non Rifiuto H0. Il contenuto di calorie è il medesimo

57.3

28

161169114

ps

16

1

14

157.3

21 XXs

531.1

31.1

02523

t

Esempio: DifferenzaMedie

Page 65: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test su 12 - Campioni Indipendenti

n1<30, n2<30 – 1, 2 diverse e non note

Gradi di libertà. Se i campioni di dimensioni n1<30, n2<30 provengono da distribuzioni

approssimativamente normali con 1 2 non note,

la distribuzione t che descrive la differenza fra le medie ha gradi df di libertà.

Dati n1, n2, ed s1,s2 rispettivamente le

dimensioni e la deviazione standard dei campioni, le quantità n1-1 ed n2-1 sono i gradi di libertà del I e e

del II campione.

2

2

2

2

2

1

1

1

2

2

22

1

21

11

11

ns

nns

n

ns

ns

df

Deviazione standard di X1-X2. Data la

deviazione standard raggruppata, sp, la stima della

deviazione standard campionaria sX1-X2 è data dalla

formula.

2

2

1

2

21

21 n

s

n

ss XX

Statistica del test t per X1-X2. La statistica di test t è data dalla formula a lato ed è una stima del rapporto Segnale/Rumore. Nella formula il valore 1-2 è sostituito dalla ipotesi nulla.

21

2121

XXs

XXt

Page 66: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test su 12 - Campioni Appaiati

Campioni appaiati. Due campioni A e B sono detti appaiati quando ciascun valore di A ha un valore corrispondente in B, ed entrambi questi valori provengono dalla medesima sorgente.

1.Calo del peso corporeo di 15 persone che seguono una dieta mirata ed eseguono attività fisica: il data-set A = {15 valori del peso rilevati prima della dieta}; il data-set B = {15 valori del peso rilevati dopo la dieta}.

2.Produzione di patate in q/ht ottenuti da 10 appezzamenti di terreno trattati con il fertilizzante A ed il fertilizzante B: gli appezzamenti sono stati divisi in due parti. I Data set sono composti da A={10 valori di q/ht}; B={10 valori di q/ht}.In campioni appaiati la differenza fra i due valori associati al medesimo soggetto è detta differenza appaiata ed è indicata con d. Poiché il numero dei valori in A e B è il medesimo consideriamo i valori della differenza d come un unico campione ed eseguiamo il test di potesti ponendo quale ipotesi zero una condizione sui valori della distanza d.

Page 67: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Differenze appaiate dCon differenze appaiate d si indicano i valori di una variabile casuale

calcolata come differenza fra le coppie di valori presenti nei due campioni. Dati i campioni appaiati A e B, di dimensioni n, il campione con le differenze d ha dimensioni n e gradi di libertà n-1. Indichiamo con

―d e d la media e la deviazione standard della popolazione differenze appaiate

―d e sd la media e la deviazione standard del campione delle differenze appaiate

A. Se n è grande (n30), per il teorema del limite centrale la distribuzione campionaria di d è approssimativamente normalecon media d=d e deviazione standard d = d/n. La distribuzione normale standard descrive i valori della distanza d e per la verifica di ipotesi si usa il test z.

B.Se n è piccolo (n<30), d è non nota, e la popolazione delle differenze d è approssimativamente normale, per fare una inferenza statistica sulla media delle differenze si utilizza la distribuzione-t. In questo caso il valore di sd = sd/n è una stima della deviazione standard campionaria.

n

ss

n

nn

dd

sn

dd

dd

dddd

d

;

1;

2

2

Page 68: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test d’ipotesi sulla media d•Per verificare l’efficacia di una dieta sul contenimento della pressione

sistolica, un campione di adulti, sospetti ipertesi, è stato sottoposto a questo regime alimentare per tre mesi. La pressione sistolica in mmHg dei pazienti registrata prima e dopo la dieta è indicata in tabella; con livello di confidenza pari al 5% possiamo concludere che la media delle differenza appaiate è diverso da zero cioè che la dieta è efficace?

Prima

Dopo d d 2

210 193 17 289

180 186 -6 36

195 186 9 81

220 223 -3 9

231 220 11 121

199 183 16 256

224 233 -9 81

d=35d

2=873

08.4779.10

79.106

735873

1

57

35

222

nss

n

ndds

n

dd

dd

d

Esempio: Appaiati

–H0: d=0; H1: d0

–n=7 distribuzione t con df=n-1 = 6

–= 0.05; = 0.025; tc= 2.447

–Statistica t0:

–Accetto H0

226.1

08.4

50

d

d

s

tt

Page 69: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test Chi-Quadro (2)1. Verifica di Ipotesi dati categorizzati:Test di bontà

di un adattamento (fit).

2. Verifica di Ipotesi per una Tabella di Contingenza: Test di Indipendenza e/o Omogeneità.

3. Verifica di Ipotesi varianza di una Popolazione 2.

Esempi: TestChi2; Tabella 2

Le verifiche di ipotesi utilizzano la distribuzione del chi-quadro (2).

dfnx

n

exxf n

xn

;0,22

)(2

22 1

Page 70: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Verifica di Ipotesi - Dati Multinomiali1. Ad un campione di 100 persone che soffrono di allergie è stato

chiesto in quale stagione dell'anno ne risentono maggiormente. Utilizzando un livello di significatività pari all'1% si vuole verificare l'ipotesi nulla: NON esiste una stagione particolare nella quale la sintomatologia è accentuata.

2. Ad un campione di 300 insegnanti è stato posto il seguente quesito: "Sei favorevole ad inasprire le punizioni per gli studenti indisciplinati e violenti“? Utilizzando un livello di significatività pari all'1% si vuole verificare se la risposta non dipende dal insegnante uomo o donna.

3. Negli AA 2003/04 e 2004/05 il punteggio medio ottenuto dagli studenti immatricolati al CdL in MC è molto simile. Vogliamo verificare se gli studenti hanno la medesima preparazione mettendo a confronto la distribuzione delle frequenze del punteggio d’esame. La verifica d’ipotesi è eseguita con il 5% di affidabilità

Page 71: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Esperimento Multinomiale1.L’esperimento è costituito da n prove (ripetizioni) identiche

2.L’esperimento ha k>2 possibili risultati (categorie, classi)

3.Le prove eseguite durante l’esperimento sono indipendenti

4.La probabilità dei k risultati rimane costante durante l’esperimento

A)Valutazione dei corsi: “Soddisfatto”, “Non soddisfatto”, “Non so”B)Punteggi ottenuti al Test di Ammissione divisi in classiC)Tempo di Corretto funzionamento di un’ Apparecchiatura

Esempio: test di Ipotesi per esperimenti con più categorie: test di bontà dell’adattamento (fit).

1. Valori raggruppati in classi, il numero di eventi/classe è detto Frequenze Osservate

2. Il Test sulla bontà di un fit verifica la validità dell’ipotesi nulla H0: le frequenze osservate hanno un ben preciso comportamento: una data distribuzione teorica.

3. La distribuzione teorica fornisce una serie di Frequenze Attese. L’ipotesi H0 viene accettata o rifiutata sulla base delle differenze fra le Frequenze Osservate e le Frequenze Attese

Page 72: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Distribuzione Chi-Quadro (2 )

Distribuzione 2.

La distribuzione-2 è posta a destra dell’asse delle ascisse, ed è completamente descritta da un solo parametro, i Gradi di Libertà df. Per piccoli valori di df, ha forma asimmetrica verso destra, e diviene simmetrica per grandi valori di df. I Gradi di Libertà df sono definiti in modo diverso a seconda del test che utilizza la statistica 2.

•Area Totale sotto la curva = 1

• Asimmetrica verso destra

•Valori 2 0

•Media = df

•Deviazione Standard =2xdf

dfnx

n

exxf n

xn

;0,22

)(2

22 1

Esempi: TestChi2; Tabella 2

Page 73: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Tabella della Distribuzione 2 – A

Valore del 2 per un valore dell’area nella coda Dx = 0.1 e df=7

Page 74: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Tabella della Distribuzione 2 – B

Valore del 2 per il valore dell’area nella coda Sx = 0.05 e df=12

Area nella coda Sx = 1 – Area nella coda Dx

Page 75: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test di Bontà di un FitFrequenze Osservate e Attese. Le frequenze ottenute dall’esperimento si dicono Frequenze Osservate (O). Per una data classe o categoria le Frequenze Attese (E) sono date dalla formula.

Dove n indica le dimensioni del campione, e p la probabilità che un elemento del campione appartenga ad una data classe (categoria) se l’ipotesi H0 è vera.

pnEAttesaFrequenza

Gradi di Libertà. Nel Test di Bontà di un Fit i gradi di libertà df sono dati dalla formula

Dove k indica il numero di risultati (classi, categorie) possibili dell’esperimento.

1 kdfLibertàdiGradi

Statistica del Test. La Statistica test del Test di Bontà di un Fit è il 2 dato dalla relazione

Il numeratore della frazione, la differenza (O–E ), è il segnale ed il denominatore E è il rumore. Il Test di Bontà di un Fit è ad una coda.

E

EO 22 )(

Page 76: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test di Bontà di un Fit - Esempi

Distribuzione dell’età di 100 persone fermate per guida in stato di ebbrezza

Età 16 - 25 26 – 35 36-45 45-55 56 -

No. 32 25 19 16 8

Con livello di significatività 1% vogliamo rigettare l’ipotesi nulla che le persone fermate siano distribuite uniformemente su ciascuna fascia di etàIpotesi Nulla H0 ed Ipotesi Alternativa

H1

H0: Distribuzione uniforme: p1 = p2 = p3 = p4 = p5 = 0.2

H1: Distribuzione non uniforme: almeno due valori di pi sono 0.2Regione di Accettazione e Rigetto

Livello di Significatività 0.01

Area nella coda Dx = = 0.01

Gradi di Libertà df = k –1 = 5-1 = 4

Valore critico 2 = 13.277

Decisione

Il valore della statistica 2 = 16. 500 è maggiore del valore critico 2 = 13. 277 e cade nella regione di rigetto. Quindi non c’e sufficiente evidenza per accettare H0, cioè la distribuzione delle persone è non uniforme

Rigetta H0

= 0.01

Valore critico di 2

Accetta H0

Categoria O p E = np (O – E) (O – E)2 (O – E)2 / E

16 – 25 32 0.20 20 12 144 7.200 26 – 35 25 0.20 20 5 25 1.250 36 – 45 19 0.20 20 -1 1 0.050 46 – 55 16 0.20 20 -4 16 0.800 56 – … 8 0.20 20 -12 144 7.200 Somma n =100 2 = 16.50

Page 77: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Tabella di Contingenza

Contratto dei Dipendenti dell’Azienda Ospedaliera &%$£=“!

Indeterminato

Determinato

Totale

Maschi 3768 2615 6383

Femmine

4658 3717 8375

Totale 8426 6232 14758Tabella di Classificazione o di Contingenza a 2 Vie• 1 Osservazione (il Dipendente) con 2 Attributi o Variabili (Genere,

Contratto)• 2 Righe per il Genere e 2 Colonne per il Contratto• 4 Celle dove sono riportate le frequenze osservate per ciascuna coppia di

attributi • 2 Totali di Riga e 2 Totali di Colonna

N.B. La tabella di contingenza può avere un numero qualsiasi di Righe e Colonne ed è indicata come tabella RxC

Page 78: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test di IndipendenzaTest di Indipendenza. In un Test di Indipendenza per una tabella di contingenza verifichiamo l’ipotesi nulla H0 che gli Attributi di una popolazione NON SONO fra loro dipendenti (sono indipendenti), contro l’ipotesi alternativa H1 che i due caratteri SONO dipendenti. Esempi. Genere e Contratto; Reddito e Affiliazione ad un Partito;

Statistica del Test di Indipendenza. Il valore della statistica test 2 per il test di indipendenza è dato dalla formula

Dove O ed E sono rispettivamente le frequenze Osservate (O) ed Attese (E) per ciascuna cella.

E

EO 22 )(

Gradi di Libertà. Nel Test di Indipendenza verifichiamo l’ipotesi nulla che due Attributi di una popolazione sono Indipendenti. Poiché questi sono specificati come Righe e Colonne di una tabella, i gradi di libertà df per il test di indipendenza sono dati dalla formula

Dove R e C sono rispettivamente il numero di Righe e Colonne.

)11 CRdf

Page 79: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test di IndipendenzaCalcolo delle Frequenze Attese E

Frequenze Osservate O

Favorevole

Contrario

Non So Totale

Uomo 93 70 12 175

Donna 87 32 6 125

Totale 180 102 18 300

IpotesiH0: U/D medesimo parereH1: U/D pareri diversi

Punizioni agli studenti violenti e indisciplinati. Insegnanti U e D; parere F, C, NS

Step per la Verifica1. Assumiamo vera H0 2. Calcoliamo la P(Cella)3. Calcoliamo il valore E

Frequenze Attese. Per Ciascuna Cella il valore Atteso E è dato dalla formula

CampionedelDimensioni

ColonnadiTotaleRigadiTotaleE

)()(

Probabilità. Assumendo che gli attributi siano indipendenti, la probabilità che l’insegnante sia un Uomo e che questi sia Favorevole, P(U and F), si calcola come prodotto dei valori P(U) e P(F)

300

180175

300

180

300

175300

300

300/180300/175

300/180

300/175

FandUPFedUperEdiValore

FPUPFandUP

FPFavorevoleP

UPUomoP

Page 80: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test di Indipendenza - Esempio

Frequenze Osservate O ed Attese (E )Favorevol

eContrari

oNon So

Totale

Uomo93

(105)70

(59.5)12

(10.5)175

Donna87

(75)32

(42.5)6

7.5)125

Totale 180 102 18 300

Punizioni agli studenti violenti ed indisciplinati

Valore LimiteGL : df = (R-1)x(C-1) =(2-1)x(3-1) = 2 Alfa : 0.01 (1%)

2 : 9.210

IpotesiH0: Genere e Opinione IndipendentiH1: Genere e Opinione Dipendenti

252.8300.0371.15.7

5.76

105

10593 22

22

E

EO

Calcolo della Statistica test 2 Decisione

Il valore della statistica test 2 = 8. 252 è minore del valore critico 2 = 9. 210 e cade nella regione di non rigetto di H0. Quindi nel data set esaminato non c’e sufficiente evidenza per rifiutare H0, a livello di confidenza pari a 1%. In altri termini gli attributi scelti a rappresentare la popolazione degli insegnati, Genere e Opinione sull’inasprimento della disciplina sono indipendentiEsempi: TestChi2

Page 81: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test di OmogeneitàTest di Omogeneità. Il Test di Omogeneità è utilizzato per verificare se due o più popolazioni sono simili o omogenee rispetto alla distribuzione di una loro caratteristica.

A) Preso un campione di Famiglie Monoreddito residenti nelle province di Ferrara e Bologna, si vuole verificare l’ipotesi nulla H0 che per entrambe le province queste famiglie e sono distribuite uniformemente nelle fasce di reddito “Basso”, “Medio” e “Alto”.

B) Gli Studenti che superano il test di ingresso a Medicina negli AA 2003/04 2004/05 hanno la medesima preparazione se suddivisi per classi di punteggio?. I) Punteggio 40; II) 40< Punteggio 50; III) 50< Punteggio 80. Il Test di Omogeneità esegue

la verifica di ipotesi nulla (H0) che la proporzione delle osservazioni con certe caratteristiche in due o più popolazioni diverse è la medesima, contro l’ipotesi alternativa (H1) che questa proporzione è diversa.

Punteggio Test AmmissioneAA

2003/04AA

2004/05Totale

P 40 77 84 161

40< P 50

54 58 112

50< P 80

12 8 20

Totale 143 150 293Esempi: TestChi2

Page 82: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test di Omogeneità - Esempio

Frequenze Osservate O ed Attese (E )

Bologna Ferrara Totale

Alto70

(65)34

(39)104

Medio80

(75)40

(45)120

Basso100(110)

76(66)

176

Totale 250 150 400

Frequenze Attese

CampioniiEntrambidiTotale

ColonnadiTotaleRigadiTotaleE

IpotesiH0: La distribuzione É la medesima

H1: La distribuzione NON è la medesima

Valore LimiteGL : df = (R-1)x(C-1) =(3-1)x(2-1) = 2 Alfa : 0.025 (2.5%)

2c : 7.378

Distribuzione delle famiglie Monoreddito per Classi

Calcolo della Statistica test 2:

DecisioneIl valore della statistica Chi2 = 4.339 è inferiore al Valore Limite per il livello di confidenza scelto (Chi2 = 7.378) e cade nella regione di Accettazione. Quindi affermiamo che nel campione esaminato non c'è sufficiente evidenza per rifiutare l'ipotesi H0 e cioè le famiglie monoreddito di Ferrara e Bologna sono distribuite in modo omogeneo nelle classi di reddito prese in esame.

339.4

22

E

EO

Page 83: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Inferenza circa la 2 di popolazione

Accanto al test di ipotesi sulla media di popolazione è necessario dare una stima e fare un test di ipotesi sulla varianza 2 di una popolazione.

Esempio. Supponiamo di volere verificare se le confezioni di biscotti prodotte da una macchina hanno peso pari a 32 once, e supposto che il peso reale sia diverso dal peso dichiarato vogliamo verificare se queste variazioni in difetto o in eccesso sono contenute entro limiti prefissati.

Distribuzione della varianza campionaria. Se la popolazione dalla quale è estratto il campione è approssimativamente normale, il rapporto fra varianza campionaria e varianza di popolazione ha distribuzione chi-quadro con n-1 gradi di libertà.

2

21

sn

Test d’ipotesi su . Il valore della statistica del test 2 è dato dal rapporto fra varianza campionaria s2 e varianza di popolazione moltiplicato per il numero di gradi di libertà n-1.

2

212

sn

Nota. Il test di ipotesi sulla varianza di popolazione 2 può essere ad una o due code

Page 84: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Test d’Ipotesi sulla 2 Una ditta dolciaria produce un tipo di biscotti in confezioni di peso netto pari a a

32 once, con una varianza dichiara di 2=0.015 once al quadrato. Periodicamente il servizio di controllo della qualità seleziona un campione di confezioni, calcola la varianza del peso netto di questi pacchetti ed esegue un test di ipotesi sulla varianza di popolazione. L’ultimo test è stato effettuato su un campione di n=25 confezioni, la cui varianza è risultata pari a s2=0.029 once al quadrato. Possiamo affermare con un livello di affidabilità pari ad =0,01 che la linea di produzione delle confezioni di biscotti funziona correttamente?

Il valore della statistica test 2=46,400 è maggiore del valore critico 2=42,980 e cade nella regione di rifiuto di H0. Ne deduciamo che la varainza di popolazione non è entro limiti accettabili ed è opportuno calibrare nuovamente le macchine

Esempi: TestChi2B

Test di ipotesi

1)H0 2 0.015; H0 2>0.015; Test a una coda Dx

2)Distribuzione del 2 con df=n1-1=24 =0,01

3)Valore critico 2 per df=24, = 0.01 è pari 42,980

42 =(n-1)s2/2=24*(0.029/0.015)=46,400

5)Decisione: Rifiuto H0.

Page 85: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

One-way ANOVA– Esempio– La descrizione dei dati– Le assunzioni del modello– Il modello lineare e le ipotesi– Il Rapporto di Varianza (statistica del

test)– La distribuzione di Fisher– La regola di decisione

Page 86: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Comparazione di 4 dentifrici Valutazione della azione sbiancante

Quattro tipi diversi di dentifricio sono esaminati per verificare il loro potere sbiancante; i dentifrici, indicati con la sigla T1, T2, T3, e T4 sono prodotti con la medesima ricetta e si differenziano solo per la sostanza sbiancante. Il bianco prodotto da ciascun dentifricio è valutato da sei volontari su una scala di valori compresa fra 0 a 30 gradi. In precedenza i volontari avevano usato il medesimo dentifricio.

Vogliamo rispondere alle seguenti domande: A) esiste una minima differenza fra i 4 dentifrici? B) Se esiste una differenza vogliamo individuare quale prodotto è il migliore?Per verificare se i 4 dentifrici hanno il medesimo potere sbiancante potremmo utilizzare la VI fra le medie di popolazioni, eseguendo 6 VI fra coppie di Ti. Ciascuna VI ha probabilità (1-) di essere accettata e, poiché le 6 VI sono fra loro indipendenti, per =0,05 la probabilità di accettare l’ipotesi H0: non c’è differenza fra i dentifrici è uguale a (1-)6=0,75, molto più bassa del livello di significatività di una sola VI

Per rispondere alla domanda A) senza ridurre il livello di significatività dobbiamo eseguire la verifica di ipotesi: H0: T1=T2=T3=T4 contro l’ipotesi alternativa H1: non tutte le medie sono uguali. Nel caso in cui H0 sia rifiutata la media Ti con il valore più elevato risponde alla domanda B).

Page 87: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Descrizione dei Dati

  Soggetti

  v1 v2 v3 v4 v5 v6

T1 16 17 17 19 21 24

T2 18 20 20 21 22 23

T3 19 27 28 29 32 34

T4 20 23 24 25 26 29

Box plots

T1 T2 T3 T415

17

19

21

23

25

27

29

31

33

35

Gra

do d

i bia

nco

Statistica T1 T2 T3 T4

Mediana18.

020.

528.

524.

5

Range 8.0 5.015.

0 9.0

IQR 3.5 1.8 4.02.5

0

Media19.

020.

628.

224.

5

Deviazione standard

3.05

1.75

5.19

3.02

Le sostanze sbiancati sembrano avere efficacia diversa. Il valore medio 2, il simbolo (+), è di poco superiore a 1, mentre i valori medi 3 e 4 sono nettamente diversi.

La linea orizzontale all’interno del Box indica la mediana; il simbolo “+” la media.

Valori misurati yji

Sosta

nz

a

Page 88: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Le assunzioni del modello– Il data-set è costituito da I campioni casuali indipendenti, ognuno è

estratto da una popolazione diversa.

– Ognuna delle popolazioni, dai quali sono estratti i campioni, è normale con media i e la medesima varianza

A) Tre popolazioni con media simile e medesima varianza

AB

B) Tre popolazioni con media diversa e varianza diversa

Dal confronto fra i Box-and-wisker plots è possibile ricavare informazioni sulle popolazioni?

Simulazione

Page 89: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

  Soggetti  Total

eMedi

aVarianz

a

  v1 v2 v3 v4 v5 v6 n yi. yi. SQW

T1 16 17 17 19 21 24 6 114 19.0 9.20

T2 18 20 20 21 22 23 6 124 20.7 3.07

T3 19 27 28 29 32 34 6 169 28.2 26.97

T4 20 23 24 25 26 29 6 147 24.5 9.10

k 4 4 4 4 4 4

soggettogruppo

misurativalori

ji

yij

;

;:

Somma e Media dei Quadrati

gruppiientrolibertàdigradi

gruppiientrovarianza

gruppitralibertàdigradi

gruppitravarianza

quadratideitotalesomma

gruppo;permedia

gruppo;persomma

:)1(;)1(

:

:1;1

:

;

:

:

2

.

2

...

2

,1;,1..

,1.

,1.

nknk

SQWMQW

yySQW

kk

SQBMQB

yySQB

yySQT

nyy

yy

iij

i

njkiij

njiji

njiji

rumore

segnale

:

:

SQW

SQB

Page 90: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Modello Lineare e Ipotesi

jij rispetto ydi differenza

otrattamenteffettoepopolaziondellamedia

medie le tutte di media - generalemedia

-erroreditermine:

"":

:

ij

i i

;,,1

,,1;

ijiiij

ijiij

ynj

kiy

Modello lineare:

IpotesiH0: 1 = 2 = 3 = 4 H0: 1 = 2 = 3 = 4 = 0

H1: non tutte le i sono uguali H1: non tutte le i sono uguali

Page 91: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Stime di 2 e Rapporto di Varianza

La 2° stima di 2. La media quadratica fra i gruppi, MSB, fornisce una stima non distorta della varianza comune a tutte le popolazioni.

groups between:BkyiyMSBnk

ix ;1...1

22

La 1° stima di All’interno di ogni gruppo la media quadratica, MSW , fornisce una stima non distorta della varianza della popolazione dalla quale proviene il campione. groups within:WnkyyMSW

nk

j iij ;11

2.

2

Se l’ipotesi H0 è vera ci dovremmo aspettare che le due stime di siano in valore assoluto abbastanza simili. Se l’ipotesi H0 è falsa, ovvero se tutte le medie delle popolazioni non sono uguali, ci dovremmo aspettare che la media quadratica fra i gruppi (MSB) sia più grande della media quadratica all’interno dei gruppi (MSW).

Il Rapporto Segnale Rumore. Per confrontare le due stime di 2 utilizziamo il rapporto segnale/rumore (SNR) che è la statistica del test

Se le due stime sono pressoché uguali, allora il RV è vicino a 1. Il valore di SNR vicino a 1 tende ad avvalorare l’ipotesi che le medie delle popolazioni siano uguali. Se SNR è molto maggiore di 1, l’ipotesi di uguaglianza fra le medie di popolazione cade.

gruppideiinternoall'quadraticamediagruppiifraquadraticamedia

MSW

MSBSNR

Page 92: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Distribuzione di Fisher – Test F

•Il rapporto SNR =MSB/MSW (varianza fra gruppi/varianza dentro i gruppi), la varianza al numeratore ha k-1 gradi di libertà (numero di gruppi -1), mentre i gradi di libertà al denominatore sono N-k (numero totale di osservazioni – k).

•Definita la distribuzione di Fisher, è scelto il livello di significatività , la dimensione del SNR rappresenta l’evidenza sperimentale in base alla quale accettare o rifiutare H0.

22

21 ss e

•il numero dei gradi di libertà della varianza campionaria che sta al numeratore della statistica F (num); il numero di gradi di libertà della varianza campionaria che sta al numeratore (den)

df=(num,den)

22

21

22

22

21

21

21 ssss

La distribuzione di probabilità di Fisher descrivere la distribuzione dei valori del rapporto

- s12 ed s2

2 sono la varianza campionaria dei campioni estratti dalle popolazioni normali di varianza 1

2 ed 22 . La

distribuzione F è una famiglia di distribuzioni descritta da due parametri:

Page 93: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Tabella ANOVATabella della ANOVA1- ANOVA ad una via

N –numero totale osservazioni; k – numero gruppi; nk – numero osservazioni/gruppo

Fonte di variazione

Somma dei quadrati

Gradi di libertà

Media quadratica

Rapporto di varianza

Fra gruppi

All’interno dei gruppi

Totale

k

ji yySSB

1

2...

k

i

nk

jjij yySSW

1 1

2.

k

i

nk

jij yySST

1 1

2..

1k

kN

1N

MSW

MSBFVR ..

kN

SSWMSW

1

k

SSBMSB

Page 94: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Decisione  v1 v2 v3 v4 v5 v6

T1 16 17 17 19 21 24

T2 18 20 20 21 22 23

T3 19 27 28 29 32 34

T4 20 23 24 25 26 29

RIEPILOGO

Gruppi Conteggio Somma Media Varianza

T1 6 114 19.0 9.2

T2 6 124 20.7 3.1

T3 6 169 28.2 27.0

T4 6 147 24.5 9.1

ANALISI VARIANZA

Origine della variazione SQ gdl MQ FValore di

significatività F crit

Tra gruppi 302.17 3 100.72 8.34 0.00 3.10

In gruppi 241.67 20 12.08

Totale 543.83 23        

Excel - ANOVA1

Dentifricio; Esempi

Page 95: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Appendice A Excel – Funzioni Statistiche

Predefinite

•Statistica descrittiva•Frequenza, Indicatori, …

•Distribuzioni Probabilità•Dirette e Inverse

Page 96: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

Appendice B Excel – Work Book ANALISI DATI

Page 97: C. di L. Specialistica Lauree per le Professioni Sanitarie Corso Integrato di Informatica Statistica ed Epidemiologia Statistica Prof. Claudio Bonifazzi

gruppiientrolibertàdigradi

gruppiientrovarianza

gruppitralibertàdigradi

gruppitravarianza

quadratideitotalesomma

gruppo;permedia

gruppo;persomma

:)1(;)1(

:

:1;1

:

;

:

:

2

.

2

...

2

,1;,1..

,1.

,1.

nknk

SQWMQW

yySQW

kk

SQBMQB

yySQB

yySQT

nyy

yy

iij

i

njkiij

njiji

njiji

groups within:WnkyyMSWnk

j iij ;11

2.

2