il residuo nella predizione 1. d efinizione di residuo il residuo è la differenza fra il punteggio...

29
Il residuo nella predizione 1

Upload: gioffreda-fantoni

Post on 03-May-2015

224 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Il residuo nella predizione1

Page 2: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

DEFINIZIONE DI RESIDUO

Il residuo è la differenza fra il punteggio predetto e il punteggio osservato

Residuo= Osservato – Predetto

Graficamente, è la distanza tra il punto indicante la misurazione realmente effettuata e il suo corrispondente appartenente alla retta di regressione.

2

Page 3: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

iii amXY Variabile dipendente, spiegata, valoreosservato

inclinazione

variabile indipendente

intercetta

errore

amXY ii ˆStima di y, valore predetto

Page 4: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

abilità votovoto_pre

detto residuopredizi

one

8 5 5,15 -0,15 -1,30

9 5 5,78 -0,78 -0,82

9 6 5,78 0,22 -0,82

10 7 6,4 0,6 -0,35

11 7 7,03 -0,03 0,12

12 8 7,66 0,34 0,59

13 9 8,29 0,71 1,06

14 8 8,91 -0,91 1,53

somma 86 55 55 0 0

media 10,75 6,875 6,875 0 0

Page 5: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

PREDIZIONE CON PUNTI ZETA

xyxiyi rzz ˆẑyi = zeta predettozxi = zeta predittorerxy = coefficiente di correlazione 5

Page 6: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Predizione usando i punti standardizzati

Page 7: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

soggetti

Test R Test T Test R

zeta

test T zeta

p1 37 50 1,33 0,45

p2 39 75 1,49 1,58

p3 9 24 -0,86 -0,72

p4 8 11 -0,94 -1,31

p5 6 25 -1,09 -0,68

p6 39 78 1,49 1,71

p7 18 24 -0,16 -0,72

p8 16 20 -0,31 -0,90

p9 8 40 -0,94 0,00

p10 20 53 0,00 0,59

somma 200 400 0,00 0,00

dev stan 12,79 22,17 1,00 1,00

varianza 163,60 491,60 1,00 1,00

media 20 40 0,00 0,00

PREDIZIONE DEL PUNTEGGIO OTTENUTO AL TEST T TRAMITE IL PUNTEGGIO AL TEST R CON I PUNTI Z.

PRIMO PASSAGGIO:TRASFORMAZIONE DEI PUNTEGGI IN PUNTI Z.

7

Page 8: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Sogg. Test R zeta Test T zetaprediz di

T

p1 1,33 0,45 1,13

p2 1,49 1,58 1,26

p3 -0,86 -0,72 -0,73

p4 -0,94 -1,31 -0,79

p5 -1,09 -0,68 -0,93

p6 1,49 1,71 1,26

p7 -0,16 -0,72 -0,13

p8 -0,31 -0,90 -0,26

p9 -0,94 0,00 -0,79

p10 0,00 0,59 0,00

somma 0,00 0,00 0,000

dev stan 1,00 1,00 0,847

varianza 1,00 1,00 0,718

media 0,00 0,00 0,000 8

PREDIZIONE DEL PUNTEGGIO OTTENUTO AL TEST T TRAMITE IL PUNTEGGIO AL TEST R CON I PUNTI Z.

SECONDO PASSAGGIO:CALCOLO DELLA PREDIZIONE DI T CON LA FORMULA:

xyxiyi rzz ˆ

Page 9: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

9

VARIANZA SPIEGATA E RESIDUA

SOGGETTOTEST R ZETA

TEST T ZETA

PRODOTTI ZETA

PREDIZIONE DI T

RESIDUO

P1 1,33 0,45 0,6 1,13 -0,68P2 1,49 1,58 2,34 1,26 0,32

P3 -0,86 -0,72 0,62 -0,73 0,01

P4 -0,94 -1,31 1,23 -0,79 -0,51

P5 -1,09 -0,68 0,74 -0,93 0,25

P6 1,49 1,71 2,55 1,26 0,46

P7 -0,16 -0,72 0,11 -0,13 -0,59

P8 -0,31 -0,9 0,28 -0,26 -0,64

P9 -0,94 0 0 -0,79 0,79

P10 0 0,59 0 0 0,59

SOMMA 0 0 8,473 0 0

DEVIAZIONE STD 1 1 0,877 0,847 0,531

VARIANZA 1 1 0,769 0,718 0,282

MEDIA 0 0 0,847 0 0

Correlazione

Varianza spiegata

Varianza residua

Somma = 1

Page 10: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

10

VARIANZA SPIEGATA E RESIDUA

SOGGETTOTEST R ZETA

TEST T ZETA

PRODOTTI ZETA

PREDIZIONE DI T

RESIDUO

P1 1,33 0,45 0,6 1,13 -0,68P2 1,49 1,58 2,34 1,26 0,32

P3 -0,86 -0,72 0,62 -0,73 0,01

P4 -0,94 -1,31 1,23 -0,79 -0,51

P5 -1,09 -0,68 0,74 -0,93 0,25

P6 1,49 1,71 2,55 1,26 0,46

P7 -0,16 -0,72 0,11 -0,13 -0,59

P8 -0,31 -0,9 0,28 -0,26 -0,64

P9 -0,94 0 0 -0,79 0,79

P10 0 0,59 0 0 0,59

SOMMA 0 0 8,473 0 0

DEVIAZIONE STD 1 1 0,877 0,847 0,531

VARIANZA 1 1 0,769 0,718 0,282

MEDIA 0 0 0,847 0 0

La varianza spiegata è la varianza dei predetti, cioè la varianza spiegata

dalla regressione.

Page 11: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

11

VARIANZA SPIEGATA E RESIDUA

SOGGETTOTEST R ZETA

TEST T ZETA

PRODOTTI ZETA

PREDIZIONE DI T

RESIDUO

P1 1,33 0,45 0,6 1,13 -0,68P2 1,49 1,58 2,34 1,26 0,32

P3 -0,86 -0,72 0,62 -0,73 0,01

P4 -0,94 -1,31 1,23 -0,79 -0,51

P5 -1,09 -0,68 0,74 -0,93 0,25

P6 1,49 1,71 2,55 1,26 0,46

P7 -0,16 -0,72 0,11 -0,13 -0,59

P8 -0,31 -0,9 0,28 -0,26 -0,64

P9 -0,94 0 0 -0,79 0,79

P10 0 0,59 0 0 0,59

SOMMA 0 0 8,473 0 0

DEVIAZIONE STD 1 1 0,877 0,847 0,531

VARIANZA 1 1 0,769 0,718 0,282MEDIA 0 0 0,847 0 0

La varianza residua (o

varianza dei residui) indica quella parte di varianza non spiegata dalla regressione, (attribuibile all’errore).

Page 12: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

12

VARIANZA SPIEGATA E RESIDUA

SOGGETTOTEST R ZETA

TEST T ZETA

PRODOTTI ZETA

PREDIZIONE DI T

RESIDUO

P1 1,33 0,45 0,6 1,13 -0,68P2 1,49 1,58 2,34 1,26 0,32

P3 -0,86 -0,72 0,62 -0,73 0,01

P4 -0,94 -1,31 1,23 -0,79 -0,51

P5 -1,09 -0,68 0,74 -0,93 0,25

P6 1,49 1,71 2,55 1,26 0,46

P7 -0,16 -0,72 0,11 -0,13 -0,59

P8 -0,31 -0,9 0,28 -0,26 -0,64

P9 -0,94 0 0 -0,79 0,79

P10 0 0,59 0 0 0,59

SOMMA 0 0 8,473 0 0

DEVIAZIONE STD 1 1 0,877 0,847 0,531

VARIANZA 1 1 0,769 0,718 0,282MEDIA 0 0 0,847 0 0

La somma della varianza spiegata e della varianza residua è pari alla varianza totale del punteggio predetto.

Page 13: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

13

VARIANZA SPIEGATA E RESIDUA

SOGGETTOTEST R ZETA

TEST T ZETA

PRODOTTI ZETA

PREDIZIONE DI T

RESIDUO

P1 1,33 0,45 0,6 1,13 -0,68P2 1,49 1,58 2,34 1,26 0,32

P3 -0,86 -0,72 0,62 -0,73 0,01

P4 -0,94 -1,31 1,23 -0,79 -0,51

P5 -1,09 -0,68 0,74 -0,93 0,25

P6 1,49 1,71 2,55 1,26 0,46

P7 -0,16 -0,72 0,11 -0,13 -0,59

P8 -0,31 -0,9 0,28 -0,26 -0,64

P9 -0,94 0 0 -0,79 0,79

P10 0 0,59 0 0 0,59

SOMMA 0 0 8,473 0 0

DEVIAZIONE STD 1 1 0,877 0,847 0,531

VARIANZA 1 1 0,769 0,718 0,282MEDIA 0 0 0,847 0 0

Correlazione

Page 14: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Notiamo che…

La varianza spiegata è la varianza dei predetti, cioè la varianza spiegata dalla regressione.

La varianza residua (o varianza dei residui) indica quella parte di varianza non spiegata dalla regressione, (attribuibile all’errore).

La somma della varianza spiegata e della varianza residua è pari alla varianza totale del punteggio predetto.

14

Page 15: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

PROPRIETÀ DELLA REGRESSIONE

I residui hanno media M = 0 La varianza dei predetti è uguale al

coefficiente di determinazione: r2

La deviazione standard dei predetti è uguale al coefficiente di correlazione (in quanto radice quadrata della varianza)

La varianza dei residui è pari al quadrato del coefficiente di alienazione: (1-r2)

Il coefficiente di alienazione può essere definito anche come la radice di questo valore: √(1-r2). In questo caso rappresenterà la deviazione standard dei residui (e non la loro varianza)

La correlazione fra i residui e i predetti è nulla15

Page 16: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Si può costruire o calcolare l’equazione di regressione usando i punti grezzi, senza passare per i punti standardizzati:

yMˆˆ yyii szyOttengo questa formula applicando la formula per passare dai punti zeta al punteggio grezzo:x = z · s + m dove: s = dev. std.

m = media 16

Per passare dai punti zeta ai punti grezzi

Page 17: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

17

x-y MrMˆ

x

yxyi

x

yi s

sx

s

sy

PREDIZIONE CON MISURE SINTETICHE DI X E Y

Page 18: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

ESEMPIO DI PREDIZIONE CON PUNTI GREZZI

18

SOGGETTI TEST R TEST TPRODOTTI

R · TR2 T2 STIME RESIDUI

P1 37 50 1850 1369 2500 64,97 -14,97P2 39 75 2925 1521 5625 67,91 7,09P3 9 24 216 81 576 23,84 0,16P4 8 11 88 64 121 22,37 -11,37P5 6 25 150 36 625 19,44 5,56P6 39 78 3042 1521 6084 67,91 10,09P7 18 24 432 324 576 37,06 -13,06P8 16 20 320 256 400 34,12 -14,12P9 8 40 320 64 1600 22,37 17,63P10 20 53 1060 400 2809 40,00 13,00

SOMMA 200 400 10403 5636 20916 400 0DEVIAZIONE STD 12,79 22,17 18,79 11,77VARIANZA 163,60 491,60 352,96 138,64MEDIA 20,00 40,00 40,00 0,00COEFF ANGOLARE (m) 1,469  

INTERCETTA (a) 10,632CORRELAZIONE 0,847

Page 19: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

RIASSUMENDO DALLA TABELLA

Il soggetto p1 ha avuto punteggio 37 nel test R e 50 nel test T.

Il test R è usato per predire il test T. Per predire il punteggio di p1 si utilizza l’equazione

di regressione:T = R · m + a

se m = 1.469 e a = 10.623 T= 37 ·1.469 +10.623= 64.97

La differenza fra il punteggio osservato e quello predetto è il residuo: 50-64,97 = -14,97

La varianza dei predetti (varianza spiegata) più la varianza dell’errore (varianza residua) è uguale alla varianza della variabile da predire.

19

Page 20: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Regressione con SPSS...

Page 21: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Parte seconda Esame dei residui

Page 22: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

I RESIDUI Sono indipendenti dal predittore Costituiscono l’errore di predizione (o di stima)

dell’equazione di regressioneHanno

media uguale a 0 d.s. = sy · √(1-r2

xy) (detta anche errore standard della stima)

Si ipotizza che abbiano una distribuzione normale.

Se sono distribuiti normalmente, possiamo applicare le tavole della curva normale, e stabilire che, per esempio:

tra +- 1,64 errori standardizzati si trova il 90% degli errori di predizione

22

Page 23: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Perché si esaminano i residui?

L’esame dei residui permette di: testare le capacità del test di predizione, per

poterlo poi usare in situazioni reali, dove non si conosce il punteggio da predire.

Valutare distribuzioni anomale, sbilanciate in una direzione o nell’altra, in alcune zone della distribuzione dei punteggi osservati piuttosto che in altre.

L’esame dei residui è veramente proficuo nella regressione multipla

23

Page 24: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Va lo ri no tevo li de lla Norma le S tandardNorm(0 ;1 )

-3 -2 -1 0 1 2 30 ,0

0 ,1

0 ,2

0 ,3

0 ,4

0 ,5

0 ,6

90% ± 1,64 ds

95,45% ± 2 ds

68.26% ± 1 ds

95% ± 1,96 ds

24

Page 25: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

DISTRIBUZIONE IPOTETICA DEI RESIDUI

Il 90 % degli errori di predizione è compreso fra -19,3 e +19,3

Il 68 % degli errori di predizione è compreso fra -11,77 e + 11,77(Il resto è più grande in valori assoluti)

25

Page 26: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

30 90

Rappresentazione grafica della predizione di due punteggi qualsiasi, p. es., 30 e 90, con le frequenze di possibili errori

Asse dei punteggi

26

Le curve rappresentano la probabilità di trovare un punteggio predetto corrispondente ad un certo valore diverso dal punteggio osservato, oppure la probabilità che il punteggio reale sia un certo valore (diverso dal punteggio predetto). Per esempio, per quanto riguarda 30, è più probabile trovare punteggi predetti intorno a 30 che valori che si distanziano notevolmente dal valore osservato, ed è più probabile che, se il punteggio predetto è 30, il valore reale sia circa 30.

Page 27: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

Stima e precisione della stima

Il punteggio predetto 30 è vicino a quello osservato, o reale, che non è conosciuto, ma è stimabile: c’è il 90% di probabilità che il valore esatto o osservato si situi entro l’intervallo 30-19.03 e 30+19.03, ossia fra 10.97 e 49.03

Il punteggio predetto 90 è vicino a quello osservato, o reale, che non è conosciuto, ma è stimabile: c’è il 90% di probabilità che il valore esatto o osservato si situi entro l’intervallo 90-19.03 e 90+19.03, ossia fra 70.97 e 119.03

27

Page 28: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

RIASSUMENDO

La regressione statistica permette di stimare (o predire) il punteggio di un test (o di un’altra misurazione).

Nella predizione del singolo caso non è mai possibile sapere se la predizione è esatta o molto sballata.

Si può quantificare la predizione totale, fatta su tutti i casi (presenti e futuri): la quota di varianza spiegata (r2) è un utile indice per definire la precisione della predizione.

28

Page 29: Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato

MECCANISMO DELLA PREDIZIONE O DELLA STIMA

Per ogni individuo, l’equazione della regressione predice un valore di Y, indicato con Ŷ, simile ma non uguale al valore osservato Y

La differenza fra Y e Ŷ è chiamata residuo, o errore

Y sta vicino a Ŷ, con alta probabilità è molto vicino, con bassa probabilità è molto lontano dal valore vero

Questa relazione è definibile con la curva gaussiana, con m = 0 e σ = err. stand. della stima

Perciò, se non si può calcolare il punteggio reale, si può affermare che esso deve trovarsi con il 90 % (o altri livelli) di probabilità entro un certo intervallo calcolabile.

29