![Page 1: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/1.jpg)
Correlazione tra due variabili
Federico Plazzi
26 Novembre 2015
![Page 2: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/2.jpg)
Correlazione tra due variabili
Variabili dipendenti e variabili indipendenti
I La variabile indipendente e quella che, secondo le nostreaspettative, dovrebbe essere in grado di influenzare l’altra; disolito viene indicata sull’asse delle ascisse.
I La variabile dipendente e quella che, secondo le nostreaspettative, viene invece influenzata dall’altra; di solito vieneindicata sull’asse delle ordinate.
I E una semplice convenzione: se non abbiamo idea di qualevariabile influenzi l’altra, o se ci sembra che si influenzino avicenda, la scelta dell’asse su cui sistemare le nostre variabili eindifferente.
I La correlazione e sempre un concetto simmetrico.
![Page 3: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/3.jpg)
Correlazione tra due variabili
Variabili dipendenti e variabili indipendenti
I La variabile indipendente e quella che, secondo le nostreaspettative, dovrebbe essere in grado di influenzare l’altra; disolito viene indicata sull’asse delle ascisse.
I La variabile dipendente e quella che, secondo le nostreaspettative, viene invece influenzata dall’altra; di solito vieneindicata sull’asse delle ordinate.
I E una semplice convenzione: se non abbiamo idea di qualevariabile influenzi l’altra, o se ci sembra che si influenzino avicenda, la scelta dell’asse su cui sistemare le nostre variabili eindifferente.
I La correlazione e sempre un concetto simmetrico.
![Page 4: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/4.jpg)
Correlazione tra due variabili
Variabili dipendenti e variabili indipendenti
I La variabile indipendente e quella che, secondo le nostreaspettative, dovrebbe essere in grado di influenzare l’altra; disolito viene indicata sull’asse delle ascisse.
I La variabile dipendente e quella che, secondo le nostreaspettative, viene invece influenzata dall’altra; di solito vieneindicata sull’asse delle ordinate.
I E una semplice convenzione: se non abbiamo idea di qualevariabile influenzi l’altra, o se ci sembra che si influenzino avicenda, la scelta dell’asse su cui sistemare le nostre variabili eindifferente.
I La correlazione e sempre un concetto simmetrico.
![Page 5: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/5.jpg)
Correlazione tra due variabili
Variabili dipendenti e variabili indipendenti
I La variabile indipendente e quella che, secondo le nostreaspettative, dovrebbe essere in grado di influenzare l’altra; disolito viene indicata sull’asse delle ascisse.
I La variabile dipendente e quella che, secondo le nostreaspettative, viene invece influenzata dall’altra; di solito vieneindicata sull’asse delle ordinate.
I E una semplice convenzione: se non abbiamo idea di qualevariabile influenzi l’altra, o se ci sembra che si influenzino avicenda, la scelta dell’asse su cui sistemare le nostre variabili eindifferente.
I La correlazione e sempre un concetto simmetrico.
![Page 6: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/6.jpg)
Correlazione tra due variabili
Variabili dipendenti e variabili indipendenti
I La variabile indipendente e quella che, secondo le nostreaspettative, dovrebbe essere in grado di influenzare l’altra; disolito viene indicata sull’asse delle ascisse.
I La variabile dipendente e quella che, secondo le nostreaspettative, viene invece influenzata dall’altra; di solito vieneindicata sull’asse delle ordinate.
I E una semplice convenzione: se non abbiamo idea di qualevariabile influenzi l’altra, o se ci sembra che si influenzino avicenda, la scelta dell’asse su cui sistemare le nostre variabili eindifferente.
I La correlazione e sempre un concetto simmetrico.
![Page 7: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/7.jpg)
Pearson product-moment correlation coefficient
La codevianza
I Correlazione significa co-variabilita: le due variabilitendono a variare insieme, positivamente o negativamente.
I La “co-variabilita” viene stimata attraverso il concetto dicovarianza.
I Partiamo dal concetto di devianza:
DX =N∑i=1
(Xi − X )2 =N∑i=1
(Xi − X )(Xi − X ) (1)
DY =N∑i=1
(Yi − Y )2 =N∑i=1
(Yi − Y )(Yi − Y ) (2)
I Definiamo la codevianza:
DXY =N∑i=1
(Xi − X )(Yi − Y ) (3)
![Page 8: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/8.jpg)
Pearson product-moment correlation coefficient
La codevianza
I Correlazione significa co-variabilita: le due variabilitendono a variare insieme, positivamente o negativamente.
I La “co-variabilita” viene stimata attraverso il concetto dicovarianza.
I Partiamo dal concetto di devianza:
DX =N∑i=1
(Xi − X )2 =N∑i=1
(Xi − X )(Xi − X ) (1)
DY =N∑i=1
(Yi − Y )2 =N∑i=1
(Yi − Y )(Yi − Y ) (2)
I Definiamo la codevianza:
DXY =N∑i=1
(Xi − X )(Yi − Y ) (3)
![Page 9: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/9.jpg)
Pearson product-moment correlation coefficient
La codevianza
I Correlazione significa co-variabilita: le due variabilitendono a variare insieme, positivamente o negativamente.
I La “co-variabilita” viene stimata attraverso il concetto dicovarianza.
I Partiamo dal concetto di devianza:
DX =N∑i=1
(Xi − X )2 =N∑i=1
(Xi − X )(Xi − X ) (1)
DY =N∑i=1
(Yi − Y )2 =N∑i=1
(Yi − Y )(Yi − Y ) (2)
I Definiamo la codevianza:
DXY =N∑i=1
(Xi − X )(Yi − Y ) (3)
![Page 10: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/10.jpg)
Pearson product-moment correlation coefficient
La codevianza
I Correlazione significa co-variabilita: le due variabilitendono a variare insieme, positivamente o negativamente.
I La “co-variabilita” viene stimata attraverso il concetto dicovarianza.
I Partiamo dal concetto di devianza:
DX =N∑i=1
(Xi − X )2 =N∑i=1
(Xi − X )(Xi − X ) (1)
DY =N∑i=1
(Yi − Y )2 =N∑i=1
(Yi − Y )(Yi − Y ) (2)
I Definiamo la codevianza:
DXY =N∑i=1
(Xi − X )(Yi − Y ) (3)
![Page 11: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/11.jpg)
Pearson product-moment correlation coefficient
La codevianza
I Correlazione significa co-variabilita: le due variabilitendono a variare insieme, positivamente o negativamente.
I La “co-variabilita” viene stimata attraverso il concetto dicovarianza.
I Partiamo dal concetto di devianza:
DX =N∑i=1
(Xi − X )2 =N∑i=1
(Xi − X )(Xi − X ) (1)
DY =N∑i=1
(Yi − Y )2 =N∑i=1
(Yi − Y )(Yi − Y ) (2)
I Definiamo la codevianza:
DXY =N∑i=1
(Xi − X )(Yi − Y ) (3)
![Page 12: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/12.jpg)
Pearson product-moment correlation coefficient
La covarianza
I Ricordiamo il concetto di varianza:
σ2X =
∑Ni=1 (Xi − X )2
N=
∑Ni=1 (Xi − X )(Xi − X )
N(4)
σ2Y =
∑Ni=1 (Yi − Y )2
N=
∑Ni=1 (Yi − Y )(Yi − Y )
N(5)
I Definiamo la covarianza:
σ2XY =
∑Ni=1 (Xi − X )(Yi − Y )
N(6)
![Page 13: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/13.jpg)
Pearson product-moment correlation coefficient
La covarianza
I Ricordiamo il concetto di varianza:
σ2X =
∑Ni=1 (Xi − X )2
N=
∑Ni=1 (Xi − X )(Xi − X )
N(4)
σ2Y =
∑Ni=1 (Yi − Y )2
N=
∑Ni=1 (Yi − Y )(Yi − Y )
N(5)
I Definiamo la covarianza:
σ2XY =
∑Ni=1 (Xi − X )(Yi − Y )
N(6)
![Page 14: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/14.jpg)
Pearson product-moment correlation coefficient
La covarianza
I Ricordiamo il concetto di varianza:
σ2X =
∑Ni=1 (Xi − X )2
N=
∑Ni=1 (Xi − X )(Xi − X )
N(4)
σ2Y =
∑Ni=1 (Yi − Y )2
N=
∑Ni=1 (Yi − Y )(Yi − Y )
N(5)
I Definiamo la covarianza:
σ2XY =
∑Ni=1 (Xi − X )(Yi − Y )
N(6)
![Page 15: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/15.jpg)
Pearson product-moment correlation coefficient
La covarianza massima
I Qual e la covarianza massima?
I Deve dipendere dalle due varianze. In particolare, se una delledue varianze e 0, anche la covarianza deve risultare 0, perchenon e possibile che l’altra co-vari con essa. Percio, anzicheuna media aritmetica, dobbiamo usare una media geometrica:
max(σ2XY ) =√σ2X · σ2Y (7)
![Page 16: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/16.jpg)
Pearson product-moment correlation coefficient
La covarianza massima
I Qual e la covarianza massima?
I Deve dipendere dalle due varianze. In particolare, se una delledue varianze e 0, anche la covarianza deve risultare 0, perchenon e possibile che l’altra co-vari con essa. Percio, anzicheuna media aritmetica, dobbiamo usare una media geometrica:
max(σ2XY ) =√σ2X · σ2Y (7)
![Page 17: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/17.jpg)
Pearson product-moment correlation coefficient
La covarianza massima
I Qual e la covarianza massima?
I Deve dipendere dalle due varianze. In particolare, se una delledue varianze e 0, anche la covarianza deve risultare 0, perchenon e possibile che l’altra co-vari con essa. Percio, anzicheuna media aritmetica, dobbiamo usare una media geometrica:
max(σ2XY ) =√σ2X · σ2Y (7)
![Page 18: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/18.jpg)
Pearson product-moment correlation coefficient
Il coefficiente r
I Il coefficiente r stima il rapporto tra la covarianza osservata ela covarianza massima possibile:
r =σ2XY
max(σ2XY )(8)
I Sostituendo nella 8 usando la 6 e la 7:
r =
∑Ni=1 (Xi−X )(Yi−Y )
N√σ2X · σ2Y
(9)
I Applicando la 4 e la 5:
r =
∑Ni=1 (Xi−X )(Yi−Y )
N√∑Ni=1 (Xi−X )2
N ·∑N
i=1 (Yi−Y )2
N
=DXY√
DX · DY(10)
![Page 19: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/19.jpg)
Pearson product-moment correlation coefficient
Il coefficiente r
I Il coefficiente r stima il rapporto tra la covarianza osservata ela covarianza massima possibile:
r =σ2XY
max(σ2XY )(8)
I Sostituendo nella 8 usando la 6 e la 7:
r =
∑Ni=1 (Xi−X )(Yi−Y )
N√σ2X · σ2Y
(9)
I Applicando la 4 e la 5:
r =
∑Ni=1 (Xi−X )(Yi−Y )
N√∑Ni=1 (Xi−X )2
N ·∑N
i=1 (Yi−Y )2
N
=DXY√
DX · DY(10)
![Page 20: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/20.jpg)
Pearson product-moment correlation coefficient
Il coefficiente r
I Il coefficiente r stima il rapporto tra la covarianza osservata ela covarianza massima possibile:
r =σ2XY
max(σ2XY )(8)
I Sostituendo nella 8 usando la 6 e la 7:
r =
∑Ni=1 (Xi−X )(Yi−Y )
N√σ2X · σ2Y
(9)
I Applicando la 4 e la 5:
r =
∑Ni=1 (Xi−X )(Yi−Y )
N√∑Ni=1 (Xi−X )2
N ·∑N
i=1 (Yi−Y )2
N
=DXY√
DX · DY(10)
![Page 21: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/21.jpg)
Pearson product-moment correlation coefficient
Il coefficiente r
I Il coefficiente r stima il rapporto tra la covarianza osservata ela covarianza massima possibile:
r =σ2XY
max(σ2XY )(8)
I Sostituendo nella 8 usando la 6 e la 7:
r =
∑Ni=1 (Xi−X )(Yi−Y )
N√σ2X · σ2Y
(9)
I Applicando la 4 e la 5:
r =
∑Ni=1 (Xi−X )(Yi−Y )
N√∑Ni=1 (Xi−X )2
N ·∑N
i=1 (Yi−Y )2
N
=DXY√
DX · DY(10)
![Page 22: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/22.jpg)
Coefficient of determination
Il coefficiente rIl coefficiente r che abbiamo appena calcolato indica la direzionedella correlazione, in particolare:
I un valore di −1 indica una perfetta correlazione negativa;
I un valore di 0 indica totale assenza di correlazione;
I un valore di +1 indica una perfetta correlazione positiva.
Il coefficiente r 2
I Il coefficiente r2 indica la forza della correlazione ed e definitosemplicemente come r2 = r · r .
I Se, ad esempio, r2 e pari a 0, 75, vuol dire che il 75% dellavarianza di X e spiegato dalla varianza di Y e viceversa.
I La varianza residua sara pari a 1− r2 per entrambe la variabili.
![Page 23: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/23.jpg)
Coefficient of determination
Il coefficiente rIl coefficiente r che abbiamo appena calcolato indica la direzionedella correlazione, in particolare:
I un valore di −1 indica una perfetta correlazione negativa;
I un valore di 0 indica totale assenza di correlazione;
I un valore di +1 indica una perfetta correlazione positiva.
Il coefficiente r 2
I Il coefficiente r2 indica la forza della correlazione ed e definitosemplicemente come r2 = r · r .
I Se, ad esempio, r2 e pari a 0, 75, vuol dire che il 75% dellavarianza di X e spiegato dalla varianza di Y e viceversa.
I La varianza residua sara pari a 1− r2 per entrambe la variabili.
![Page 24: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/24.jpg)
Coefficient of determination
Il coefficiente rIl coefficiente r che abbiamo appena calcolato indica la direzionedella correlazione, in particolare:
I un valore di −1 indica una perfetta correlazione negativa;
I un valore di 0 indica totale assenza di correlazione;
I un valore di +1 indica una perfetta correlazione positiva.
Il coefficiente r 2
I Il coefficiente r2 indica la forza della correlazione ed e definitosemplicemente come r2 = r · r .
I Se, ad esempio, r2 e pari a 0, 75, vuol dire che il 75% dellavarianza di X e spiegato dalla varianza di Y e viceversa.
I La varianza residua sara pari a 1− r2 per entrambe la variabili.
![Page 25: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/25.jpg)
Coefficient of determination
Il coefficiente rIl coefficiente r che abbiamo appena calcolato indica la direzionedella correlazione, in particolare:
I un valore di −1 indica una perfetta correlazione negativa;
I un valore di 0 indica totale assenza di correlazione;
I un valore di +1 indica una perfetta correlazione positiva.
Il coefficiente r 2
I Il coefficiente r2 indica la forza della correlazione ed e definitosemplicemente come r2 = r · r .
I Se, ad esempio, r2 e pari a 0, 75, vuol dire che il 75% dellavarianza di X e spiegato dalla varianza di Y e viceversa.
I La varianza residua sara pari a 1− r2 per entrambe la variabili.
![Page 26: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/26.jpg)
Coefficient of determination
Il coefficiente rIl coefficiente r che abbiamo appena calcolato indica la direzionedella correlazione, in particolare:
I un valore di −1 indica una perfetta correlazione negativa;
I un valore di 0 indica totale assenza di correlazione;
I un valore di +1 indica una perfetta correlazione positiva.
Il coefficiente r 2
I Il coefficiente r2 indica la forza della correlazione ed e definitosemplicemente come r2 = r · r .
I Se, ad esempio, r2 e pari a 0, 75, vuol dire che il 75% dellavarianza di X e spiegato dalla varianza di Y e viceversa.
I La varianza residua sara pari a 1− r2 per entrambe la variabili.
![Page 27: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/27.jpg)
Coefficient of determination
Il coefficiente rIl coefficiente r che abbiamo appena calcolato indica la direzionedella correlazione, in particolare:
I un valore di −1 indica una perfetta correlazione negativa;
I un valore di 0 indica totale assenza di correlazione;
I un valore di +1 indica una perfetta correlazione positiva.
Il coefficiente r 2
I Il coefficiente r2 indica la forza della correlazione ed e definitosemplicemente come r2 = r · r .
I Se, ad esempio, r2 e pari a 0, 75, vuol dire che il 75% dellavarianza di X e spiegato dalla varianza di Y e viceversa.
I La varianza residua sara pari a 1− r2 per entrambe la variabili.
![Page 28: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/28.jpg)
Coefficient of determination
Il coefficiente rIl coefficiente r che abbiamo appena calcolato indica la direzionedella correlazione, in particolare:
I un valore di −1 indica una perfetta correlazione negativa;
I un valore di 0 indica totale assenza di correlazione;
I un valore di +1 indica una perfetta correlazione positiva.
Il coefficiente r 2
I Il coefficiente r2 indica la forza della correlazione ed e definitosemplicemente come r2 = r · r .
I Se, ad esempio, r2 e pari a 0, 75, vuol dire che il 75% dellavarianza di X e spiegato dalla varianza di Y e viceversa.
I La varianza residua sara pari a 1− r2 per entrambe la variabili.
![Page 29: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/29.jpg)
Linea di regressione
I La linea di regressione e la linea che meglio interpola i puntidel grafico, secondo la strategia dei minimi quadrati.
I Prendiamo l’equazione generica di una retta nel piano:
y = mx + q
I Il coefficiente angolare della retta di regressione e dato da
m =DXY
DX(11)
I L’intercetta della retta di regressione e data da
q = Y −mX (12)
![Page 30: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/30.jpg)
Linea di regressione
I La linea di regressione e la linea che meglio interpola i puntidel grafico, secondo la strategia dei minimi quadrati.
I Prendiamo l’equazione generica di una retta nel piano:
y = mx + q
I Il coefficiente angolare della retta di regressione e dato da
m =DXY
DX(11)
I L’intercetta della retta di regressione e data da
q = Y −mX (12)
![Page 31: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/31.jpg)
Linea di regressione
I La linea di regressione e la linea che meglio interpola i puntidel grafico, secondo la strategia dei minimi quadrati.
I Prendiamo l’equazione generica di una retta nel piano:
y = mx + q
I Il coefficiente angolare della retta di regressione e dato da
m =DXY
DX(11)
I L’intercetta della retta di regressione e data da
q = Y −mX (12)
![Page 32: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/32.jpg)
Linea di regressione
I La linea di regressione e la linea che meglio interpola i puntidel grafico, secondo la strategia dei minimi quadrati.
I Prendiamo l’equazione generica di una retta nel piano:
y = mx + q
I Il coefficiente angolare della retta di regressione e dato da
m =DXY
DX(11)
I L’intercetta della retta di regressione e data da
q = Y −mX (12)
![Page 33: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/33.jpg)
Previsioni in base alla retta di regressione
Il concetto di residuo
I Un residuo e la differenza tra il valore di Y letto sulla retta diregressione e quello osservato.
I Possiamo calcolare la somma dei residui quadrati come
ΣR2 = DY · (1− r2) (13)
dove R2 e un residuo quadrato e 1− r2, come ricorderete, e lavarianza residua.
![Page 34: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/34.jpg)
Previsioni in base alla retta di regressione
Il concetto di residuo
I Un residuo e la differenza tra il valore di Y letto sulla retta diregressione e quello osservato.
I Possiamo calcolare la somma dei residui quadrati come
ΣR2 = DY · (1− r2) (13)
dove R2 e un residuo quadrato e 1− r2, come ricorderete, e lavarianza residua.
![Page 35: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/35.jpg)
Previsioni in base alla retta di regressione
L’errore standard dei residui
I ΣR2 ha la forma di una devianza; per ottenere una deviazionestandard, che chiameremo errore standard (dei residui),possiamo dividere per N ed estrarre la radice quadrata.
SER =
√ΣR2
N(14)
I Se pero vogliamo stimare l’errore standard dei residui di tuttala popolazione, dobbiamo dividere per N − 2:
SER =
√ΣR2
N − 2(15)
I Questo errore standard (dei residui) si distribuisce in modonormale!
![Page 36: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/36.jpg)
Previsioni in base alla retta di regressione
L’errore standard dei residui
I ΣR2 ha la forma di una devianza; per ottenere una deviazionestandard, che chiameremo errore standard (dei residui),possiamo dividere per N ed estrarre la radice quadrata.
SER =
√ΣR2
N(14)
I Se pero vogliamo stimare l’errore standard dei residui di tuttala popolazione, dobbiamo dividere per N − 2:
SER =
√ΣR2
N − 2(15)
I Questo errore standard (dei residui) si distribuisce in modonormale!
![Page 37: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/37.jpg)
Previsioni in base alla retta di regressione
L’errore standard dei residui
I ΣR2 ha la forma di una devianza; per ottenere una deviazionestandard, che chiameremo errore standard (dei residui),possiamo dividere per N ed estrarre la radice quadrata.
SER =
√ΣR2
N(14)
I Se pero vogliamo stimare l’errore standard dei residui di tuttala popolazione, dobbiamo dividere per N − 2:
SER =
√ΣR2
N − 2(15)
I Questo errore standard (dei residui) si distribuisce in modonormale!
![Page 38: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/38.jpg)
Previsioni in base alla retta di regressione
Data la nostra retta di regressione
y = mx + q
possiamo quindi inserire il nostro errore standard come
y = mx + q ± 1, 96SER (16)
ed otterremo un intervallo di confidenza di valori in cui abbiamouna probabilita di circa il 95% di ottenere una previsione corretta.
![Page 39: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/39.jpg)
Previsioni in base alla retta di regressione
Data la nostra retta di regressione
y = mx + q
possiamo quindi inserire il nostro errore standard come
y = mx + q ± 1, 96SER (16)
ed otterremo un intervallo di confidenza di valori in cui abbiamouna probabilita di circa il 95% di ottenere una previsione corretta.
![Page 40: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/40.jpg)
Previsioni in base alla retta di regressione
Data la nostra retta di regressione
y = mx + q
possiamo quindi inserire il nostro errore standard come
y = mx + q ± 1, 96SER (16)
ed otterremo un intervallo di confidenza di valori in cui abbiamouna probabilita di circa il 95% di ottenere una previsione corretta.
![Page 41: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/41.jpg)
Significativita della correlazione
La distribuzione di r
I Come si distribuisce r? Se riusciamo a capirlo, possiamostimarne la significativita.
I Effettuiamo 10 lanci di un paio di dadi (diversi) per 10.000volte: ogni serie di 10 lanci calcoliamo la correlazione tra ilvalore ottenuto sul primo dado ed il valore ottenuto sulsecondo.
I Ripetiamo il nostro esperimento per numeri di lanci diversi.
I La distribuzione di r e normale!
I Allora possiamo usare il solito trucco: quanta parte dellacurva e sottesa da −∞ ad un valore pari al mio r?
I Al solito, possiamo fare un test ad una od a due code.
![Page 42: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/42.jpg)
Significativita della correlazione
La distribuzione di r
I Come si distribuisce r? Se riusciamo a capirlo, possiamostimarne la significativita.
I Effettuiamo 10 lanci di un paio di dadi (diversi) per 10.000volte: ogni serie di 10 lanci calcoliamo la correlazione tra ilvalore ottenuto sul primo dado ed il valore ottenuto sulsecondo.
I Ripetiamo il nostro esperimento per numeri di lanci diversi.
I La distribuzione di r e normale!
I Allora possiamo usare il solito trucco: quanta parte dellacurva e sottesa da −∞ ad un valore pari al mio r?
I Al solito, possiamo fare un test ad una od a due code.
![Page 43: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/43.jpg)
Significativita della correlazione
La distribuzione di r
I Come si distribuisce r? Se riusciamo a capirlo, possiamostimarne la significativita.
I Effettuiamo 10 lanci di un paio di dadi (diversi) per 10.000volte: ogni serie di 10 lanci calcoliamo la correlazione tra ilvalore ottenuto sul primo dado ed il valore ottenuto sulsecondo.
I Ripetiamo il nostro esperimento per numeri di lanci diversi.
I La distribuzione di r e normale!
I Allora possiamo usare il solito trucco: quanta parte dellacurva e sottesa da −∞ ad un valore pari al mio r?
I Al solito, possiamo fare un test ad una od a due code.
![Page 44: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/44.jpg)
Significativita della correlazione
La distribuzione di r
I Come si distribuisce r? Se riusciamo a capirlo, possiamostimarne la significativita.
I Effettuiamo 10 lanci di un paio di dadi (diversi) per 10.000volte: ogni serie di 10 lanci calcoliamo la correlazione tra ilvalore ottenuto sul primo dado ed il valore ottenuto sulsecondo.
I Ripetiamo il nostro esperimento per numeri di lanci diversi.
I La distribuzione di r e normale!
I Allora possiamo usare il solito trucco: quanta parte dellacurva e sottesa da −∞ ad un valore pari al mio r?
I Al solito, possiamo fare un test ad una od a due code.
![Page 45: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/45.jpg)
Significativita della correlazione
La distribuzione di r
I Come si distribuisce r? Se riusciamo a capirlo, possiamostimarne la significativita.
I Effettuiamo 10 lanci di un paio di dadi (diversi) per 10.000volte: ogni serie di 10 lanci calcoliamo la correlazione tra ilvalore ottenuto sul primo dado ed il valore ottenuto sulsecondo.
I Ripetiamo il nostro esperimento per numeri di lanci diversi.
I La distribuzione di r e normale!
I Allora possiamo usare il solito trucco: quanta parte dellacurva e sottesa da −∞ ad un valore pari al mio r?
I Al solito, possiamo fare un test ad una od a due code.
![Page 46: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/46.jpg)
Significativita della correlazione
La distribuzione di r
I Come si distribuisce r? Se riusciamo a capirlo, possiamostimarne la significativita.
I Effettuiamo 10 lanci di un paio di dadi (diversi) per 10.000volte: ogni serie di 10 lanci calcoliamo la correlazione tra ilvalore ottenuto sul primo dado ed il valore ottenuto sulsecondo.
I Ripetiamo il nostro esperimento per numeri di lanci diversi.
I La distribuzione di r e normale!
I Allora possiamo usare il solito trucco: quanta parte dellacurva e sottesa da −∞ ad un valore pari al mio r?
I Al solito, possiamo fare un test ad una od a due code.
![Page 47: Correlazione tra due variabili - unibo.itachilles/scienze/07-Correlazione.pdfCorrelazione tra due variabili Variabili dipendenti e variabili indipendenti I La variabile indipendente](https://reader033.vdocuments.pub/reader033/viewer/2022042712/5f9fff04feb2a554c5088c30/html5/thumbnails/47.jpg)
Significativita della correlazione
La distribuzione di r
I Come si distribuisce r? Se riusciamo a capirlo, possiamostimarne la significativita.
I Effettuiamo 10 lanci di un paio di dadi (diversi) per 10.000volte: ogni serie di 10 lanci calcoliamo la correlazione tra ilvalore ottenuto sul primo dado ed il valore ottenuto sulsecondo.
I Ripetiamo il nostro esperimento per numeri di lanci diversi.
I La distribuzione di r e normale!
I Allora possiamo usare il solito trucco: quanta parte dellacurva e sottesa da −∞ ad un valore pari al mio r?
I Al solito, possiamo fare un test ad una od a due code.