estatística amintas paiva afonso. correlação e regressão
TRANSCRIPT
![Page 1: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/1.jpg)
Estatísticaamintas paiva
afonso
![Page 2: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/2.jpg)
Correlação e Regressão
![Page 3: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/3.jpg)
Associação &Variáveis Quantitativas
Situação 1: Deseja-se realizar uma investigação sobre a ocorrência de anemia e infecção em uma comunidade. Seria interessante poder estimar a concentração de hemoglobina e a contagem de eritrócitos e leucócitos no sangue pela medida do hematócrito. Para verificar a possibilidade de se usar tal procedimento, é conduzido um estudo-piloto a partir dos resultados da rotina de um laboratório de hematologia.
Como verificar se essas variáveis estão associadas?
![Page 4: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/4.jpg)
Testes de Hipóteses?
• Estabelecem se existe associação entre duas variáveis, mas...
• Não quantificam a força da associação; e
• Não permitem representar a relação existente sob uma forma funcional.
![Page 5: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/5.jpg)
Exame Leucócito Eritrócito Hemoglobina Hematócrito(103/mm3) (106/mm3) (g/dl) (%)
1 6.8 4.50 14.6 412 9.7 5.20 15.6 473 4.3 4.55 14.4 414 7.9 4.65 14.4 415 7.4 4.40 13.8 406 7.6 4.40 14.0 407 2.8 4.30 13.6 408 7.8 4.60 13.8 429 5.5 4.90 15.2 4410 4.6 4.10 13.0 3911 8.0 5.00 17.0 4612 7.0 5.17 16.0 4713 7.1 4.20 11.7 35... ... ... ... ...
138 10.5 4.50 13.4 39139 6.9 4.50 14.2 40140 13.5 4.45 13.6 40141 8.3 3.70 11.0 33142 7.0 4.30 12.7 38143 4.3 4.67 14.0 43144 2.7 4.40 12.7 39145 11.2 4.40 13.3 38147 5.9 4.40 11.9 37148 12.3 4.24 10.0 31
Associação &Variáveis Quantitativas
É possível fazer um gráfico das variáveis de interesse e analisar a existência de uma relação a partir da análise desse gráfico.
![Page 6: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/6.jpg)
Associação &Variáveis Quantitativas
Diagrama de Dispersão
• Representação gráfica que permite a visualização do comportamento conjunto das duas variáveis.
• É gráfico sobre o qual cada medida individual é representada por um ponto, sendo que a posição de cada ponto é determinada pelos valores observados em um indivíduo, para as duas características medidas (por exemplo, hematócrito e hemoglobina). É denominado, também, de gráfico XY.
![Page 7: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/7.jpg)
Diagrama de Dispersão
Análise
• Parece não haver uma relação entre o valor do hematócrito e o valor do leucócito.
![Page 8: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/8.jpg)
Diagrama de Dispersão
Análise
• Há uma relação crescente entre o valor do hematócrito e o valor de hemoglobina.
• Esta relação parece ser linear.
![Page 9: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/9.jpg)
Diagrama de Dispersão
Análise
• Há uma relação crescente entre o valor do hematócrito e o valor do eritrócito.
• Esta relação parece ser linear.
![Page 10: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/10.jpg)
Diagramas
de Dispersão
A análise não é alterada, se trocamos as variáveis X e Y, ou seja, a existência ou não da relação não depende de qual variável é considerada independente.
O modelo matemático, porém, será alterado a depender de quem é X.
![Page 11: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/11.jpg)
Associação &Variáveis Quantitativas
Coeficiente de correlação linear de Pearson
Valor numérico que mede a intensidade da associação linear existente entre as duas variáveis, medida a partir de uma série de observações.
Karl Pearson(1857 – 1936)
![Page 12: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/12.jpg)
Coeficiente de Correlação Linear
Medindo a Força da Associação
n
yy
n
xx
n
yxxy
r2
2
2
2
![Page 13: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/13.jpg)
Coeficiente de Correlação Linear
Interpretando o valor de r
r - assume valores entre – 1 e + 1 inclusive.
• r – 1 associação linear negativa;
x y
x y
• r 0 ausência de associação linear;
• r + 1 associação linear positiva;
![Page 14: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/14.jpg)
Coeficiente de Correlação Linear
0
5
10
15
20
0 5 10
r = +1
0
10
20
30
40
50
60
0 5 10
r 0
0
5
10
15
20
0 5 10
r + 0,80
0
5
10
15
20
25
30
0 5 10
r - 0,800
5
10
15
20
25
30
0 5 10
r = - 1
Relação perfeita Relação
perfeita
![Page 15: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/15.jpg)
Teste de Hipóteses sob o Coeficiente de Correlação Linear
Testamos a hipótese nula: (bicaudal)0:0 rH
A estatística do teste é dada por:
21
2
r
nrt
e sob H0 , t tem distribuição t-Student com (n - 2) graus
de liberdade.
![Page 16: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/16.jpg)
Coeficiente de Correlação Linear Teste de Hipóteses
Exemplo 1: Vamos calcular o coeficiente de Pearson entre as variáveis hemoglobina e hematócrito.
98,21
148 ,88,0
t
nr
Para = 0,05 temos:
2,5% 2,5%
0
1,96
Rejeita se .
crítico críticot t t
H
Há correlação entre hematócrito e hemoglobina.
![Page 17: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/17.jpg)
Exemplo 2: Vamos calcular o coeficiente de Pearson entre as variáveis leucócito e hematócrito.
3492,0
148 ,0289,0
t
nr
Para = 0,05 temos:
2,5% 2,5%
0
1,96
Aceita se .
crítico críticot t t
H
Não há correlação entre hematócrito e leucócito.
Coeficiente de Correlação Linear Teste de Hipóteses
![Page 18: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/18.jpg)
Associação &Variáveis
Quantitativas
Modelos de Regressão
• Modelo matemático para a relação linear analisada.
• Permite a predição de uma variável em função de outra.
![Page 19: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/19.jpg)
Modelos LinearesSituação 2: Uma vez verificada a existência de uma relação entre a quantidade de hemoglobina e o número de hematócritos, desejamos desenvolver um modelo para estimar a medida de hemoglobina (variável y) a partir da medida de hematócrito (variável x).
Qual a reta que melhor se ajusta a estes dados?
4,00
6,00
8,00
10,00
12,00
14,00
200 400 600 800 1000 1200hematócrito
hem
oglo
bina
![Page 20: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/20.jpg)
Modelos Lineares
Equação da Reta
0
5
10
15
20
25
0 2 4 6
x
y
Inclinação da reta
Intercepto y
a a e b - parâmetros da reta
bxay
b
![Page 21: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/21.jpg)
Regressão Linear Simples
Método dos Mínimos QuadradosO objetivo é minimizar a soma do quadrado dos erros:
Obtendo os valores de e que minimizam a equação acima.
0b 1b0
2
4
6
8
10
12
0 2 4 6 8 10x
y
erro
( )i iy y
2^
yySQR
![Page 22: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/22.jpg)
Regressão Linear Simples
Método dos Mínimos Quadrados
bxay ˆ
n
xx
n
yxxy
b 22
xbya
Podemos utilizar a reta de regressão para estimar os valores de .y
![Page 23: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/23.jpg)
Reta de Regressão & Estimativa
Estimativa da Medida de Hemoglobina
Análise
O valor de homoglobina média estimada, para um valor observado de hematócrito igual a 40%, é de 13,97 g/dl.
4,00
6,00
8,00
10,00
12,00
14,00
200 400 600 800 1000 1200hematócrito
hem
oglo
bina
HtHb 2434,02327,4
)/(97,13
%40 Se
dlgHb
Ht
![Page 24: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/24.jpg)
Suponha que desejemos considerar o hematócrito como variável dependente. Neste caso, podemos calcular outra reta de regressão, pelo método dos mínimos quadrados, considerando a hemoglobina como variável x (independente) e o hematócrito como variável y (dependente).
Reta de Regressão & Estimativa
Estimativa da Medida de Hematócrito
O valor de hematócrito médio estimado, para um valor observado de hemoglobina Hb = 13,97 g/dl, é de 40,54%. Note que a reta, para Ht, não é a inversa da obtida para Hb.
HbHt 9017,200073,0
%54,40
)/(97,13 Se
Ht
dlgHb
![Page 25: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/25.jpg)
Exemplo 1:
Encontre a linha de regressão dos mínimos quadrados para os dados sobre renda e gasto com alimentação nos sete domicílios apresentados na tabela abaixo. Utilize renda como uma variável independente e gasto com alimentação como uma variável dependente.
Renda x
Gasto com Alimentaçãoy
xy x2
35 9 315 1225
49 15 735 2401
21 7 147 441
39 11 429 1521
15 5 75 225
28 8 224 784
25 9 225 625
212 64 2150 7222
![Page 26: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/26.jpg)
1429,97
64
2857,307
212
7222
2150
64
212
2
n
yy
n
xx
x
xy
y
x
![Page 27: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/27.jpg)
2642,07
2127222
764212
2150
2
b
b
1414,1)2857,30).(2642,0(1429,9 a
xy 2642,01414,1^
![Page 28: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/28.jpg)
Qualidade do Ajuste na Regressão
Coeficiente de Determinação
R2 = proporção da variabilidade de y que é explicada pelo modelo (reta de regressão)
20 1R
Se R2 = 0,90 significa que 90% da variação em y pode ser explicada pela equação obtida.
![Page 29: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/29.jpg)
Qualidade do Ajuste na Regressão Coeficiente de Determinação
Quando fazemos uma regressão linear, os valores observados (x,y) estão espalhados ao redor da reta de regressão. Quanto menor for este espalhamento, melhor a reta de regressão representa o conjunto de valores observados. A variância amostral total, como estimador do espalhamento, pode ser decomposta da seguinte forma:
n
yy
n
yxxyb
r 22
2
![Page 30: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/30.jpg)
Qualidade do Ajuste na Regressão Coeficiente de Determinação
Exemplo 2:
Para os dados da tabela do exemplo 1, sobre rendas mensais e gastos mensais com alimentação de sete domicílios, calcule o coeficiente de determinação.
b=0,2642SQxy=211,7143SQyy=60,8571
92,0
8571,60
7143,2112642,02 r
![Page 31: Estatística amintas paiva afonso. Correlação e Regressão](https://reader036.vdocuments.pub/reader036/viewer/2022062307/552fc0f8497959413d8b5c3c/html5/thumbnails/31.jpg)
www.matematiques.com.bramintas paiva
afonso