![Page 1: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/1.jpg)
Carlos Alberto Alves Varella
Pós-Graduação em Agronomia - CPGA-SolosAnálise Multivariada Aplicada as Ciências Agrárias
Regressão linear múltipla
![Page 2: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/2.jpg)
Ensinar modelagem estatística de fenômenos naturais aos alunos de pós-graduação utilizando técnicas da estatística multivariada.
Objetivo da disciplina
![Page 3: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/3.jpg)
Ementa da disciplina
Regressão linear múltipla Regressão linear múltipla para dados repetidos Validação da predição Correlação múltipla Análise de componentes principais Análise discriminante de Fisher Análise de variância multivariada - MANOVA Análise de variáveis canônicas
![Page 4: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/4.jpg)
Avaliações
Uma ProvaTrabalhos semanaisTrabalho final: Cada aluno deverá
apresentar um seminário e um trabalho escrito sobre aplicações de técnicas da estatística multivariada em sua tese.
![Page 5: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/5.jpg)
Recursos computacionais
SAS: recomendado para análises estatísticas multivariadas por Revistas de nível internacional.
![Page 6: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/6.jpg)
Local para baixar arquivos da disciplina pela Internet
http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm
![Page 7: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/7.jpg)
Universidade Federal Rural do Rio de Janeiro CPGA-CS
Modelos Lineares(revisão)
![Page 8: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/8.jpg)
Modelos linearesSeja Y a variável que queremos
predizer a partir de um conjunto de variáveis preditoras X1, X2, ..., Xp. Então podemos escrever:
Y representa a resposta; X1,X2,..., Xp são as variáveis estudadas; ε representa outro conjunto de variáveis não
consideradas no estudo;
,X,,X,XfY p21
![Page 9: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/9.jpg)
Requisitos da função
Deve prestar-se ao tratamento matemático;
Deve ser adequada para o conjunto de dados em estudo;
Deve ser simples ou pelo menos mais simples dentre as concorrentes.
f
![Page 10: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/10.jpg)
Condição para que um modelo seja linear
Um modelo para as observações Y será linear se:
Este modelo é definido como Modelo Linear de Gauss-Markov-Normal.
)(Y
2,N~,Y
Vamos estudar o caso em que os erros são normalmente distribuídos, independentes e homocedásticos.
![Page 11: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/11.jpg)
A superfície de resposta
O modelo linear é a chave do negócio, isto é, tem inúmeras aplicações na estatística multivariada.
É a superfície gerada pelos valores da variável de resposta. O modelo linear para uma única variável de resposta ‘Y’ com ‘p’ variáveis preditoras é:
.n,,2,1i
eXXXY ipipi22i110i
Yi = superfície de respostan = número de observações;p = número de variáveis preditoras.
![Page 12: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/12.jpg)
Duas situações são encontradas na modelagem
1. A matriz X’X de variáveis preditoras ‘X’ é de posto coluna completo. Neste caso o modelo é chamado de posto completo ou modelo de regressão. É o modelo que estamos estudando;
2. A matriz X’X de variáveis preditoras ‘X’ é de posto coluna incompleto. Neste caso o modelo é chamado de posto incompleto é o modelo da ANOVA (ANalysis Of VAriance)
Conseqüências da estimação
![Page 13: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/13.jpg)
Posto ou Rank de matrizes Número de linhas ou colunas linearmente
independentes de uma matriz.
Em nosso caso, o posto é o número de colunas linearmente independentes da matriz X’X, sendo X a matriz dos valores das variáveis preditoras ou “independentes”
No programa computacional MATLAB o comando rank faz uma estimativa do posto de matrizes.
Conseqüências da estimação
![Page 14: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/14.jpg)
Condições para que a matriz X’X seja de posto coluna completo
O posto ou rank da matriz X’X deve ser igual a ‘p+1’, ou seja:
1pX'Xposto
p é o número de variáveis preditoras estudas no modelo.
Conseqüências da estimação
![Page 15: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/15.jpg)
Condições para que a matriz X’X tenha inversa (X’X)-1
As matrizes que possuem inversa são chamadas NÃO SINGULARES.
Somente matrizes quadradas podem ser não singulares. Contudo, nem toda matriz quadrada é não singular;
Conseqüências da estimação
![Page 16: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/16.jpg)
Quando uma matriz quadrada é singular?
Seu determinante é nulo; det(X’X)Ao menos uma de suas raízes
características é nula. As raízes características são os autovalores da matriz; eig(X’X)
Seu posto é menor que p; rank(X’X)Não é definida positiva ou negativa.
Conseqüências da estimação
![Page 17: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/17.jpg)
Matriz definida positiva (negativa)
Quando todos os autovalores são positivos (negativos).
Conseqüências da estimação
![Page 18: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/18.jpg)
Regressão Linear Múltipla
![Page 19: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/19.jpg)
IntroduçãoÉ uma técnica da estatística
multivariada utilizada para a predição de valores de uma ou mais variáveis de resposta (dependentes) a partir de diversas variáveis preditoras ou independentes.
JOHNSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. 5th ed. Upper Saddle River, New Jersey: Prentice-Hall, 2002, 767 p.
![Page 20: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/20.jpg)
Pode também ser utilizada para estudar o efeito dos preditores sobre as variáveis de resposta.
Primeiro trabalho sobre o assunto: Regression Towards Mediocrity in Heredity Stature. Journal of the Anthropological Institute, 15 (1885). 246-263.
Mediocridade em função da estatura hereditária
Estatística UNIVARIADA. Segundo JOHNSON & WICHERN (2002) nesse artigo o autor não percebeu a importância da técnica para análises multivariadas.
Introdução (Cont.)
![Page 21: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/21.jpg)
Modelagem da Regressão Linear
![Page 22: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/22.jpg)
Pressuposições da modelagem
O modelo utilizado é o de Gauss-Markov-Normal Pressupõe que a resposta apresenta uma média.
Pressupõe ainda que essa média contem erros provenientes de medições aleatórias e de outras fontes não explicitadas pelo modelo.
O erro, e conseqüentemente a resposta, são tratados como variáveis aleatórias, que o comportamento é caracterizado assumindo-se uma distribuição NORMAL para os dados experimentais.
![Page 23: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/23.jpg)
Este método consiste em se determinar o estimador que minimiza a soma do quadrado das diferenças entre valores observados e valores preditos pelo modelo.
linear modelo o é XY
de estimador o ˆ determinar Queremos
Estimadores dos parâmetros pelo método dos mínimos quadrados
![Page 24: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/24.jpg)
O erro do modelo na forma matricial é:
XY
p
1
0
pnn2n1
2p2212
1p2111
n
2
1
n
2
1
,
XXX1
XXX1
XXX1
X,
Y
Y
Y
Y,
e
e
e
O problema consiste em se ajustar um modelo de regressão.
O erro da modelagemEstimadores dos parâmetros pelo método dos mínimos quadrados
![Page 25: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/25.jpg)
Modelo de regressão
O estimador de beta é chamado de beta chapéu e pode ser determinado por outros métodos de minimização do erro, como por exemplo o método da máxima verossimilhança.
.n,,2,1i,XˆXˆXˆˆY pipi22i110i
p
1
0
ˆ
ˆ
ˆ
ˆ
Estimadores dos parâmetros pelo método dos mínimos quadrados
![Page 26: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/26.jpg)
O método dos mínimos quadrados
Sabendo que o erro do modelo é:
XY
Então o somatório ao quadrado das diferenças dos erros pode ser representado na forma matricial por:
2XYZ
De acordo com o método temos que minimizar Z
Estimadores dos parâmetros pelo método dos mínimos quadrados
![Page 27: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/27.jpg)
Minimização da função Z
As matrizes Y’Xβ e β’X’Y uma é a transposta da outra e são de dimensão 1x1, então as matrizes são iguais.
2XYZ
X'X'Y'X'X'YY'YZ
XY'X''YZ
XYXYZ '
Estimadores dos parâmetros pelo método dos mínimos quadrados
![Page 28: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/28.jpg)
X'X'Y'X'2Y'YZ
Diferenciando a função Z
dX'X'X'X'dY'X'd2dZ
As matrizes (dβ’)X’Xβ e β’X’X(dβ) uma é a transposta da outra e são de dimensão 1x1, então as matrizes são iguais.
Y'XX'X'd2dZ
X'X'd2Y'X'd2dZ
Estimadores dos parâmetros pelo método dos mínimos quadrados
![Page 29: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/29.jpg)
Fazendo com que a diferencial de Z seja igual a zero
Para que a diferencial de Z seja zero
0dZ
0Y'XX'X'd2
Para que dZ seja zero, (X’Xβ-X’Y) deve ser igual a zero.
0Y'XˆX'X
Estimadores dos parâmetros pelo método dos mínimos quadrados
![Page 30: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/30.jpg)
O beta chapéuAssim é chamado o vetor estimador
dos parâmetros de beta. O vetor beta chapéu é determinado
resolvendo-se o sistema de equações normais:
Y'XˆX'X
Estimadores dos parâmetros pelo método dos mínimos quadrados
![Page 31: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/31.jpg)
Solução do sistema de equações normais
Multiplicando-se ambos os membros do sistema de
equações por
Y'XˆX'X
1X'X
Temos: Y'XX'XˆX'XX'X 11
Y'XX'Xˆ 1 O modelo de regressão pressupõe um beta chapéu
único não tendencioso (blue). Mas isso precisa de
ser testado.
Estimadores dos parâmetros pelo método dos mínimos quadrados
![Page 32: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/32.jpg)
O modelo que estamos estudando é o Linear de Gauss-Markov-Normal.
2,N~,XY
modelo do erro o é esteXY
Regressão Linear Múltipla
Conseqüências da estimação
![Page 33: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/33.jpg)
A média do modelo linear
Quando trabalhos com dados experimentais assumimos que o estimador da média ‘x barra’ pode representar a média ‘μ’ da população. Mas depois precisamos testar se isso é verdadeiro.
'.' média
como conhecido também população, da
matemática esperança a éX Y
Conseqüências da estimação
![Page 34: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/34.jpg)
.ˆ o , de estimador
do e X preditoras variáveis de valores de
linear combinação uma de função em
Y para obtidos valores é, isto modelo,
pelo preditos valores os sãoˆXY
Quando trabalhos com dados experimentais determinamos o beta chapéu a partir de amostras da população. Por isso é que precisamos testar se esse beta é mesmo estimador não tendencioso.
Os valores preditos pelo modeloConseqüências da estimação
![Page 35: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/35.jpg)
desvio.ou
resíduo de chamado também ajustado,
modelo do erro o é ˆXYYYˆ
O erro do modelo de regressão
Este é o erro que calculamos quando trabalhamos com dados experimentais.
É um vetor que descreve a distribuição dos dados experimentais. Muitas inferências sobre nossos dados podem ser feitas analisando-se esse vetor.
Conseqüências da estimação
![Page 36: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/36.jpg)
O que queremos modelar
fenômeno. do modelagem na erro o é :ˆ
estudado; fenômeno do modelagem a é :Y
modelar; queremos que fenômeno o é :Y
ˆYY
Quando trabalhos com dados experimentais assumimos que nossas observações são capazes de modelar o fenômeno, e depois testamos.
Conseqüências da estimação
![Page 37: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/37.jpg)
Prática 1 Na tabela abaixo apresentamos os valores de uma
amostra de 6 observações das variáveis Yi, X1i e X2i.
Yi X1i X2i
1,5 0 0
6,5 1 2
10,0 1 4
11,0 2 2
11,5 2 4
16,5 3 6
Fonte: Apostila de INF 664 Modelos Lineares. Adair José Regazzi,UFV, Viçosa, 2002.
![Page 38: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/38.jpg)
Montar do sistema de equações normais
631
421
221
411
211
001
X
Quando a regressão é com intercepto adicionados uma coluna de uns na matriz de dados.
X com intercepto
63
42
22
41
21
00
X
X sem intercepto
5,16
5,11
0,11
0,10
5,6
5,1
Y
Resposta Y
Prática 1
![Page 39: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/39.jpg)
Obtenção da matriz X’X
Esta matriz é obtida multiplicando-se a transposta da matriz X por ela mesma.
763618
36199
1896
631
421
221
411
211
001
642420
322110
111111
X'X
Prática 1
![Page 40: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/40.jpg)
Obtenção da matriz X’YEsta matriz é obtida multiplicando-se a
transposta da matriz X pelo vetor Y.
220
111
57
5,16
5,11
0,11
0,10
5,6
5,1
642420
322110
111111
Y'X
Prática 1
![Page 41: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/41.jpg)
Sistema de equações normais Estimativa de beta pelos método dos
mínimos quadrados
1
3
2
220
11
57
763618
36199
1896
B
B
B 1
2
1
0
Prática 1
regressão de equação a é :X13X2Y
s.regressore os são: e
regressão; de equação da intercepto o é :ˆ
2i1ii
21
0
![Page 42: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/42.jpg)
Programa na linguagem MATLAB
![Page 43: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/43.jpg)
Exemplos de comandos do Programa computacional MATLAB
![Page 44: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/44.jpg)
Resultados obtidos no Programa computacional MATLAB
Vetor de parâmetros
Posto da matriz
Determinante da matriz
Autovalores da matriz
![Page 45: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/45.jpg)
Análise de Variância da Regressão Linear
![Page 46: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/46.jpg)
A análise de variância da regressão é a estatística utilizada para testar os regressores. A hipótese nula é que todos os regressores são iguais e zero. Caso isso não ocorra o resultado da análise é significativo, isto é, rejeita-se a hipótese nula.
A análise de variância não testa o intercepto.
Análise de variância da regressão linear
0: 210 pH
![Page 47: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/47.jpg)
Algumas Pressuposições do Modelo
Beta chapéu é um estimador não tendencioso:
ˆ
A esperança do erro do modelo é zero e a esperança da variância dos erros é constante:
2IVe
![Page 48: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/48.jpg)
Variâncias e Covariâncias do Vetor Estimador dos Parâmetros
O vetor estimador dos parâmetros é beta chapéu:
21' )X'X(])ˆ()ˆ[()ˆ(Cov
A covariância deste vetor é:
21 ˆ)'()ˆ( XXCov 21)'()ˆ( sXXCov
s2 é o Quadrado médio do resíduo.
![Page 49: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/49.jpg)
Soma de Quadrado do ResíduoSoma dos quadrados dos desvios entre os
valores observados e os estimados pela equação de regressão.
2n
1iii YYsReSQ
Escrito na forma matricial é:
Y'X'ˆY'YsReSQ
![Page 50: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/50.jpg)
Soma de Quadrado Total
Matricialmente podemos escrever:
n
Y
YSQTotal
2n
1iin
1i
2i
cY'YSQTotal Y'uu'Yn
1c
u é um vetor de 1’s de dimensão n x 1.
![Page 51: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/51.jpg)
Soma de Quadrado da Regressão
Na forma matricial escrevemos:
2n
1ii YYgReSQ
Y'uu'Yn
1Y'X'ˆgReSQ
![Page 52: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/52.jpg)
Esquema da análise de variância da regressão
n =número de observações; p =número de variáveis Análise para dados não repetidos
Causa de variação GL SQ QM F
Regressão p SQReg/p
Resíduo n-p-1 SQRes/n-p-1
Total n-1
cY'X'ˆ -b
Y'X'ˆY'Y b-
cY'Y -
sReQM
gReQM
![Page 53: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/53.jpg)
Teste F dos parâmetros
Se os erros ei têm distribuição normal e se o quociente
0p21
É o mesmo que testar se:
sReQM
gReQMF
tem distribuição F (central) com p e n-p-1 graus de liberdade.
0:H p210
F é utilizado para testar a hipótese:
![Page 54: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/54.jpg)
Quando o teste F é significativo?
Quando F é maior que o tabelado;Quando rejeitamos a hipótese nula;Contudo não é possível concluir quais
parâmetros são significativos;Exceto para o caso particular de p=1.
![Page 55: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/55.jpg)
Teste t dos parâmetrosUtilizado para testar hipótese a respeito dos
parâmetros da regressão .
gl. 1)-p-(n a associado,)ˆ(s
ˆt
i
ii
A estatística utilizada é:
O teste é significativo quando t é maior que o valor tabelado.
![Page 56: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/56.jpg)
Hipóteses a Respeito dos Parâmetros no Modelo Linear
A hipótese de nulidade pode ser construída a partir de m combinações lineares independentes
'c:H0
c’ é uma matriz com m linhas e p+1 colunas
]cccc['c p210
![Page 57: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/57.jpg)
θ é um vetor m-dimensional de constantes conhecidas.
m
2
1
![Page 58: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/58.jpg)
Estatística F usada para testar a hipótese H0:c’=θ
2
11
0 ˆm
)ˆ'C(]C)X'X('C[)'ˆ'C()H(F
Sendo verdadeira a hipótese de nulidade a estatística F(H0) tem distribuição F com m e n-posto[X]=n-p-1 graus de liberdade.
Estatística de WaldPara teste F simultâneo dos parâmetros
![Page 59: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/59.jpg)
Exemplo: testar a hipótese H0:1=2=0
Posto [c’]=m=2
0e0:H0
0
100
010'c:H 210
2
1
0
0
1
3
1
3
2
100
010ˆ'c
1
3
0
0
1
3ˆ'c
![Page 60: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/60.jpg)
Exemplo: testar a hipótese H0:1=2=0
3354
54132
240
1c)x'x('c 1
6132
654
654
633
c)x'x('c11
50,1251
3
6132
654
654
633
13
![Page 61: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/61.jpg)
Rejeita-se a hipótese H0:1=2=0
Exemplo: testar a hipótese H0:1=2=0
00,1126
00,3
1pn
y'x'ˆy'yQMRsˆ 22
**0 75,62
)00,1(2
50,125)H(F
82,30)3;2(F %1
![Page 62: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/62.jpg)
Estatística t usada para testar a hipótese H0:c’=θ
Podemos usar t para testar hipóteses a respeito de combinações lineares dos parâmetros
gl. 1)-p-(n a ,)ˆ'(ˆ
'ˆ'associado
cV
cct
GLR)X(poston1pn
![Page 63: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/63.jpg)
Teste Simultâneo dos Parâmetros
Testa uma única hipótese;Testa um vetor de betas;Não é o mesmo que testar os betas
separadamente. Isto é, testar
Não é o mesmo que testar
0:He0:H 2110
0
0:Hou0:H
2
10210
![Page 64: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/64.jpg)
Programa SAS (reg_cap1.sas)proc reg data=sas.ind_v9;
/*ndvi rnir gnir arvi savi gndvi*/
model N = ndvi rnir gnir arvi savi gndvi;
output out=p p=yhat r=resid;
print p;
run;
quit;
proc reg;
model yhat=N;
test N=1, intercept=0;
run;
plot yhat*N;
run;
quit;
![Page 65: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/65.jpg)
Output do SAS – Análise de variância do modelo de regressão
The SAS System 23:15 Thursday, October 7, 2009 5
The REG Procedure
Model: MODEL1
Dependent Variable: N N
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 6 20710 3451.59735 4.39 0.0293
Error 8 6290.41589 786.30199
Corrected Total 14 27000
Root MSE 28.04108 R-Square 0.7670
Dependent Mean 60.00000 Adj R-Sq 0.5923
Coeff Var 46.73513
![Page 66: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/66.jpg)
Teste t dos beta-chapéu do modelo de regressão
Parameter Estimates
Parameter Standard
Variable Label DF Estimate Error t Value Pr > |t|
Intercept Intercept 1 1835.59747 1483.61562 1.24 0.2511
NDVI NDVI 1 -15182 19298 -0.79 0.4541
RNIR RNIR 1 -1698.66240 3814.27214 -0.45 0.6679
GNIR GNIR 1 -413.90081 2665.47402 -0.16 0.8804
ARVI ARVI 1 546.46984 283.26026 1.93 0.0898
SAVI SAVI 1 8350.10834 13196 0.63 0.5445
GNDVI GNDVI 1 594.04446 2908.94995 0.20 0.8433
![Page 67: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/67.jpg)
Dependent Predicted
Obs Variable Value Residual
1 0 -16.4019 16.4019
2 0 -3.4152 3.4152
3 0 19.8021 -19.8021
4 30.0000 30.9970 -0.9970
5 30.0000 68.5033 -38.5033
6 30.0000 47.8805 -17.8805
7 60.0000 67.1267 -7.1267
8 60.0000 99.6748 -39.6748
9 60.0000 61.1820 -1.1820
10 90.0000 68.4044 21.5956
11 90.0000 65.1605 24.8395
12 90.0000 78.0660 11.9340
13 120.0000 97.4010 22.5990
14 120.0000 116.5953 3.4047
15 120.0000 99.0235 20.9765
Sum of Residuals -3.6067E-11
Sum of Squared Residuals 6290.41589
Predicted Residual SS (PRESS) 28335
Níveis de N preditos pelo modelo
![Page 68: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/68.jpg)
Gráfico: Predito x Observado
![Page 69: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/69.jpg)
Conclusão
O modelo de regressão multivariado proposto não pode ser utilizado para predizer níveis de N aplicados no solo.
![Page 70: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/70.jpg)
Exemplo de regressão linear múltipla com duas vaiáveis independentes
Y X1 X2
1,5 0 0
6,5 1 2
10 1 4
11 2 2
11,5 2 4
16,5 3 6
![Page 71: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/71.jpg)
Programa SAS
![Page 72: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/72.jpg)
Resumo do Stepwise
![Page 73: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/73.jpg)
Valores preditos
![Page 74: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/74.jpg)
Regressão entre predito e observado
![Page 75: Carlos Alberto Alves Varella Pós-Graduação em Agronomia - CPGA-Solos Análise Multivariada Aplicada as Ciências Agrárias Regressão linear múltipla](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc122497959413d8cbde0/html5/thumbnails/75.jpg)
Validação da predição