Download - Estatística Multivariada.pdf
-
MINISTRIO DA EDUCAO E DO DESPORTO UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CINCIAS EXATAS
ANLISE MULTIVARIADA
Daniel Furtado Ferreira
LAVRAS, MG
1996
-
ii
SUMRIO Pg.
1. Aspectos da anlise multivariada 1
1.1. Introduo 1
1.2. Aplicao das tcnicas multivariadas 3
1.3. Organizao de dados 5
1.4. Distncias 15
1.5. Exerccios 24
2. lgebra vetorial e matricial 25
2.1. Introduo 25
2.2. Elementos de lgebra vetorial 26
2.3. Elementos de lgebra matricial 34
2.4. Exerccios 82
3. Amostragem multivariada 89
3.1. Introduo 89
3.2. Geometria amostral 90
3.3. Amostras aleatrias e esperanas do vetor de mdia e da matriz de covarincia amostral. 101
3.4. Varincia generalizada 104
3.5. Varincia generalizada de variveis generalizadas 113
3.6. Outra generalizao da varincia 116
3.7. Exerccios 117
-
iii
4. Distribuio normal multivariada 119
4.1. Introduo 119
4.2. Pressuposies das anlises multivariadas 120
4.3. Densidade normal multivariada e suas propriedades 121
4.4. Distribuio normal bivariada 125
4.5. Distribuio amostral de X e S 133
4.6. Distribuies amostral derivada da distribuio normal multivariada 138
4.7. Verificando a normalidade 143
4.8. Exerccios 169
5. Inferncias sobre o vetor mdia 171
5.1. Introduo 171
5.2. Inferncias sobre mdia de uma populao normal 171
5.3. Regio de confiana e comparaes simultneas de componentes de mdia 177
5.4. Inferncias sobre propores de grandes amostras 190
5.5. Comparaes pareadas 192
5.6. Comparaes de vetores de mdias de duas populaes 199
5.7. Exerccios 215
6. Anlise de varincia multivariada 219
6.1. Introduo 219
6.2. Delineamento de classificao simples 220
-
iv
6.3. Intervalos de confiana simultneos para o efeito de tratamentos 230
6.4. Exerccios 232
7. Componentes principais 233
7.1. Introduo 233
7.2. Componentes principais populacionais 234
7.3. Componentes principais amostrais 250
7.4. Grficos dos componentes principais 256
7.5. Inferncias para grandes amostras 259
7.6. Exerccios 282
8. Anlise de agrupamento 285
8.1. Introduo 285
8.2. Medidas de parecena (similaridades e dissimilaridades) 286
8.3. Agrupamentos 296
8.4. Exerccios 308
9. Anlise de fatores 309
9.1. Introduo 309
9.2. Modelo de fatores ortogonais 310
9.3. Estimao de cargas fatoriais 316
9.4. Rotao fatorial 342
9.5. Teste da falta de ajuste do modelo fatorial 346
-
v
9.6. Escores fatoriais 349
9.7. Exerccios 354
10. Anlise de correlao cannica 355
10.1. Introduo 355
10.2. Variveis cannicas e correlao cannica populacionais 356
10.3. Variveis e correlaes cannicas amostrais 371
10.4. Inferncias para grandes amostras 380
10.5. Exerccios 386
11. Referencias bibliogrficas 389
Apndices 395
ndice remissivo 397
-
||[ ]||Aspectos da anlise multivariada
1
1.1. Introduo
Nos trabalhos cientficos, o problema de se inferir, a partir de dados
mensurados pelo pesquisador, sobre os processos ou fenmenos fsicos,
biolgicos ou sociais, que no se pode diretamente observar, uma realidade
constante. A pesquisa cientfica se constitui num processo interativo de
aprendizado. Para explicao de um fenmeno, o pesquisador em geral coleta e
analisa dados de acordo com uma hiptese. Por outro lado, a anlise destes
mesmos dados coletados de amostragem ou experimentao geralmente sugere
modificaes da explicao do fenmeno, alm disso, devido complexidade
destes fenmenos, o pesquisador deve coletar observaes de diferentes
variveis. Neste contexto, a inferncia estatstica realizada de acordo com o
paradigma hipottico-dedutivo (Bock, 1975).
Devido aos fenmenos serem estudados a partir de dados coletados
ou mensurados em muitas variveis, os mtodos estatsticos delineados para
obter informaes a partir destes conjuntos de informaes, so denominados de
mtodos de anlises multivariados. A necessidade de compreenso das relaes
-
1. Aspectos da anlise multivariada 2
entre as diversas variveis faz com que as anlises multivariadas sejam
complexas ou at mesmo difceis. O objetivo do presente material apresentar a
utilidade das tcnicas multivariada de uma forma clara, usando exemplos
ilustrativos e evitando o mximo de possvel de clculo.
Sendo assim, os objetivos gerais, para os quais a anlise
multivariada conduz so:
a. reduo de dados ou simplificao estrutural: o fenmeno sob estudo
representado da maneira mais simples possvel, sem sacrificar
informaes valiosas e tornando as interpretaes mais simples;
b. ordenao e agrupamento: agrupamento de objetos (tratamentos) ou
variveis similares, baseados em dados amostrais ou experimentais;
c. investigao da dependncia entre variveis: estudos das relaes
estruturais entre variveis muitas vezes de interesse do pesquisador;
d. predio: relaes entre variveis devem ser determinadas para o
propsito de predio de uma ou mais varivel com base na observao
de outras variveis;
e. construo e teste de hipteses.
Os modelos multivariados possuem em geral, um propsito atravs
do qual o pesquisador pode testar ou inferir a respeito de uma hiptese sobre um
-
Ferreira, D.F. Estatstica multivariada 3
determinado fenmeno. No entanto a sua utilizao adequada depende do bom
conhecimento das tcnicas e das suas limitaes. A frase utilizada por Marriott
(1974) descreve bem este fato: No h mgica com os mtodos numricos, e que
apesar de serem uma importante ferramenta para anlise e interpretao de
dados, no devem ser utilizados como mquinas automticas de encher lingia,
transformando massas numricas em pacotes de fatos cientficos.
1.2. Aplicao de tcnicas multivariadas
As tcnicas estatsticas constituem se uma parte integral da pesquisa
cientfica e em particular as tcnicas multivariadas tem sido regularmente aplicada
em vrias investigaes cientficas nas reas de biologia, fsica, sociologia e
cincias mdicas. Parece, neste instante, ser apropriado descrever as situaes
em que as tcnicas multivariadas tm um grande valor.
Medicina
Nos estudos onde as reaes de pacientes a um determinado
tratamento so mensuradas em algumas variveis e possuem difcil diagnstico,
as tcnicas multivariadas podem ser usadas para construir uma medida de
resposta simples ao tratamento, na qual preservada a maior parte da informao
da amostra e das mltiplas variveis respostas. Em outras situaes as tcnicas
-
1. Aspectos da anlise multivariada 4
multivariadas podem ser usadas tambm quando a classificao de um paciente,
baseada nos sintomas medidos em algumas variveis, difcil de ser realizada.
Neste caso, uma tcnica multivariada de classificao, em que se cria uma funo
que pode ser usada para separar as pessoas doentes das no doentes, pode ser
implementada.
Sociologia
Em alguns estudos o inter-relacionamento e o agrupamento de
indivduos, cidades ou estados em grupos homogneos em relao mobilidade,
nmero de estrangeiros nascidos e de segunda gerao em determinado pas
necessria em alguns estudos sociolgicos. As tcnicas de anlise multivariada,
conhecidas como anlise de agrupamento (Cluster analysis), pode ser empregada
com esta finalidade.
Biologia
No melhoramento de plantas necessrio, aps o final de uma
gerao, selecionar aquelas plantas que sero os genitores da prxima gerao. a
seleo deve ser realizada de maneira que a prxima gerao seja melhorada em
relao resposta mdia de uma srie de caractersticas da gerao anterior. O
objetivo do melhorista consiste em maximizar o ganho gentico em um espao
-
Ferreira, D.F. Estatstica multivariada 5
mnimo de tempo. As anlises multivariadas podem ser usadas para converter
uma srie de caractersticas para um ndice, na qual a seleo e escolha dos pais
possam ser feitas.
Em algumas situaes se deseja a separao de algumas espcies,
e as tcnicas multivariadas tm sido utilizadas com esta finalidade. Uma funo
construda e os seus valores so usados para esta separao.
1.3. Organizao de dados
Atravs deste material pretende-se tratar das anlises realizadas em
muitas caractersticas ou variveis. Essas medidas, muitas vezes chamadas de
dados, devem ser organizadas e apresentadas em vrias formas. Por exemplo, a
utilizao de grficos e arranjos tabulares so importantes auxiliares nas anlises
de dados. Por outro lado, nmeros que resumem, ou seja, que descrevem
quantitativamente certas caractersticas, so essenciais para a interpretao de os
dados amostrais ou experimentais.
Arranjos
Os dados multivariados so provenientes de uma pesquisa em
determinada rea em que so selecionadas p 1 variveis ou caractersticas para
-
1. Aspectos da anlise multivariada 6
serem mensuradas. As medidas so tomadas em cada unidade da amostra ou do
experimento. A representao destes dados feita com a notao xjk para indicar
um valor particular da j-sima unidade amostral ou experimental e da k-sima
varivel mensurada. Conseqente, estas medidas de p variveis em n unidades
amostrais ou experimentais, podem ser representadas conforme o arranjo
apresentado na Tabela 1.1.
Tabela 1.1. Representao de dados atravs da notao xjk para indicar um valor
particular da k-sima varivel mensurada na j-sima unidade amostral
ou experimental.
Variveis
Unidades amostrais ou experimentais
1 2 ... k ... p
1 X11 X12... X1k... X1p
2 X21 X22... X2k... X2p
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. j Xj1 Xj2... Xjk... Xjp
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. n Xn1 Xn2... Xnk... Xnp
-
Ferreira, D.F. Estatstica multivariada 7
Estes valores, apresentados na Tabela 1.1, podem ser
representados em um arranjo retangular, denominado de X, com n linhas e p
colunas, da seguinte forma:
11 12 1 1
21 22 2 2
1 2
1 2
k p
k p
j j jk jp
n n nk np
x x x xx x x x
Xx x x x
x x x x
=
" "" "
# # # # # #" "
# # # # % #" "
Exemplo 1.1
Uma seleo de 4 firmas de rao de Minas Gerais foi obtida para
avaliar a venda de raes. Cada observao bivariada forneceu a quantidade de
sacos de rao vendidos e a quantidade de reais de cada venda. Os dados
obtidos na forma tabular so:
Varivel 1 (Reais/venda) 80 120 90 110
Varivel 2 (nmero de sacos de rao vendidos)
10
12
6
8
Usando a notao proposta anteriormente, tem-se:
X11=80 X21=120 X31=90 X41=110 X12=10 X22=12 X32=6 X42=8
E a matriz X dos dados :
-
1. Aspectos da anlise multivariada 8
80 10120 12
90 6110 8
X
=
A organizao dos dados em arranjos facilita a exposio e permite
que os clculos sejam efetuados de uma forma ordenada e eficiente. Os ganhos
na eficincia so: (1) descrio dos clculos como operaes com matrizes e
vetores; e (2) sua fcil implementao em computadores.
ESTATSTICAS DESCRITIVAS
Grandes conjuntos de dados possuem um srio obstculo para
qualquer tentativa de extrao de informaes visuais pertinentes aos mesmos.
muitas das informaes contidas nos dados podem ser obtidas por clculo de
certos nmeros, conhecidos como estatsticas descritivas. Por exemplo, a mdia
aritmtica ou mdia amostral, uma estatstica descritiva que fornece informao
de posio, isto , representa um valor central para o conjunto de dados. Como
um outro exemplo, a mdia das distncias ao quadrado de cada dado em relao
mdia, fornece uma medida de disperso, ou variabilidade.
s estatsticas descritivas que mensuram posio, variao e
associao linear so enfatizadas. As descries formais destas medidas esto
apresentadas a seguir.
A mdia amostral, simbolizada por X , dada por:
-
Ferreira, D.F. Estatstica multivariada 9
1
1 nk jk
jX X
n == k=1, 2, ..., p (1.1)
Uma medida de variao fornecida pela varincia amostral,
definida para as n observaes de i-sima varivel por:
( )221
11 =
= = n
k kk jk kj
S S X Xn
k = 1, 2, ..., p (1.2)
A raiz quadrada da varincia amostral, kkS , conhecida como
desvio padro amostral. Esta medida de variao est na mesma unidade de
medida das observaes.
Uma medida de associao entre as observaes de duas variveis,
variveis k e k, dada pela covarincia amostral:
( )( )' ' '1
11 =
= n
kk jk k jk kjX X X X
nS k, k=1,2, ..., p (1.3)
Se grandes valores de uma varivel so observados em conjunto
com grandes valores da outra varivel, e os pequenos valores tambm ocorrem
juntos, Skk ser positiva. Se grandes valores de uma varivel ocorrem com
pequenos valores da outra, Skk ser negativa. Se no h associao entre os
-
1. Aspectos da anlise multivariada 10
valores das duas variveis, Skk ser aproximadamente zero. Quando k=k, a
covarincia reduz-se a varincia amostral. Alm disso, Skk= Skk, para todo k e k.
A ltima estatstica descritiva a ser considerada aqui o coeficiente
de correlao amostral. Esta medida de associao linear entre duas variveis
no depende da unidade de mensurao. O coeficiente de correlao amostral
para k-sima e k-sima varivel, definido por:
( )( )( ) ( )
' '1'
'2 2
' '' '
1 1
=
= =
= =
n
jk k jk kjkk
kk n nkk k k
jk k jk kj j
X X X Xr
X X X X
SS S
(1.4)
Verifica-se que rkk=rkk para todo k e k. O coeficiente de correlao
amostral a verso estandardizada da covarincia amostral, onde o produto das
razes das varincias das amostras fornece a estandardizao.
O coeficiente de correlao amostral pode ser considerado como
uma covarincia amostral. Suponha que os valores Xjk e Xjk sejam substitudos
pelos valores padronizados, ( )jk kkk
X XS e ' ' ' '
( )jk kk k
X XS . Esses valores padronizados
so expressos sem escalas de medidas (adimensionais), pois so centrados em
zero e expressos em unidades de desvio padro. O coeficiente de correlao
amostral justamente a covarincia amostral das observaes estandardizadas.
A correlao amostral (r), em resumo, tem as seguintes
propriedades:
-
Ferreira, D.F. Estatstica multivariada 11
1. Os valores de r devem ficar compreendidos entre -1 e 1;
2. Se r = 0, implica em inexistncia de associao linear entre as variveis. Por
outro lado, o sinal de r, indica a direo da associao: se r < 0 h uma
tendncia de um dos valores do par ser maior que sua mdia, quando o outro
for menor do que a sua mdia, e r > 0 indica que quando um valor do par for
grande o outro tambm o ser, alm de ambos valores tender a serem
pequenos juntos;
3. Os valores de rkk no se alteram com a alterao da escala de uma das
variveis.
As estatsticas Skk e rkk, em geral, no necessariamente refletem
todo o conhecimento de associao entre duas variveis. Associaes no
lineares existem, as quais, no podem ser reveladas por estas estatsticas
descritivas. Por outro lado, estas estatsticas so muito sensveis a observaes
discrepantes (outliers).
Alm destas, outras estatsticas como a soma de quadrados de
desvios em relao mdia (Wkk) e a soma de produtos de desvios (Wkk), so
muitas vezes de interesse. Essas esto apresentadas a seguir:
-
1. Aspectos da anlise multivariada 12
2
1( )
== nkk jk k
jX XW
' ' '1( )( )
== nkk jk k jk k
jW X X X X
As estatsticas descritivas multivariadas calculadas de n observaes
em p variveis podem ser organizadas em arranjos.
Mdias da amostra
1
2
= #p
XX
X
X
Matriz de covarincia amostral
S
S S S
S S S
S S S
p
p
p p pp
=
11 12 1
21 22 2
1 2
""
# # % #"
-
Ferreira, D.F. Estatstica multivariada 13
Matriz de correlaes amostral
R
r r
r r
r r
p
p
p p
=
1
1
1
12 1
21 2
1 2
""
# # % #"
Exemplo 1.2
Considerando os dados introduzidos no exemplo 1.1, encontrar as o
vetor de mdias X e as matrizes S e R. Neste exemplo, cada firma de rao,
representa uma das observaes multivariadas, com p = 2 variveis (valor da
venda em reais e nmero de sacos de raes vendidas).
As mdias amostral so:
4
1 j1j 1
1 1X X (80 120 90 110) 1004 4=
= = + + + =
4
2 j2j 1
1 1X X (10 12 6 8) 94 4=
= = + + + =
1
2
1009
= = X
XX
A matriz de covarincia amostral :
-
1. Aspectos da anlise multivariada 14
S11=[(80-100)2+(120-100)2+(90-100)2+(110-100)2]/3 = 333,333
S22=[(10-9)2+(12-9)2+(6-9)2+(8-9)2]/3 = 6,667
S12=[(80-100)(10-9)+(120-100)(12-9)+(90-100) (6-9)+(110-100)(8-9)]/3 = 20,000
S21=S12=20,000, e
S =
333 333 20 00020 000 6 667
, ,, ,
A correlao amostral :
r1220
33 333 6 6670 424= =
, ,, 3
r21=r12=0,4243
Portanto,
1,0000 0, 4243R
0, 4243 1,0000 =
-
Ferreira, D.F. Estatstica multivariada 15
1.4. Distncias
A maioria das tcnicas multivariadas baseada no simples conceito
de distncia, por mais formidvel que isso possa parecer. O conceito de distncia
euclidiana deve ser familiar para a maioria dos estudantes. Se for considerado um
ponto P=(x1, x2) no plano cartesiano, a distncia deste ponto P da origem O=(0, 0),
definida por d(O,P), dada pelo teorema de Pitgoras por:
d O P x x( , ) = +12 22 (1.5)
Esta situao ilustrada na Figura 1.1. Em geral, se o ponto P tem p
coordenadas, de tal forma que P=(x1, x2, ... xp), a distncia de P da origem
O=(0, 0, ..., 0), pode ser generalizada por:
d O P x x x p( , ) ...= + + +12 22 2 (1.6)
-
1. Aspectos da anlise multivariada 16
X1
X2
P
d(O, P)
Figura 1.1. Distncia entre um ponto P=(x1, x2) e a origem O=(0, 0), fornecida pelo teorema de Pitgoras.
Todos os pontos (x1, x2, .., xp) que contm uma distncia ao
quadrado, denominada c2, da origem, satisfaz a equao:
d O P x x x cp2
12
22 2 2( , ) ...= + + + = (1.7)
A expresso em (1.7) representa a equao de uma hiperesfera (um
crculo se p = 2), e os pontos eqidistantes da origem por uma distncia d(O, P)
pertencem a essa hiperesfera. A distncia de um ponto P a um ponto arbitrrio Q,
com coordenadas P=(x1, x2, ... xp) e Q=(y1, y2, ... yp) dada por:
( ) ( ) ( )d P Q x y x y x yp p( , ) ...= + + + 1 1 2 2 2 2 2 (1.8)
-
Ferreira, D.F. Estatstica multivariada 17
A distncia euclidiana insatisfatria para muitas situaes
estatsticas. Isso ocorre devido contribuio de cada coordenada ter o mesmo
peso para o clculo da distncia. Quando estas coordenadas representam
medidas so provenientes de um processo que sofre flutuaes aleatrias de
diferentes magnitudes muitas vezes desejvel ponderar as coordenadas com
grande variabilidade por menores pesos em relao quelas com baixa
variabilidade. Isto sugere o uso de uma nova medida de distncia.
Ser apresentada a seguir uma distncia que considera as
diferenas de variao e a presena de correlao. Devido a escolha de a
distncia depender das varincias e das covarincias amostrais, a partir deste
instante, ser utilizado o termo distncia estatstica para distinguir de distncia
euclidiana.
A princpio, ser considerada a construo de uma distncia entre
um ponto P, com p coordenadas, da origem. O argumento que pode ser usado
refere-se ao fato de que as coordenadas de P podem variar no espao produzindo
diferentes posies para os pontos. Para ilustrar, suponha que se tenha n pares
de medidas em duas variveis (x1 e x2) e que as medidas de x1 variam
independentemente das mensuraes em x2. O significado de independente neste
ponto pode ser dado pelo fato de que os valores de x1 no podem ser preditos
com nenhuma acurcia a partir dos valores de x2 e vice-versa. Em adio,
assumido que as observaes de x1 possuem maior variabilidade que as de x2.
Uma ilustrao desta situao est apresentada na Figura 1.2.
-
1. Aspectos da anlise multivariada 18
-6 -4 -2 0 2 4 6
X2
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
Figura 1.2. Diagrama de disperso, mostrando a maior variabilidade na direo de
x1 do que na direo de x2.
Observando a Figura 1.2, verifica-se que no surpreendente
encontrar desvios na direo de x1 que se afastem da origem consideravelmente,
o que no ocorre na direo de x2. Parece ser razovel, ento, ponderar x2 com
mais peso do que x1 para um mesmo valor, quando as distncias da origem forem
calculadas.
-
Ferreira, D.F. Estatstica multivariada 19
Um modo de fazer isso dividir cada coordenada pelo desvio padro
amostral. Aps a diviso, tm-se as coordenadas estandardizadas 1 1 11*x x s= e
2 2 22*x x s= . Aps eliminar as diferenas de variabilidade das variveis
(coordenadas), determina-se a distncia usando a frmula euclidiana padro:
d O P x xxS
xS
( , ) ( ) ( )* *= + = +1 2 2 2 12
11
22
22 (1.9)
Usando a equao (1.9) todos os pontos tendo como coordenadas
(x1, x2) e com distncia quadrada (c2) da origem devem satisfazer:
12
11
22
22
2xS
xS
c+ = (1.10)
A expresso (1.10) a equao de uma elipse, cujos maiores e
menores eixos coincidem com os eixos das coordenadas. A Figura 1.3 mostra o
caso geral para p = 2 coordenadas.
-
1. Aspectos da anlise multivariada 20
OX1
X2
cS110.5-cS11
0.5
cS220.5
-cS220.5
Figura 1.3. Elipse de uma distncia estatstica quadrtica d2(O,P)= 12
11
22
22
2xS
xS
c+ = .
Exemplo 1.3
Um conjunto de pares (x1, x2) de duas variveis forneceu 1 2X X 1= = , S11=9 e S22=1. Supe-se que as observaes de x1 so independentes de x2. A
distncia quadrtica de um ponto arbitrrio (P) da origem, uma vez que as
varincias da amostra no so iguais, dada por:
d O Px x2 1
222
9 1( , ) = +
-
Ferreira, D.F. Estatstica multivariada 21
Todos os pontos (x1, x2) que possuem distncias quadrada da origem igual a 1,
satisfazem a equao:
x x12
22
9 11+ = (1.11)
As coordenadas de alguns pontos com distncia quadrtica unitria
da origem foram apresentadas na Tabela 1.2.
Tabela 1.2. Coordenadas de alguns pontos com distncia quadrtica unitria da
origem.
Coordenadas (x1, x2) Distncia ao quadrado
( 0, 1)
( 0,-1)
( 3, 0)
(-3, 0)
09
11
2 21+ =
09
11
2 2
1+ =( )
39
01
2 21+ =
( ) + =39 012 2
1
O grfico da equao (1.11) uma elipse centrada na origem (0,0),
cujo maior eixo o da direo de x1 e o menor da direo de x2. A metade do
maior eixo (semi-eixo maior) c S11 3= e do menor c S22 1= . A elipse de distncia
quadrtica unitria foi plotada na Figura 1.4.
-
1. Aspectos da anlise multivariada 22
-5 -4 -3 -2 -1 0 1 2 3 4 5
-5
-4
-3
-2
-1
0
1
2
3
4
5
x1
x2
Figura 1.4. Elipse de distncia unitria quadrtica da origem obtida a partir da
equao 1.11.
A expresso (1.9) pode ser generalizada para o clculo da distncia
entre pontos P e Q, cujas coordenadas variam, mutuamente independentemente
uma da outra. O caso mais geral, em que a hiptese de independncia no
satisfeita, ser abordado futuramente.
d P Qx yS
x yS
x y
Sp p
pp( , )
( ) ( ) ( )= + + + 1 12
11
2 22
22
2
" (1.12)
-
Ferreira, D.F. Estatstica multivariada 23
Todos os pontos (P) situados a uma distncia quadrtica constante
de Q, pertencem a uma hiperelipside centrada em Q, cujos maiores e menores
eixos so paralelos aos eixos das coordenadas.
O programa SAS, apresentado a seguir, contm os cdigos
necessrios para a obteno das principais estatsticas descritivas multivariadas
apresentadas nesse captulo. O programa contm cdigos matriciais e ser
abordado com mais detalhe nos prximos captulos. Os dados do exemplo 1.1 so
utilizados para a ilustrao.
Proc IML; X={ 80 10, 120 12, 90 6, 110 8}; Print X; n=nrow(X);p=ncol(X); Xbar=x`*j(n,1,1)/n; Print Xbar; q=i(n)-(1/n)*j(n,n,1); print q; S=(1/(n-1))*X`*q*X; W=(n-1)*S; print S W; V=diag(S); Vroot=half(V); IVroot=inv(Vroot); R=Ivroot*S*Ivroot; Print V Vroot IVroot; Print R; Quit;
Foi motivado nesse captulo o estudo das anlises multivariadas e
tentou-se fornecer alguns rudimentares, mas importantes, mtodos de organizar e
resumir os dados. Em adio, o conceito geral de distncia foi apresentado, e ser
abordado e generalizado nos prximos captulos.
-
1. Aspectos da anlise multivariada 24
1.5. Exerccios
Considere as amostras com 8 observaes e 3 variveis apresentadas a seguir:
x1 3 5 6 4 8 9 6 7
x2 6 11 11 9 15 16 10 12
x3 14 9 9 13 2 2 9 5
a) Construa o grfico de disperso dos pontos das variveis x1 e x2, x1 e x3, x2 e x3.
Comente sobre sua aparncia.
b) Calcule: X , S e R e interprete os valores em R.
c) Calcule a distncia euclidiana dada em (1.8) de um ponto
P=( x1, x2, x3)=(5, 12, 8) em relao a origem e em relao a X .
d) Calcule as mesmas distncias do item c, usando (1.12).
-
||[ ]||lgebra vetorial e matricial
2
2.1. Introduo
desejvel que as p respostas multivariadas sejam representadas
por uma notao concisa. Os dados multivariados podem ser dispostos
convenientemente como um arranjo de nmeros, como foi apresentado no
captulo 1. Em geral, um arranjo retangular destes nmeros, com n linhas e p
colunas, por exemplo, chamada de matriz de dimenses n x p. Se por outro lado,
o arranjo consiste em n mensuraes em apenas 1 varivel, ou ainda, de uma
observao multivariada em p variveis, esses arranjos so denominados de
vetores.
Com esse arranjo bidimensional, no s, a notao fica mais
concisa, mas os muitos resultados matemticos de lgebra vetorial e matricial
facilitam a derivao e exposio dos mtodos estatsticos multivariados. Neste
material, os elementos de lgebra vetorial e matricial, sero considerados como
conhecidos. Nesse captulo, no entanto, para os estudantes no familiarizados
com o assunto, ser apresentada uma breve reviso.
-
2. lgebra vetorial e matricial 26
2.2. Elementos de lgebra vetorial
De um ponto de vista geomtrico, as observaes multivariadas,
podem ser consideradas como pontos no espao p-dimensional, cujas
coordenadas so dadas por (x1, x2, ..., xp). Esse ponto pode ser visto como o final
de um segmento de reta da origem (0, 0, ..., 0) ao ponto (x1, x2, ..., xp). Tal
segmento de reta denominado de vetor de posio e pode ser denotado
simplesmente por X . O vetor de posies apenas um exemplo de vetor, para os
quais pode ser elaborada a lgebra, baseada nos seguintes postulados.
POSTULADOS
1. Para qualquer vetor X dado um nmero escalar c, a multiplicao do escalar
pelo vetor, resulta em outro vetor Y , definido por:
Y = c X
c ser considerado um nmero real;
2. A adio de dois vetores conduz a um nico vetor definido como:
-
Ferreira, D.F. Estatstica multivariada 27
Z = X + Y
3. A adio de vetores :
Comutativa: X + Y = Y + X
Associativa: X + ( )Y Z+ = ( )X Y Z+ +
4. Se 0 o vetor nulo, ento:
X + 0 = X
0 . X = 0
COMPRIMENTO, NGULO E DISTNCIA
Inicialmente, definido produto interno entre dois vetores, que
representa a soma de produtos de pares de coordenadas correspondentes. Para
dois vetores (n x 1) de posio X e Y , o produto interno ser o escalar, dado por:
n
i i 1 1 2 2 n ni 1
X.Y x y x y x y x y=
= = + + + "
-
2. lgebra vetorial e matricial 28
fcil verificar que X.Y Y.X= . Por meio, do produto interno possvel generalizar o teorema de Pitgoras para o espao euclidiano
n-dimensional:
n2 2 2 2 2 2
i 1 2 ni 1
X X.X x x x x d (P,O)=
= = = + + + = " (2.1)
em que P, o ponto do espao n-dimensional, definido pelas coordenadas do
vetor X . A expresso (2.1) o comprimento ao quadrado do vetor X . A
expresso entre mdulo | X | indica a norma de X .
Dessa forma o comprimento do vetor definido por:
X X.X= (2.2)
O ngulo entre dois vetores ( X e Y ) pode ser expresso em funo
do produto interno e do comprimento dos vetores, obtido atravs da lei dos
cosenos, por:
( ) X.YCosX.X Y.Y
=
(2.3)
As distncias apresentadas no captulo 1, entre os pontos
coordenados dos vetores X e Y , podem ser expressos agora como o
-
Ferreira, D.F. Estatstica multivariada 29
comprimento do vetor diferena das coordenadas de X e Y . A distncia entre X
e Y :
d(X, Y) X Y (X Y).(X Y)= = (2.4)
Alm de ser no negativa, essa distncia entre os dois vetores
independente da direo das medidas e satisfaz a desigualdade triangular:
d( X , Y ) d( X , Z ) + d( Y , Z ) (2.5)
Derivada a partir da desigualdade de Cauchy-Schwars:
a.b a . b (2.6)
O que implica, no fato, que o valor do co-seno do ngulo entre a e b no pode exceder a unidade.
ORTOGONALIDADE
Dois vetores no nulos so denominados ortogonais, se o co-seno
do ngulo entre eles for zero. Isto indica que:
-
2. lgebra vetorial e matricial 30
X.Y = 0 (2.7)
Muitas vezes desejvel (em sistemas de equaes lineares)
construir uma base ortonormal de vetores, isto , cada vetor da base possui
comprimento unitrio ( )i iX .X 1= e cada par de vetor da base so ortogonais ( )i jX .X 0, i j= . Para um conjunto de vetores arbitrrios pode-se empregar a construo de Gram-Schimidt. O algoritmo est apresentado a seguir,
considerando o conjunto 1 2 nX , X , ..., X de vetores:
Passo 1: normalize 1X :
11 1 1
1 1
XX ; X .X 0X .X
=
Passo 2: Ortonormalize 2X calculando o produto interno entre *1X e 2X , e
subtraindo de 2X os componentes de *1X :
Ortogonalizando 1X e 2X :
( )* *2 2 2 1 1X X X .X X =
Ento, normalizando-se 2X
:
-
Ferreira, D.F. Estatstica multivariada 31
*2 2 2 2
2 2
1X X ; X .X 0X .X
=
Passo 3: Calcule o produto interno de 3X com *1X e
*2X , e subtraia de 3X os
componentes de *1X e *2X ,
( ) ( )* * * *3 3 3 1 1 3 2 2X X X .X X X .X X =
Ento, normalizando-se 3X
:
*3 3 3 3
3 3
1X X ; X .X 0X .X
=
E assim por diante, at o n-simo estgio, quando todos os vetores
entrarem na construo. Se o i-simo vetor for linearmente dependente dos
vetores anteriores, ento iX
ser igual ao vetor nulo, iX 0 = , devendo ser
eliminado do conjunto e o processo deve continuar com o vetor i 1X + . O nmero de
vetores no nulos remanescentes no conjunto, constituem a dimenso do espao
vetorial original.
-
2. lgebra vetorial e matricial 32
Exemplo 2.1
Dado o conjunto de vetores, a seguir, utilizar como ilustrao a construo de
Gram-Schimidt.
1 1 01 1 0
X1 0 11 0 1
=
Os vetores de X so dados por:
X = [ 1X 2X 3X ]
Passo 1. Normalize 1X :
*1
111X121
=
Passo 2: Ortonormalize 2X :
Produto interno: 2X .*1X = 1
-
Ferreira, D.F. Estatstica multivariada 33
ortogonalizao: 2
1 1 11 1 11 1X 1.0 1 12 20 1 1
= =
Normalizao: *2
1 11 11 1 1X .1 11 2 21 1
= =
Passo 3: Ortonormalizao de 3X
Produto interno: *3 1X .X 1= e *
3 2X .X 1=
ortogonalizao:
1 12 21 12 2
3 1 12 21 12 2
00 1 1 000 1 1 01 1X 1. ( 1).11 1 1 02 211 1 1 0
+ + = = =
Verifica-se neste passo que 3X linearmente dependente dos
vetores 1X e 2X , e deve ser eliminado da base vetorial. fcil verificar que
3 1 2X X X= . Agrupando os vetores linearmente independentes ortonormalizados
obtm-se a base vetorial de Gram-Schimidt.
-
2. lgebra vetorial e matricial 34
1 12 21 12 2
2 1 12 21 12 2
X
=
Pode ser observar facilmente que o produto interno dos vetores em
X2, igual a zero.
Um importante tipo de matriz inversa, denominado de inversa de Moore-
Penrose, obtido de uma base ortonormal das colunas de uma matriz para a qual
se deseja obter a inversa generalizada de Moore-Penrose. Seja A uma matriz de
dimenso qualquer nxp e seja U a base ortonormal de vetores obtida da
ortonormalizao das colunas de A, ento, defini-se T por:
T=UA
Logo, a inversa generalizada de Moore-Penrose (A+) definida por:
A+ = T(TT)-1U.
2.3. Elementos de lgebra matricial
Na lgebra matricial as relaes e operaes so definidas atravs
de operaes em arranjos retangulares dos elementos, denominados de matrizes.
Um exemplo de matriz :
-
Ferreira, D.F. Estatstica multivariada 35
11 12 1p
21 22 2p
n x p
n1 n2 np
a a aa a aAa a a
=
""
# # % #"
O nmero de linhas de uma matriz denominado de ordem de linha
e o nmero de colunas, ordem de colunas. Se o nmero de linhas n e o nmero
de colunas p, diz-se que a matriz possui ordem nxp. Pode-se representar a
matriz por:
A=[aij] i=1, 2,..., n j=1, 2, ..., p (2.8)
Nas anlises multivariadas, muitas vezes, ser feito referncias a
matriz de dados, a qual consiste de p respostas de n observaes ou unidades
experimentais, e ter ordem nxp.
POSTULADOS
1. Igualdade: Duas matrizes necessariamente com o mesmo nmero de linhas e
colunas so iguais, se e somente se os elementos correspondentes, forem
iguais:
A=B aij=bij i=1, 2, ..., n e j=1, 2, ..., p
-
2. lgebra vetorial e matricial 36
2. Adio: A soma de duas matrizes de mesma ordem obtida pela soma dos
elementos correspondentes:
A+B = [ aij] + [bij] = [aij + bij]
A adio com matriz nula 0, contendo elementos iguais a zero :
nAp + n0p = nAp
3. Multiplicao por escalar: o produto de um escalar e uma matriz obtido pela
multiplicao de cada elemento da matriz pelo nmero escalar:
cA = c[ aij] = [ caij]
4. Multiplicao de matriz: a multiplicao de matrizes definida para aquelas em
que a ordem coluna do fator que pr multiplica igual a ordem linha do fator
que ps multiplica. Tais matrizes so denominadas conformveis para
multiplicao. O elemento (i, k) da matriz resultante do produto a soma dos
produtos dos elementos correspondentes, da i-sima linha do fator que pr
multiplica com os da k-sima coluna do fator que ps multiplica.
nAq qBp = AB = q
ij jkj 1
a b=
= [ai1b1k + ai2b2k + ... + aiqbqk] = [cik] = C
-
Ferreira, D.F. Estatstica multivariada 37
Em geral AB BA.
A matriz quadrada com unidades na diagonal e zero nas demais
partes denominada de matriz unitria ou identidade:
1 0 00 1 0
0 0 1
=
""
# # % #"
Verifica-se que:
nAp pp = nAp
nn nAp = nAp
A matriz quadrada cujos elementos fora da diagonal principal so
iguais a zero denominada matriz diagonal:
D = diag[d1, d2, ..., dn] =
1
2
n
d 0 00 d 0
0 0 d
""
# # % #"
-
2. lgebra vetorial e matricial 38
A pr-multiplicao por uma matriz diagonal, simplesmente re-escala
as linhas do fator que ps multiplica, e a ps-multiplicao re-escala as colunas do
pr-fator.
5. Inverso de matriz: a inversa de uma matriz quadrada A, nxn, chamada de A-1
e definida de tal forma que A A-1 = A-1 A = .
A inversa de um produto de matrizes o produto do inverso dos fatores em
ordem inversa a ordem de multiplicao original:
(AB)-1 = B-1A-1
Pois, B-1A-1AB = B-1B = e AB B-1A-1 = AA-1 =
6. Matriz transposta: uma matriz obtida pela troca de linhas por colunas a partir de
uma matriz especfica denominada de matriz transposta. denotada por A.
nAP = [aij], ento, pAn = [aij] = [aji]
(A + B) = A + B
(AB) = BA
-
Ferreira, D.F. Estatstica multivariada 39
(A-1) = (A)-1
7. Matrizes particionadas: deixe as r linhas de uma matriz A (mxn) ser particionada
das restantes s=m-r linhas, e as p colunas particionadas das remanescentes
q = n - p colunas. Ento, A pode ser representada por submatrizes, como a
seguir:
11 12
21 22
A A rA
A A sp q
=
Seja B uma matriz particionada de forma similar e sejam A e B tais
que suas parties sejam conformveis para adio, logo,
11 11 12 12
21 21 22 22
A B A B rA B
A B A B sp q
+ + + = + +
Suponha agora que B seja particionada em p e q linhas e em t e u
colunas. Ento, possvel verificar que:
-
2. lgebra vetorial e matricial 40
11 12 11 12
21 22 21 22
11 11 12 21 11 12 12 22
21 11 22 21 21 12 22 22
A A B Br pAB
A A B Bs qp q t u
A B A B A B A B rA B A B A B A B s
t u
=
+ + = + +
Ainda possvel verificar que:
( ) ( )( ) ( )
1 1 11 1 1 11 1
1 111 1
A A B CA A Bp A B p D CA B D CA Bq C D q CAD CA B D CA B
p q p q
+ =
Mtodo prtico para clculo de matrizes inversas
As rotinas para computadores usualmente fazem uso da verso
compacta do mtodo de Gauss, denominado de mtodo de Gauss-Jordan
(Householder, 1953, 1964).
Os clculos do mtodo de Gauss-Jordan so recursivos, sendo que
os elementos da matriz no estgio i+1 so trocados pelos resultados da chamada
operao pivotante dos elementos do estgio i, por:
( ) ( )( ) ( )
( )i i
kj ji 1 ik k i
jj
a aa a k e j
a+ = AA A A
-
Ferreira, D.F. Estatstica multivariada 41
( )( )
( )i
ji 1j i
jj
aa j
a+ = AA A
( )( )
( )i
kji 1kj i
jj
aa k j
a+ =
( )( )
i 1jj i
jj
1aa
+ =
O elemento ( )ijja chamado de piv, e sua linha e coluna so
chamados de linha e coluna pivotais. Aps n operaes pivotantes, a matriz
original substituda pela sua inversa, garantindo-se que cada linha e coluna seja
pivotada somente uma vez.
Exemplo 2.2
Use o algoritmo de Gauss-jordan para inverter a matriz A (2x2) a seguir:
( )0 4 2A2 2
=
Passo 1. Um bom compromisso com a preciso pivotar a linha e coluna cujo
elemento da diagonal seja o maior de todos os no pivotados. Assim o
-
2. lgebra vetorial e matricial 42
elemento escolhido para piv o elemento a11=4. A matriz aps a
primeira ao pivotante :
( )1 14 2112
1 24 4A
12 2 224 4
= =
Passo 2. Neste passo, a nica coluna ou linha no pivotada a 2. Portanto o piv
a22=1, e a matriz resultante da operao pivotante :
( )( )1 1 12 2 2
12
1 112 24 1 1211 21 1
1 11A1 1 22
= = =
Ao final da operao pivotante, a matriz resultante, A(2), a matriz
inversa de A.
Matrizes ortogonais
Classes especiais de matrizes, que sero utilizadas rotineiramente
nas tcnicas multivariadas, so denominadas de matrizes ortogonais, sendo
simbolizadas em geral por Q e caracterizada por:
-
Ferreira, D.F. Estatstica multivariada 43
QtQ = QQt = ou Qt = Q-1
O nome deriva da propriedade de que se Q tem i-sima linha tiq ,
ento, se QQt = implica que ti iq q 1= e ti jq q 0= para ij, sendo que as linhas
possuem tamanho unitrio e so mutuamente ortogonais (perpendiculares). De
acordo com a condio de que QtQ = , as colunas tm a mesma propriedade.
Exemplo 2.3
Dado a matriz Q, a seguir, verifique sua ortogonalidade:
1 12 2
1 12 2
Q =
A transposta de Q dada por:
1 12 2t
1 12 2
Q =
ento,
1 1 1 12 2 2 2t1 1 1 12 2 2 2
2 0 1 01QQ0 2 0 12
= = =
-
2. lgebra vetorial e matricial 44
e,
1 1 1 12 2 2 2t
1 1 1 12 2 2 2
2 0 1 01Q Q0 2 0 12
= = =
sendo, QtQ = QQt = ou Qt = Q-1, verificou-se que Q ortogonal.
Determinantes
Uma funo escalar importante de uma matriz A quadrada nxn, o
determinante da mesma. O determinante da matriz A simbolizado por |A| e
definido por:
( )11
ni j
ij ijj 1
A a se n 1
A a A 1 se n 1+=
= == > (2.9)
em que Aij a matriz quadrada (n-1)x(n-1) obtida deletando-se a i-sima linha e a
j-sima coluna de A, para qualquer escolha arbitrria de i=1, 2, ..., n.
Exemplo 2.4
Para ilustrar a definio (2.9), sero consideradas as seguintes matrizes:
-
Ferreira, D.F. Estatstica multivariada 45
4 2 24 1
A [4] B C 2 2 01 2
2 0 2
= = =
A 4= ; 2 3B 4 2 ( 1) 1 1 ( 1) 4.2.1 1 1 1 7= + = = ;
2 3 4
2 3 2 2 3 3
2 3 4
2 0 2 0 2 2C 4 ( 1) 2 ( 1) 2 ( 1)
0 2 2 2 2 0
4 [2 2 ( 1) 0 0 ( 1) ] ( 1) 2 [2 2 ( 1) 0 2 ( 1) ] ( 1)
2 [2 0 ( 1) 2 2 ( 1) ] ( 1) 16 8 8 0
C 0
= + +
= + + + +
+ + = =
=
Propriedades dos determinantes
1. tA A= ;
2. Se uma linha ou coluna de A for multiplicada por uma constante k, o
determinante ficar multiplicado pela constante;
3. Se A multiplicada por uma constante k, o determinante resultante ficar
multiplicado por kn;
-
2. lgebra vetorial e matricial 46
nkA k A=
4. Se duas linhas ou duas colunas so trocadas de posio, ento o determinante
muda de sinal;
5. Se duas linhas ou duas colunas so proporcionais, ento o determinante de A
ser igual a zero;
6. O determinante obtido deletando a i-sima linha e j-sima coluna de A
denominado menor de A, e denotado por |Aij|. A relao entre |A| e |Aij| foi
apresentada na definio de determinante (2.9);
7. 11 1A AA
= = ;
8. |AB| = |A||B|.
Determinante e posto (rank)
Se |A|0, ento, A denominada de posto completo, ou como mais comum dizer, A no-singular e A-1 existe. Uma condio necessria e suficiente
para a existncia da inversa de A que |A|0.
-
Ferreira, D.F. Estatstica multivariada 47
Teorema da multiplicao
Seja a matriz A de ordem 2n x 2n, particionada em sub-matrizes
n x n dadas por:
B C nA
D E nn n
=
Supe-se que o determinante de A no nulo, e se necessrio for,
linhas e colunas correspondentes de A devem ser trocadas para assegurar que B
seja no-singular. Como o nmero de trocas de linhas e colunas
necessariamente par, o valor de |A| no se altera. Considere matrizes
elementares, com determinante 1, dadas por:
1
0DB
e 1B C
0
Se A for pr e ps-multiplicada, respectivamente, por essas matrizes
o resultado :
-
2. lgebra vetorial e matricial 48
1
1
1
1 1
0 B C B CDB D E 0
B C B 0B C0 DB C E 0 E DB C0
= = +
Ento, A foi reduzida para sua forma quase-diagonal ou bloco
diagonal. Seja uma matriz V (2n x 2n) particionada da seguinte forma:
1
2
V 0 nV
0 V nn n
=
ento, o determinante de v dado por:
1 2V V V=
Aplicando essa regra a A transformada pela pr e ps-multiplicao por
matrizes elementares, cujo determinante igual a 1, o que no altera o valor de
|A|, tem-se:
11
B 0A B E DB C0 E DB C
= =
Observe que se A for quasi-triangular, ou seja, triangular por blocos,
o determinante o produto dos determinantes de suas sub-matrizes principais:
-
Ferreira, D.F. Estatstica multivariada 49
B CB E0 E
=
Agora possvel apresentar e provar o teorema da multiplicao. Se
A e B so matrizes quadradas n x n, ento, |AB|=|A|.|B|. Considere para isso a
identidade:
I A A 0 0 AB0 I I B I B
=
O produto do lado esquerdo da igualdade envolve operaes
elementares que no afeta o determinante. Assim, o determinante de ambos os
lados igualado e o resultado obtido :
A 0 0 ABI B I B
=
Colocando o lado direito na forma quasi-triangular por meio de trocas
nas ltimas n colunas o resultado obtido dado por:
( )nA 0 AB 01I B B I=
-
2. lgebra vetorial e matricial 50
Usando o resultado do determinante de uma matriz triangular por
blocos, tm-se:
( )( ) ( )( )
n
n n
2n
A B 1 AB I
A B 1 1 AB
A B 1 AB
AB A B
= = =
=
Infelizmente, no h teorema simples para a soma de matrizes.
Decorre desse teorema que:
1
1
11
IA A
1AA1
AAA
=
== =
Derivadas de vetores e matrizes
As derivadas de funes envolvendo vetores e matrizes so
necessrias em inmeras aplicaes na multivariada e em outras reas. Apesar
de ser possvel escrever essas mesmas funes em uma forma expandida e
tomar as derivadas elemento a elemento pelas regras de diferenciao escalar,
vantajoso definir regras que retenham vetores e matrizes na notao (Bock, 1975).
-
Ferreira, D.F. Estatstica multivariada 51
A seguir so apresentadas as principais regras de diferenciao vetorial e
matricial.
Derivadas de matrizes de funes em relao a variveis escalares
Seja A uma matriz m x n cujos elementos so funes diferenciveis
com relao a uma varivel escalar x. A derivada de A em relao a x uma
matriz m x n:
11 1n
m1 mn
a ax xA
xa ax x
=
"# % #
" (2.10)
Seja A uma matriz m x n de funes diferenciveis em x e B outra
matriz p x q cujos elementos, tambm, so diferenciveis em x. Para cada caso
abaixo, so adotadas dimenses tais que as operaes matriciais sejam
conformveis.
( ) A BA B ; m p, n qx x x
+ = + = = (2.11)
( ) B AAB A B; n px x x
= + = (2.12)
-
2. lgebra vetorial e matricial 52
( )1 1 1AA A A ; m n, 0Ax x = = (2.13)
Seja X uma matriz m x n com o elemento xij na i-sima linha e
j-sima coluna, ento,
ijij
X 1x
= (2.14)
em que 1ij uma matriz m x n com 1 na i-sima linha e j-sima coluna e 0 nas
demais posies. Se X for uma matriz diagonal n x n, logo,
iiii
X 1x
= (2.15)
Derivadas de uma funo escalar de matrizes em relao a um vetor ou matriz varivel
Seja g uma funo escalar qualquer de uma matriz X, que pode ser por
exemplo o determinante, o trao, entre outras, ento, a diferenciao de g em
relao a X :
-
Ferreira, D.F. Estatstica multivariada 53
11 1n
m1 mn
g gx x
gX
g gx x
=
# % #"
(2.16)
a) o trao
O trao de uma matriz n x n uma funo que aparece com muita
freqncia na estatstica multivariada, o qual a soma dos elementos da diagonal
principal dessa matriz:
( ) n iii 1
tr aA=
= (2.17)
Para as matrizes A, B e C de ordem m x n, p x q e r x s,
respectivamente, o trao tem as seguintes propriedades:
( ) ( ) ( )tr tr tr , m n p qA B A B= + = = =+ (2.18)
( ) ( )tr tr , m nA A= = (2.19)
( ) ( )ttr tr , m nAA = = (2.20)
( ) ( )tr tr , m q, n pAB BA= = = (2.21)
-
2. lgebra vetorial e matricial 54
( ) [ ] ( )tr tr tr , m s, n p, q r(AB)CABC CAB= = = = = (2.22)
Seja C uma matriz r x s de constantes e X uma matriz u x v de
variveis. As seguintes diretivas de derivao do trao de funes de C e X com
relao aos elementos de X, resultam em matrizes de dimenso u x v:
( )tr C 0, r sX
= = (2.23)
( )tr X I, r sX
= = (2.24)
( ) ttr XC C , r v, s uX
= = = (2.25)
( ) ( )t ttr X CX X, r v s uC CX = = = =+ (2.26)
Essas diretivas de derivao so invariantes as permutaes cclicas
sofridas por transposio ou permutao dos fatores de multiplicao de matrizes.
no entanto, as derivadas com relao a transposta de X resultam em transpostas
das matrizes anteriores de ordem v x u. Em particular:
-
Ferreira, D.F. Estatstica multivariada 55
( ) tt
tr XC C , r v, s uX
= = = (2.27)
( ) ( )t t tttr X CX X , r v s uC CX = = = =+ (2.28)
Para obter derivadas de funes elementares das matrizes algumas
diretivas tambm so definidas. Sejam os elementos de A e B funes de X, e
seja C uma matriz de constantes. Ento,
( ) ( ) ( )tr tr trA B A B , m n p qX X X
+ = + = = = (2.29)
( ) ( ) ( )trtr trAB AB AB , m q, n pX X X
= + = = (2.30)
( ) ( )1 2tr trA A A , m n, 0AX X = = (2.31)
( ) ( )1 1 1tr trA C A CA A , m n r s, 0AX X = = = = (2.32)
A barra acima das matrizes anteriores em (2.29) a (2.32) indica que
essas so consideradas constantes para fins de diferenciao.
-
2. lgebra vetorial e matricial 56
b) determinante
( ) ( )tt 1X adj , u v, 0X XX XX = = = (2.33)
( ) ( )t t1adjln X X , u v, 0XXX X = = = (2.34)
Restries da varivel de diferenciao
Alguns problemas esto sujeitos a maximizao ou minimizao com
relao a uma varivel que por sua vez est sujeita a restries. Os casos
especiais so queles em que X simtrica. Logo X=Xt e os elementos fora da
diagonal so sujeitos a:
xij = xji i
-
Ferreira, D.F. Estatstica multivariada 57
em que g uma funo escalar de X, U a n x n matriz de multiplicadores de
Lagrange. Logo, X deve satisfazer:
( )tg 1 0U UX 2 + = (2.36)
Como tambm
( ) ( )t t
tt t1 1g g 0U U U U2 2X X + = = (2.37)
Somando essas expresses obtm-se a condio para o extremo
restrito:
tg g 0X X
+ = (2.38)
Outro caso importante de matriz X restrita : se X uma matriz
diagonal n x n e Y uma matriz funo de X, ento,
11 22 nn
tr(Y) tr(Y) tr(Y)tr(Y) Diagx x xX
= " (2.39)
E se X = x , ento,
-
2. lgebra vetorial e matricial 58
tr(Y) tr(Y)X x
= (2.40)
Regra da cadeia para funes escalares de matrizes
Seja g uma funo escalar de A diferencivel com relao aos
elementos de A, e deixe os elementos de A ser funo diferencivel de x. Ento,
tg g Atrx A x
= (2.41)
Por exemplo, para |A|0, g=ln|A| de (2.34) tem-se:
( )t tt1g ln ln A AA Atr tr Ax x A x x = = = (2.42)
derivada de uma funo de um vetor com relao a um vetor
Seja um vetor z m x 1, cujos elementos so diferenciveis pelos
elementos 1 x n do vetor [ ]t 1 2 nx x x x= " . A derivada de Z em relao a tx a matriz m x n:
-
Ferreira, D.F. Estatstica multivariada 59
tj ij
z i 1, 2, ..., mzx j 1, 2, ..., nx
= = =
(2.43)
Por exemplo, de (2.26) tem-se a primeira derivada de tx Ax , sendo A
simtrica,
( )tt tr x Axx Ax 2Axx x
= = (2.44)
De (2.43), a segunda derivada representada em forma matricial
por:
( )ttt t t
x Ax xx Ax 2Ax 2Ax x x x
= = = (2.45)
Formas quadrticas
Definindo A como uma matriz simtrica no nula (nxn), e o vetor
t1 2 nx [X X X ]= " a expresso:
n n 1 nt 2
ii i ij i ji 1 i 1 j i 1
Q x A x a X 2 a X X
= = = += = +
-
2. lgebra vetorial e matricial 60
dita forma quadrtica, pois s contm termos quadrados ( )2ix e de produtos ( )i jx x .
Exemplo 2.5
Obtenha a expanso da forma quadrtica, dado o vetor x e a matriz A, a seguir:
[ ]1 2 4 1x x x A 1 2 = =
[ ] [ ]1 11 2 1 2 1 22 2
x x4 1Q x x 4x x x 2x
x x1 2 = = + +
2 21 1 2 2Q 4x 2x x 2x = + +
Assumindo, para o momento, que p elementos x1, x2, ..., xp, de um
vetor x so realizaes de p variveis aleatrias X1, X2, ..., Xp pode-se
consider-los como coordenadas de um ponto no espao p-dimensional. A
distncia desse ponto 1 2 p[x x x ]" da origem pode e deve, nesse caso, ser
interpretada em termos de unidades de desvio padro. Desse modo, pode-se
considerar a incerteza inerente (variabilidade) s observaes. Pontos com a
mesma incerteza associada so considerados de mesma distncia da origem.
Introduzindo agora uma frmula geral de distncia mais apropriada tm-se:
-
Ferreira, D.F. Estatstica multivariada 61
( ) n n 1 n2 2ii i ij i ji 1 i 1 j i 1
d a x 2 a x x0,P
= = = += + (2.46)
e garantindo que d2 > 0 para todo ponto P0, e fazendo aij=aji, tm-se:
11 12 1p
121 22 2p2 t
1 p
pp1 p2 pp
0 d x Ax
a a axa a ax xxa a a
< = =
""" # # # % #"
(2.47)
Verifica-se que (2.47) uma forma quadrtica, o que permite que a
interprete como uma distncia. A determinao, dos coeficientes da matriz A de
(2.47) ser apresentada oportunamente.
Classificao de formas quadrticas
As formas quadrticas podem ser classificadas, quanto aos
resultados que produzem. Nesta seo, o interesse residir nas formas
quadrticas no negativas e nas matrizes associadas (denominadas positivas
definidas). Uma condio necessria e suficiente para que A seja positiva definida
(pd) que esta possa ser fatorada por:
-
2. lgebra vetorial e matricial 62
tn n n n n nA S S=
e que o posto de S seja n, em que S uma matriz triangular, denominada fator de
Cholesky de A (Bock, 1975). Portanto, se uma matriz admite o fator de Cholesky,
ela positiva definida.
t t t t t t t
2 2 21 2 n
Q x Ax x (SS )x (S x) (S x) z z
Z Z Z
= = = =
= + + +
"
Devido a S ter posto coluna completo, no existe x no nulo, tal que tz S x 0= = . Portanto, a forma quadrtica Q sempre positiva, como foi afirmado.
Se por outro lado, o posto de S for rn, ento o posto de A ser r, e a forma quadrtica Q x 'Ax= 0, denominada positiva semidefinida (psd). Isso se deve
ao fato de que para algum vetor x 0, a igualdade Q = 0, acontece. O algoritmo
para obteno do fator de Cholesky de uma matriz pd, est apresentado a seguir.
Algoritmo para obteno do fator de Cholesky
de uma matriz positiva definida
1. Dada uma matriz A (nxn), com elementos aij.
-
Ferreira, D.F. Estatstica multivariada 63
2. Obteno da transposta do fator de Cholesky St, dada pelo algoritmo abaixo,
sendo que os elementos desta matriz no contemplados pelo mtodo devem
ser considerados iguais a zero:
1a linha: 1j11 11 1j11
aS a S j 1
S= = >
i-sima linha:
12i 1
2ii ii ri
r 1
i 1
ij ij ri rjr 1ii
S a
1S aS
i 2 j i
S
S S
=
=
=
=
>
3. A obteno de S-1, inversa de S, com elementos Sij, dada por:
i 1ii ij rj
rir 1ii ii
ij
1 1S S S S i jS S
para i < j S 0
=
= = >=
4. A obteno da A-1, inversa de A, com elementos aij, em que aij=aji, dada por:
-
2. lgebra vetorial e matricial 64
( )n n2ii ri ij ri rjr i r i
a S a S S i j= =
= = >
Exemplo 2.6
Obtenha o fator de Cholesky (S), sua inversa (S-1) e a matriz inversa (A-1), a partir
da matriz A, apresentada a seguir:
4 2 0A 2 2 1
0 1 2
=
Obteno de St:
Primeira linha:
11 12 132 0S 4 2; S 1; S 02 2
= = = = = =
Segunda linha:
[ ]12222 23 1S 2 1 1 S 1 1 0 11 = = = =
Terceira linha:
-
Ferreira, D.F. Estatstica multivariada 65
( ) 122 233S 2 0 1 1 = + =
Logo,
t
2 1 0 2 0 0S 0 1 1 e S 1 1 0
0 0 1 0 1 1
= =
A matriz S-1 obtida por:
Linha 1:
11 12 131S ; S S 0 i j2
= = = <
Linha 2:
22 21 121 1 1S 1; S 1 1 ; S 0 pois i j1 2 2
= = = = =
-
2. lgebra vetorial e matricial 66
logo,
1
1 0 021S 1 021 1 12
=
A matriz A-1 obtida por:
Diagonal principal:
( )
2 2 211
222 2
33 2
1 1 1 3a2 2 2 4
a 1 1 2
a 1 1
= + + = = + == =
Demais elementos:
21
31 32
12 21 13 31 23 32
1 1a 1 ( 1) 1;2 2
1 1a 1 ; a 1 ( 1) 1;2 2
1a a 1; a a ; a a 12
= + = = = = =
= = = = = =
-
Ferreira, D.F. Estatstica multivariada 67
Logo,
3 14 2
1
12
1A 1 2 1
1 1
=
O fator de Cholesky S e sua inversa tm as seguintes propriedades:
1. SSt = A
2. S-1S = St(S-1) t =
3. S-1A = S t
4. A(S-1) t = S
5. (S-1)A(S-1) t =
6. (S-1) t (S-1) = A-1
-
2. lgebra vetorial e matricial 68
Maximizao de formas quadrticas
Na estatstica multivariada e em outras reas aplicadas, muitas
vezes necessria a maximizao de uma forma quadrtica. Devido forma
quadrtica tQ x Ax= poder ser feita arbitrariamente grande tomando-se os valores
dos elementos de x grandes, necessrio maximizar Q condicionada a alguma
restrio no comprimento de x . Uma conveniente alternativa tomar uma soluo
normalizada de x , ou seja, uma soluo tal que x tenha comprimento unitrio.
Ento a maximizao da forma quadrtica Q pode ser transformada na
maximizao da razo:
t
t
x Axx x
=
para toda matriz A simtrica real. Para a maximizao deve-se tomar a derivada
em relao a x e igualar a zero, resolvendo o sistema obtido, como demonstrado
a seguir.
t tQ x Ax x x2Ax e 2xx x x
= = =
usando a regra do quociente:
-
Ferreira, D.F. Estatstica multivariada 69
t t t
t 2 t t
2Ax(x x) 2(x Ax)x 2 x AxA xx (x x) x x x x
= =
igualando a zero essa derivada e dividindo-a por ( )t2 x x , obtido o sistema homogneo de equaes:
t
t
x AxA x 0x x
=
Desde que t
t
x Axx x
=
, ento para um ponto estacionrio qualquer i,
( )i iA x 0 = (2.48)
Para que o sistema de equaes em (2.48) no possua apenas a
soluo trivial, A-i no pode ter posto completo. Isto significa que seu determinante deve ser zero:
|A-i| = 0 (2.49)
A equao polinomial em , resultado da expanso dos termos a esquerda na equao (2.49) atravs do uso da definio (2.9), chamada de
equao caracterstica de A. A i-sima raiz da equao (i) denominada de valor
-
2. lgebra vetorial e matricial 70
caracterstico de A; ix denominado vetor caracterstico de A associado a i.
Outras terminologias podem ser empregadas, tais como, autovalores e
autovetores, ou, valores e vetores prprios, ou ainda, raiz e vetor latente.
Pares de formas quadrticas
de fundamental importncia na anlise multivariada o problema de
maximizar razo entre duas formas quadrticas:
t
t
x Ax B 0x Bx
=
em que B uma matriz pd. O mximo dado da mesma forma que apresentado
anteriormente, a partir da derivada em relao a x , igualando-a a zero, como
apresentado a seguir:
t t
t
x Bx x AxAx Bx (A B)x 0x 2 x Bx
= = = (2.50)
O sistema homogneo de equaes (2.50) ter soluo no trivial
( x 0 ), se e somente se,
A B 0 = (2.51)
-
Ferreira, D.F. Estatstica multivariada 71
Os autovalores () de A em relao a B so denominados de valores prprios, razes caractersticas, e os autovetores de vetores caractersticos ou
prprios. Desde que B seja pd, possvel fator-la atravs do fator de Cholesky,
por:
tB BB S S=
Ento definindo-se tBz S x= e usando as propriedades do fator de
Cholesky tem-se que ( )t1Bx S z= . Agora, se (2.50) for pr multiplicada por 1BS e ( )t1Bx S z= for substitudo na expresso, tm-se:
( )( )
t1 1 1B B B
t1 1B B
S A S B S z 0
S A S z 0
=
=
(2.52)
desde que ( )t1 1B BS B S = A soluo de (2.52) a mesma da obtida pela maximizao de uma
forma quadrtica, apresentada em (2.48), exceto que ( )t1Bx S Z= deve ser recuperado, uma vez que Z obtido. Os autovalores, no entanto, so invariantes
transformao no-singular realizada.
-
2. lgebra vetorial e matricial 72
Clculo prtico dos autovalores e autovetores
Ser apresentado aqui o mtodo denominado Power method
derivado por Hotelling (1936). Esse mtodo apropriado para problemas em que
somente r autovalores de maior magnitude e os seus respectivos autovetores so
necessrios (rn). O mtodo iterativo, dado um vetor inicial arbitrrio (0)v . O
vetor do estgio i ser representado por (i)v e o da prxima iterao ser obtido
por:
(i 1) (i)v Av+ =
Usualmente um vetor de elementos iguais a 1 usado como vetor inicial. Os vetores caractersticos devem ser normalizados em cada estgio, para
que o critrio de convergncia seja verificado. Quando uma aproximao desejada
para 1 e 1x sejam alcanados, o segundo autovalor e autovetor devem ser
encontrados na matriz A2, definida por:
t2 1 1 1A A x x= (2.53)
E assim o processo repetido at que um nmero rn de pares de autovalores e autovetores sejam obtidos.
-
Ferreira, D.F. Estatstica multivariada 73
Exemplo 2.7
aplicar o power method e determinar os autovalores e autovetores da matriz
apresentada a seguir:
4 2A
2 1 =
1. Determinao de 1 e 1x
O vetor (0)v ser considerado como: (0)v =
11
Na avaliao da convergncia, o autovetor em cada estgio ser
padronizado atravs da diviso pelo elemento de maior valor do mesmo.
(i) (1) (0) 4 2 1 6
A2 1 1 3v v
= = =
Normalizando (1)v :
6(1) 63 1
26
1v = =
-
2. lgebra vetorial e matricial 74
Para avaliar a convergncia, os vetores (0)v e (1)v devem ser comparados. Ser
considerado, convergente se todos os elementos de (1)v forem semelhantes aos
elementos correspondentes de (0)v , para uma preciso pr estipulada, ou seja, de
1x10-8. Neste caso, os vetores diferem consideravelmente.
(ii) (2) (1)12
14 2 5v Av
2 1 2.5 = = =
, normalizando
(2)12
1v
=
Comparando-se (2)v com (1)v , padronizados, verifica-se que so idnticos,
indicando que o critrio de convergncia foi alcanado.
O autovetor 1x obtido pela normalizao de (2)v e o primeiro
autovalor 1, por t1 1 1x A x = .
[ ]
(2)
(2)t (2)1
t1 1 1
0,8944V0, 4472V V
0,8944x A x 4, 4721 2, 2361 5
0, 4472
x = = = = =
2. determinao de 2 e 2x
t2 1 1 1A A x x= = [ ]4 2 0,8944 0 0
5 0,8944 0, 44722 1 0, 4472 0 0
=
-
Ferreira, D.F. Estatstica multivariada 75
Portanto os demais autovalores e autovetores de A so nulos (2=0 e
2x 0= ). Os autovalores da matriz da forma quadrtica podem servir para
classificao das mesmas. Demonstra-se que se todos os autovalores da matriz
A, dado tQ x Ax= , forem positivos e maiores que zero a matriz A positiva
definida e a forma quadrtica positiva. Se A possui autovalores positivos e nulos
a matriz ser psd, e a forma quadrtica poder ser nula para um vetor x 0 . Os resultados apresentados at agora, a respeito de formas
quadrticas, so conseqncias da expanso de matrizes simtricas em um
processo denominado de decomposio espectral. A decomposio espectral de
uma matriz A (nxn), simtrica, dada por:
t t t1 1 1 2 2 2 n n nA e e e e e e= + + + " (2.54)
em que i (i=1, 2, ..., n) so os autovalores de A e ie so os autovetores
normalizados associados.
Exemplo 2.8
Considere a matriz simtrica:
4 2A
2 2 =
com os autovalores e autovetores normalizados, apresentados a seguir:
-
2. lgebra vetorial e matricial 76
1 1 2 2
0,8507 0,52575, 2361 e 0,7639 e
0,5257 0,8507 = = = =
Obtenha a decomposio espectral de A.
t1 1 1
3,7893 2,3417e e
2,3417 1, 4471 =
t2 2 2
0, 2111 0,3416e e
0,3416 0,5528 =
4 2 3,7893 2,3417 0, 2111 0,34162 2 2,3417 1, 4471 0,3416 0,5528
= +
A expresso da distncia como raiz quadrada de uma forma
quadrtica positiva definida permite que se obtenha a interpretao geomtrica
baseada nos autovalores e autovetores de uma matriz. Dada uma matriz A, pxp, e
suponha que p=2, os pontos tx =[x1, x2] de distncia constante c da origem
satisfazem a:
t 2 2 211 1 22 2 12 1 2x Ax a X a X 2a X X c= + + =
pela decomposio espectral de A, como no exemplo 2.8, tem-se:
-
Ferreira, D.F. Estatstica multivariada 77
( ) ( )t t
1 1 1 2 2 22 2t t t
1 1 2 2
A e e e e
x Ax X e X e
= + = +
Fazendo ti iy x e= , obtm-se: 2 2 2
1 1 2 2c y y= + que uma elipse, pois i>0. Verifica-
se que 121 1x c e= satisfaz ( )12 2t t 21 1 1 1x Ax c e e c= = e 122 2x c e= fornece a
apropriada distncia na direo de 2e . Portanto, os pontos de distncia c
pertencem a uma elipse cujos eixos so dados pelos autovetores de A com
tamanhos proporcionais ao recproco da raiz quadrada dos autovalores. A
constante de proporcionalidade c. A situao ilustrada na Figura 2.1. Se p>2
os pontos pertencem a uma hiperelipside de distncia c constante da origem,
cujos eixos so dados pelos autovetores de A. O semi eixo na direo i tem
comprimento de i
c
.
x 1
x 2
e1
e2
-0,5 c 1
c 2-0,5
Figura 2.1. Pontos de distncia c constante da origem (1 < 2).
-
2. lgebra vetorial e matricial 78
Matriz raiz quadrada
A partir da decomposio espectral, possvel definir uma categoria
de matriz, em funo dos autovalores e autovetores, denominada de matriz raiz
quadrada.
Sendo A (nxn), uma matriz com decomposio espectral dada por
nt
i i ii 1
A e e=
= , pode-se construir uma matriz P, cujas colunas so os autovetores normalizados de A, tal que, [ ]1 2 nP e e e= " , e uma matriz diagonal, como os autovalores de A, tal que, =diag[i]. fcil verificar que:
t
n1 1 t t
i ii 1 i
A P P
1A P P e e =
= = =
(2.55)
Definindo, 1/2 como uma matriz diagonal com i como elemento
da i-sima diagonal, ento, a matriz a seguir definida como matriz raiz quadrada
de A e simbolizada por A1/2.
1 12 2
nt t
i i ii 1
A e e P P=
= = (2.56)
-
Ferreira, D.F. Estatstica multivariada 79
As suas propriedades so:
1. (A1/2)t= A1/2 (A1/2 simtrica)
2. A1/2A1/2=A
3. ( )1 12 2i
n1 t t1i i
i 1A e e P P
=
= =
4. A1/2A-1/2=A-1/2A1/2= e A-1/2A-1/2=A-1
em que A-1/2 = (A1/2)-1
Exemplo 2.9
Obtenha a matriz raiz quadrada e a inversa da matriz utilizada no exemplo (2.8),
usando as equaes (2.55) e (2.56):
4 2A
2 2 =
com autovalores e autovetores normalizados, apresentados a seguir:
-
2. lgebra vetorial e matricial 80
1 1 2 2
0,8507 0,52575, 2361 e 0,7639 e
0,5257 0,8507 = = = =
As matrizes P e foram obtidas pelos autovalores e autovetores, e esto apresentadas a seguir:
0,8507 0,5257 5, 2361 0P
0,5257 0,8507 0 0,7639 = =
1 1 15,2361 2 21 1 t
1 10,7639 2
00,8507 0,5257 0,8507 0,5257A P P
00,5257 0,8507 0,5257 0,8507 1 = = =
1 12 2 tA P P
5, 2361 00,8507 0,5257 0,8507 0,5257 1,8975 0,63240,5257 0,8507 0,5257 0,8507 0,6324 1, 26490 0,7639
= = = =
A seguir, um programa SAS apresentado contendo os principais
comandos para a realizao das vrias operaes matriciais e vetoriais descritas
nesse captulo.
-
Ferreira, D.F. Estatstica multivariada 81
/* Capitulo 2 de multivariada - principais operaes matriciais descritas */ /* por meio do proc iml. Rotinas de inverso, multiplicao, transposio */ options nodate nonumber ps=1000 ls=76; proc iml; /* elementos de algebra vetorial*/ x1={1,1,1,1}; x2={1,1,0,0}; x3={0,0,1,1}; print x1 x2 x3; y=4*x1; z=x1+x2; print y z; yz=y` * z; yy=y`*y; /*distancia quadratica*/ dy=sqrt(yy); /* distancia da origem*/ zz=z`*z; dz=sqrt(zz); costeta=yz/(dy*dz); print yz yy zz dy dz costeta; /* elementos de algebra matricial*/ x=x1||x2||x3;/* concatenando vetores para obter uma matriz*/ xpx=x`*x; xx=xpx#xpx; /* produto de xpx elemento a elemento por xpx*/ print x xpx xx; /*calculo da base ortonormal de Gramshimidt - a matriz p contm as colunas ortonormalizadas de X*/ Call Gsorth(p, t, lindep, X); print lindep p t; /* calculo de autovalores e autovetores */ pu=eigvec(xpx); /* pu matriz de autovetores */ au=eigval(xpx); /* au vetor de autovalores */ print pu; print au; a={4 2,2 2}; /* matriz A*/ ainv=inv(a); /* inversa de A*/ deta=det(a); /* determinante de A*/ print a ainv deta; c={4 2 2,2 2 0, 2 0 2}; detc=det(c); print c detc; /* fator de Cholesky A=S`S em que S e uma matriz triangular superior */ /* S e a transposta do fator de Cholesky */ Sc=root(c); /* matriz c e singular, porem o SAS calcula assim mesmo o fator de Cholesky */ /* pode-se observar que a ultima linha, da matriz Sc e nula devido a isso*/ Sa=root(a); b={4 2 0,2 2 1,0 1 2}; print b; sb=root(b); print Sc Sa sb; /*maximizao de pares de formas quadrticas */ /* resolver (D - lG)e=0 */ D={4 2,2 2}; G={7 1,1 4}; print D G; Sg=root(G); /* transposta do fator de Cholesky de G */ Sginv=inv(Sg); /* inversa da transposta do fator de Cholesky de G */
-
2. lgebra vetorial e matricial 82
print Sg Sginv; II=Sginv`*G*Sginv; /* mostrar que igual a identidade */ print ii; H=Sginv`*D*Sginv; /* operar D, e em seguida extrair auto valores e vetores */ print H; /* D transformada */ zh=eigvec(H); /* zh matriz de autovetores */ auh=eigval(H); /* auh vetor de autovalores */ xh=Sginv*zh; /* matriz de autovetores recuperados */ teste=xh`*g*xh; print teste;/*mostrar que resulta na identidade*/ print xh; print auh; /* obtencao de matriz raiz quadrada - exemplificar com a matriz D */ aud=eigval(D); /* autovalores de D*/ lamb=diag(aud); /* diagonalizando aud e resultado em lamb */ print lamb; lambS=root(lamb); /* achando a raiz quadrada de lamb */ avd=eigvec(D); /* autovetores de D em avd */ Droot=avd*lambS*avd`; /* usando a definio para encontrar a matriz raiz quadrada de D */ print Droot; DD=avd*lamb*avd`; /* checando propriedades */ print DD; /* deve ser igual a D */ quit;
2.4. Exerccios
2.1. Sejam os vetores x =[3, 2, 4] e y '=[-1, 2, 2]
(a) plote os dois vetores
(b) encontre (i) o comprimento de x , (ii) o ngulo entre x e y, e (iii) a distncia
entre x e y.
(c) plote os vetores x x.1 e y y.1 ( x 3= e y = 1).
-
Ferreira, D.F. Estatstica multivariada 83
2.2. Dada a matriz
1 1 0 01 1 0 0
X 1 0 1 01 0 1 01 0 0 1
=
(a) Ortonormalize as colunas de X, usando a construo de Gram-Schimidt.
(b) Determine o vetor (coluna de x) linearmente dependente.
(c) Determine o posto coluna de X, a partir da construo de Gram-Schimidt
realizada em (a).
2.3. Dadas as matrizes
4 2 2 6 4 2A 2 2 0 B 4 4 0
2 0 4 2 0 6
= =
(a) Obtenha a inversa de A e de B, usando o algoritmo de Gauss-Jordan.
(b) Verifique usando o processo de Gauss-Jordan que (AB)-1=B-1A-1.
2.4. Verifique se a matriz
-
2. lgebra vetorial e matricial 84
0,8507 0,5257P
0,5257 0,8507 =
uma matriz ortogonal.
2.5. Seja
8 1A
1 2 =
(a) Calcule o determinante de A.
(b) Com base em (a) a matriz A pode ser considerada positiva definida? Porque?
(c) Obtenha o fator de Cholesky, e confirme a resposta dada em (b).
(d) Determine os autovalores e autovetores de A.
(e) Obtenha a decomposio espectral de A.
(f) Encontre A-1.
-
Ferreira, D.F. Estatstica multivariada 85
(g) Encontre os autovalores e autovetores de A-1. Verifique que relao tem como
os valores encontrados em (d).
2.6. Considere as matrizes
4 4,001 4 4,001A B
4,001 4,002 4,001 4,002001 = =
As matrizes so idnticas, exceto por pequenas diferenas no
elemento, a22 e b22 devida a arredondamentos. Mostre que A-1 = -3B-1 (pequenas
mudanas, talvez devido a arredondamentos, podem causar substanciais
diferenas na inversa).
2.7. Verifique se a forma quadrtica
2 21 1 2 2Q 2x 2x x 4x= +
positiva definida.
Sugesto: Verificar se tQ x Ax= positiva, pode ser feita verificando se A pd.
2.8. Dada as matrizes
-
2. lgebra vetorial e matricial 86
4 1 2 1A B
1 2 1 1 = =
(a) determine os autovalores e autovetores que maximizam a razo
t
t
x Ax B 0x Bx
=
Obs. O que equivalente a resolver o sistema determinantal dado por (2.51)
A B 0 = .
(b) Determine a matriz raiz quadrada de A e de B.
2.9. Dada a matriz de covarincia amostral (S)
25 2S
2 4 =
(a) Determine R, dada D1/2, definida por:
-
Ferreira, D.F. Estatstica multivariada 87
12
11
22
pp
S 0 0
0 S 0D
0 0 S
=
""
# # % #"
Sendo ( ) ( )1 12 21 1R D S D =
(b) Verifique a relao
( ) ( )1 12 2S D R D=
-
2. lgebra vetorial e matricial 88
-
||[ 3 ]||Amostragem multivariada
3.1. Introduo
Com os conceitos de lgebra vetorial introduzidos no captulo 2,
pode-se aprofundar na interpretao geomtrica das estatsticas descritivas X , S
e R. A maioria das explicaes usam a representao das colunas de X, como p
pontos no espao n dimensional. Ser introduzida neste instante a pressuposio
de que as observaes constituem uma amostra aleatria. De uma forma
simplificada, amostra aleatria significa (i) que as medidas tomadas em diferentes
itens (unidades amostrais ou experimentais) so no relacionadas uma com as
outras, e (ii) que a distribuio conjunta das p variveis permanece a mesma para
todos os itens. Essa estrutura de amostra aleatria que justifica uma escolha
particular de distncia e dita a geometria para a representao n dimensional dos
dados. Finalmente, quando os dados podem ser tratados como uma amostra
aleatria inferncia estatstica ter por base um slido fundamento.
-
3. Amostragem multivariada 90
3.2. Geometria amostral
Uma observao multivariada uma coleo de medidas em p
variveis tomadas na mesma unidade amostral ou experimental. No captulo 1,
item 1.3, as n observaes obtidas foram dispostas em um arranjo (Matriz) X por,
11 12 1 1
21 22 2 2
1 2
1 2
k p
k p
j j jk jp
n n nk np
x x x xx x x x
Xx x x x
x x x x
=
" "" "
# # # # # #" "
# # # # % #" "
em que cada linha de X representa uma observao multivariada. Desde que o
conjunto todo de mensuraes muitas vezes uma particular realizao de
variveis aleatrias, diz-se que os dados representam uma amostra de tamanho n
de uma populao p variada.
Os dados podem ser plotados por um grfico com p coordenadas. As
colunas de X representam n pontos no espao p dimensional. Esse tipo de grfico
fornece informaes de locao dos pontos e de variabilidade. Se os pontos
pertencem a uma esfera, o vetor de mdias amostrais, X , o centro de balano
ou de massa. Se a variabilidade ocorre em mais de uma direo, pode-se detectar
pela matriz de covarincia, S. Uma medida numrica nica de variabilidade
fornecida pelo determinante da matriz de covarincia.
-
Ferreira, D.F. Estatstica multivariada 91
Exemplo 3.1
Calcule o vetor mdia X para a matriz X apresentada a seguir. Plote os n = 3
pontos no espao p=2 (bidimensional) e localize X no diagrama resultante.
2 1X 3 0
2 2
=
A mdia amostral dada por:
( ) ( )( )
2 3 2 3 1X
11 0 2 3
+ + = = + +
O primeiro ponto dado por [ ]t1X 2 1= , o segundo por [ ]t2X 3 0= , e o terceiro por [ ]t3X 2 2= . A Figura 3.1 mostra os pontos juntamente com X , centro de massa ou de balano, obtidos a partir da matriz X.
-
3. Amostragem multivariada 92
-4 -3 -2 -1 0 1 2 3 4
-3
-2
-1
0
1
2
3
x3
x1
x2
x_
1
2
Figura 3.1. Diagrama com n=3 pontos no espao bidimensional (p=2) mostrando o
centro de massa, X .
Uma representao alternativa obtida atravs da considerao de p
pontos no espao n dimensional. Os elementos das linhas de X so utilizados
como coordenadas.
-
Ferreira, D.F. Estatstica multivariada 93
11 12 1 1
21 22 2 2
1 2
1 2
1 2
=
=
" "" "
# # # # # #" "
# # # # % #" "
" "
k p
k p
j j jk jp
n n nk np
k p
x x x xx x x x
Xx x x x
x x x x
y y y y
As coordenadas do k-simo ponto [ ]tk 1k 2k nky x x x= " determinada pela n-upla de todas as medidas da k-sima varivel. conveniente
representar tky como vetor ao invs de pontos.
Exemplo 3.2
Plote os dados da matriz X, com p=2 vetores no espao tridimensional (n=3)
2 13 03 2
X =
[ ]t1y 2 3 2= e [ ]t2y 1 0 2=
-
3. Amostragem multivariada 94
1
2
3
0
Y
Y 2
1
Figura 3.2. Diagrama da matriz de dados X como p=2 vetores no espao
tridimensional.
Muita das expresses algbricas que sero encontradas na anlise
multivariada, podem ser relacionadas s noes geomtricas de ngulos,
comprimento (norma) e volumes. Isto importante, pois representaes
geomtricas facilitam a compreenso e conduz a novas vises. Infelizmente, o ser
humano est limitado a visualizar objetos no espao tridimensional, e as
representaes da matriz X no sero teis se n>3. No entanto, os
relacionamentos geomtricos e os conceitos estatsticos associados, descritos
para o espao tridimensional ou bidimensional, permanecem vlidos para
dimenses maiores.
-
Ferreira, D.F. Estatstica multivariada 95
possvel, em funo do exposto, prover uma interpretao
geomtrica ao processo de encontrar a mdia amostral. O vetor 1 (nx1) ser
definido por t1 =[1 1 1]. O vetor 1 forma um ngulo igual com cada um dos
eixos coordenados, de tal forma que ( )1 n 1 tenha comprimento unitrio e mesmo ngulo de direo. Considerando o vetor [ ]tk 1k 2k