Download - Estatística Multivariada.pdf

MINISTRIO DA EDUCAO E DO DESPORTO UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CINCIAS EXATAS

ANLISE MULTIVARIADA

Daniel Furtado Ferreira

LAVRAS, MG

1996

ii

SUMRIO Pg.

1. Aspectos da anlise multivariada 1

1.1. Introduo 1

1.2. Aplicao das tcnicas multivariadas 3

1.3. Organizao de dados 5

1.4. Distncias 15

1.5. Exerccios 24

2. lgebra vetorial e matricial 25

2.1. Introduo 25

2.2. Elementos de lgebra vetorial 26

2.3. Elementos de lgebra matricial 34

2.4. Exerccios 82

3. Amostragem multivariada 89

3.1. Introduo 89

3.2. Geometria amostral 90

3.3. Amostras aleatrias e esperanas do vetor de mdia e da matriz de covarincia amostral. 101

3.4. Varincia generalizada 104

3.5. Varincia generalizada de variveis generalizadas 113

3.6. Outra generalizao da varincia 116

3.7. Exerccios 117

iii

4. Distribuio normal multivariada 119

4.1. Introduo 119

4.2. Pressuposies das anlises multivariadas 120

4.3. Densidade normal multivariada e suas propriedades 121

4.4. Distribuio normal bivariada 125

4.5. Distribuio amostral de X e S 133

4.6. Distribuies amostral derivada da distribuio normal multivariada 138

4.7. Verificando a normalidade 143

4.8. Exerccios 169

5. Inferncias sobre o vetor mdia 171

5.1. Introduo 171

5.2. Inferncias sobre mdia de uma populao normal 171

5.3. Regio de confiana e comparaes simultneas de componentes de mdia 177

5.4. Inferncias sobre propores de grandes amostras 190

5.5. Comparaes pareadas 192

5.6. Comparaes de vetores de mdias de duas populaes 199

5.7. Exerccios 215

6. Anlise de varincia multivariada 219

6.1. Introduo 219

6.2. Delineamento de classificao simples 220

iv

6.3. Intervalos de confiana simultneos para o efeito de tratamentos 230

6.4. Exerccios 232

7. Componentes principais 233

7.1. Introduo 233

7.2. Componentes principais populacionais 234

7.3. Componentes principais amostrais 250

7.4. Grficos dos componentes principais 256

7.5. Inferncias para grandes amostras 259

7.6. Exerccios 282

8. Anlise de agrupamento 285

8.1. Introduo 285

8.2. Medidas de parecena (similaridades e dissimilaridades) 286

8.3. Agrupamentos 296

8.4. Exerccios 308

9. Anlise de fatores 309

9.1. Introduo 309

9.2. Modelo de fatores ortogonais 310

9.3. Estimao de cargas fatoriais 316

9.4. Rotao fatorial 342

9.5. Teste da falta de ajuste do modelo fatorial 346

v

9.6. Escores fatoriais 349

9.7. Exerccios 354

10. Anlise de correlao cannica 355

10.1. Introduo 355

10.2. Variveis cannicas e correlao cannica populacionais 356

10.3. Variveis e correlaes cannicas amostrais 371

10.4. Inferncias para grandes amostras 380

10.5. Exerccios 386

11. Referencias bibliogrficas 389

Apndices 395

ndice remissivo 397

||[ ]||Aspectos da anlise multivariada

1

1.1. Introduo

Nos trabalhos cientficos, o problema de se inferir, a partir de dados

mensurados pelo pesquisador, sobre os processos ou fenmenos fsicos,

biolgicos ou sociais, que no se pode diretamente observar, uma realidade

constante. A pesquisa cientfica se constitui num processo interativo de

aprendizado. Para explicao de um fenmeno, o pesquisador em geral coleta e

analisa dados de acordo com uma hiptese. Por outro lado, a anlise destes

mesmos dados coletados de amostragem ou experimentao geralmente sugere

modificaes da explicao do fenmeno, alm disso, devido complexidade

destes fenmenos, o pesquisador deve coletar observaes de diferentes

variveis. Neste contexto, a inferncia estatstica realizada de acordo com o

paradigma hipottico-dedutivo (Bock, 1975).

Devido aos fenmenos serem estudados a partir de dados coletados

ou mensurados em muitas variveis, os mtodos estatsticos delineados para

obter informaes a partir destes conjuntos de informaes, so denominados de

mtodos de anlises multivariados. A necessidade de compreenso das relaes


entre as diversas variveis faz com que as anlises multivariadas sejam

complexas ou at mesmo difceis. O objetivo do presente material apresentar a

utilidade das tcnicas multivariada de uma forma clara, usando exemplos

ilustrativos e evitando o mximo de possvel de clculo.

Sendo assim, os objetivos gerais, para os quais a anlise

multivariada conduz so:

a. reduo de dados ou simplificao estrutural: o fenmeno sob estudo

representado da maneira mais simples possvel, sem sacrificar

informaes valiosas e tornando as interpretaes mais simples;

b. ordenao e agrupamento: agrupamento de objetos (tratamentos) ou

variveis similares, baseados em dados amostrais ou experimentais;

c. investigao da dependncia entre variveis: estudos das relaes

estruturais entre variveis muitas vezes de interesse do pesquisador;

d. predio: relaes entre variveis devem ser determinadas para o

propsito de predio de uma ou mais varivel com base na observao

de outras variveis;

e. construo e teste de hipteses.

Os modelos multivariados possuem em geral, um propsito atravs

do qual o pesquisador pode testar ou inferir a respeito de uma hiptese sobre um

Ferreira, D.F. Estatstica multivariada 3

determinado fenmeno. No entanto a sua utilizao adequada depende do bom

conhecimento das tcnicas e das suas limitaes. A frase utilizada por Marriott

(1974) descreve bem este fato: No h mgica com os mtodos numricos, e que

apesar de serem uma importante ferramenta para anlise e interpretao de

dados, no devem ser utilizados como mquinas automticas de encher lingia,

transformando massas numricas em pacotes de fatos cientficos.

1.2. Aplicao de tcnicas multivariadas

As tcnicas estatsticas constituem se uma parte integral da pesquisa

cientfica e em particular as tcnicas multivariadas tem sido regularmente aplicada

em vrias investigaes cientficas nas reas de biologia, fsica, sociologia e

cincias mdicas. Parece, neste instante, ser apropriado descrever as situaes

em que as tcnicas multivariadas tm um grande valor.

Medicina

Nos estudos onde as reaes de pacientes a um determinado

tratamento so mensuradas em algumas variveis e possuem difcil diagnstico,

as tcnicas multivariadas podem ser usadas para construir uma medida de

resposta simples ao tratamento, na qual preservada a maior parte da informao

da amostra e das mltiplas variveis respostas. Em outras situaes as tcnicas


multivariadas podem ser usadas tambm quando a classificao de um paciente,

baseada nos sintomas medidos em algumas variveis, difcil de ser realizada.

Neste caso, uma tcnica multivariada de classificao, em que se cria uma funo

que pode ser usada para separar as pessoas doentes das no doentes, pode ser

implementada.

Sociologia

Em alguns estudos o inter-relacionamento e o agrupamento de

indivduos, cidades ou estados em grupos homogneos em relao mobilidade,

nmero de estrangeiros nascidos e de segunda gerao em determinado pas

necessria em alguns estudos sociolgicos. As tcnicas de anlise multivariada,

conhecidas como anlise de agrupamento (Cluster analysis), pode ser empregada

com esta finalidade.

Biologia

No melhoramento de plantas necessrio, aps o final de uma

gerao, selecionar aquelas plantas que sero os genitores da prxima gerao. a

seleo deve ser realizada de maneira que a prxima gerao seja melhorada em

relao resposta mdia de uma srie de caractersticas da gerao anterior. O

objetivo do melhorista consiste em maximizar o ganho gentico em um espao


mnimo de tempo. As anlises multivariadas podem ser usadas para converter

uma srie de caractersticas para um ndice, na qual a seleo e escolha dos pais

possam ser feitas.

Em algumas situaes se deseja a separao de algumas espcies,

e as tcnicas multivariadas tm sido utilizadas com esta finalidade. Uma funo

construda e os seus valores so usados para esta separao.

1.3. Organizao de dados

Atravs deste material pretende-se tratar das anlises realizadas em

muitas caractersticas ou variveis. Essas medidas, muitas vezes chamadas de

dados, devem ser organizadas e apresentadas em vrias formas. Por exemplo, a

utilizao de grficos e arranjos tabulares so importantes auxiliares nas anlises

de dados. Por outro lado, nmeros que resumem, ou seja, que descrevem

quantitativamente certas caractersticas, so essenciais para a interpretao de os

dados amostrais ou experimentais.

Arranjos

Os dados multivariados so provenientes de uma pesquisa em

determinada rea em que so selecionadas p 1 variveis ou caractersticas para


serem mensuradas. As medidas so tomadas em cada unidade da amostra ou do

experimento. A representao destes dados feita com a notao xjk para indicar

um valor particular da j-sima unidade amostral ou experimental e da k-sima

varivel mensurada. Conseqente, estas medidas de p variveis em n unidades

amostrais ou experimentais, podem ser representadas conforme o arranjo

apresentado na Tabela 1.1.

Tabela 1.1. Representao de dados atravs da notao xjk para indicar um valor

particular da k-sima varivel mensurada na j-sima unidade amostral

ou experimental.

Variveis

Unidades amostrais ou experimentais

1 2 ... k ... p

1 X11 X12... X1k... X1p

2 X21 X22... X2k... X2p

.

.

.

.

.

.

.

.

.

.

.

.

.

.

. j Xj1 Xj2... Xjk... Xjp

.

.

.

.

.

.

.

.

.

.

.

.

.

.

. n Xn1 Xn2... Xnk... Xnp


Estes valores, apresentados na Tabela 1.1, podem ser

representados em um arranjo retangular, denominado de X, com n linhas e p

colunas, da seguinte forma:

11 12 1 1

21 22 2 2

1 2

1 2

k p

k p

j j jk jp

n n nk np

x x x xx x x x

Xx x x x

x x x x

=

" "" "

# # # # # #" "

# # # # % #" "

Exemplo 1.1

Uma seleo de 4 firmas de rao de Minas Gerais foi obtida para

avaliar a venda de raes. Cada observao bivariada forneceu a quantidade de

sacos de rao vendidos e a quantidade de reais de cada venda. Os dados

obtidos na forma tabular so:

Varivel 1 (Reais/venda) 80 120 90 110

Varivel 2 (nmero de sacos de rao vendidos)

10

12

6

8

Usando a notao proposta anteriormente, tem-se:

X11=80 X21=120 X31=90 X41=110 X12=10 X22=12 X32=6 X42=8

E a matriz X dos dados :


80 10120 12

90 6110 8

X

=

A organizao dos dados em arranjos facilita a exposio e permite

que os clculos sejam efetuados de uma forma ordenada e eficiente. Os ganhos

na eficincia so: (1) descrio dos clculos como operaes com matrizes e

vetores; e (2) sua fcil implementao em computadores.

ESTATSTICAS DESCRITIVAS

Grandes conjuntos de dados possuem um srio obstculo para

qualquer tentativa de extrao de informaes visuais pertinentes aos mesmos.

muitas das informaes contidas nos dados podem ser obtidas por clculo de

certos nmeros, conhecidos como estatsticas descritivas. Por exemplo, a mdia

aritmtica ou mdia amostral, uma estatstica descritiva que fornece informao

de posio, isto , representa um valor central para o conjunto de dados. Como

um outro exemplo, a mdia das distncias ao quadrado de cada dado em relao

mdia, fornece uma medida de disperso, ou variabilidade.

s estatsticas descritivas que mensuram posio, variao e

associao linear so enfatizadas. As descries formais destas medidas esto

apresentadas a seguir.

A mdia amostral, simbolizada por X , dada por:


1

1 nk jk

jX X

n == k=1, 2, ..., p (1.1)

Uma medida de variao fornecida pela varincia amostral,

definida para as n observaes de i-sima varivel por:

( )221

11 =

= = n

k kk jk kj

S S X Xn

k = 1, 2, ..., p (1.2)

A raiz quadrada da varincia amostral, kkS , conhecida como

desvio padro amostral. Esta medida de variao est na mesma unidade de

medida das observaes.

Uma medida de associao entre as observaes de duas variveis,

variveis k e k, dada pela covarincia amostral:

( )( )' ' '1

11 =

= n

kk jk k jk kjX X X X

nS k, k=1,2, ..., p (1.3)

Se grandes valores de uma varivel so observados em conjunto

com grandes valores da outra varivel, e os pequenos valores tambm ocorrem

juntos, Skk ser positiva. Se grandes valores de uma varivel ocorrem com

pequenos valores da outra, Skk ser negativa. Se no h associao entre os


valores das duas variveis, Skk ser aproximadamente zero. Quando k=k, a

covarincia reduz-se a varincia amostral. Alm disso, Skk= Skk, para todo k e k.

A ltima estatstica descritiva a ser considerada aqui o coeficiente

de correlao amostral. Esta medida de associao linear entre duas variveis

no depende da unidade de mensurao. O coeficiente de correlao amostral

para k-sima e k-sima varivel, definido por:

( )( )( ) ( )

' '1'

'2 2

' '' '

1 1

=

= =

= =

n

jk k jk kjkk

kk n nkk k k

jk k jk kj j

X X X Xr

X X X X

SS S

(1.4)

Verifica-se que rkk=rkk para todo k e k. O coeficiente de correlao

amostral a verso estandardizada da covarincia amostral, onde o produto das

razes das varincias das amostras fornece a estandardizao.

O coeficiente de correlao amostral pode ser considerado como

uma covarincia amostral. Suponha que os valores Xjk e Xjk sejam substitudos

pelos valores padronizados, ( )jk kkk

X XS e ' ' ' '

( )jk kk k

X XS . Esses valores padronizados

so expressos sem escalas de medidas (adimensionais), pois so centrados em

zero e expressos em unidades de desvio padro. O coeficiente de correlao

amostral justamente a covarincia amostral das observaes estandardizadas.

A correlao amostral (r), em resumo, tem as seguintes

propriedades:


1. Os valores de r devem ficar compreendidos entre -1 e 1;

2. Se r = 0, implica em inexistncia de associao linear entre as variveis. Por

outro lado, o sinal de r, indica a direo da associao: se r < 0 h uma

tendncia de um dos valores do par ser maior que sua mdia, quando o outro

for menor do que a sua mdia, e r > 0 indica que quando um valor do par for

grande o outro tambm o ser, alm de ambos valores tender a serem

pequenos juntos;

3. Os valores de rkk no se alteram com a alterao da escala de uma das

variveis.

As estatsticas Skk e rkk, em geral, no necessariamente refletem

todo o conhecimento de associao entre duas variveis. Associaes no

lineares existem, as quais, no podem ser reveladas por estas estatsticas

descritivas. Por outro lado, estas estatsticas so muito sensveis a observaes

discrepantes (outliers).

Alm destas, outras estatsticas como a soma de quadrados de

desvios em relao mdia (Wkk) e a soma de produtos de desvios (Wkk), so

muitas vezes de interesse. Essas esto apresentadas a seguir:


2

1( )

== nkk jk k

jX XW

' ' '1( )( )

== nkk jk k jk k

jW X X X X

As estatsticas descritivas multivariadas calculadas de n observaes

em p variveis podem ser organizadas em arranjos.

Mdias da amostra

1

2

= #p

XX

X

X

Matriz de covarincia amostral

S

S S S

S S S

S S S

p

p

p p pp

=

11 12 1

21 22 2

1 2

""

# # % #"


Matriz de correlaes amostral

R

r r

r r

r r

p

p

p p

=

1

1

1

12 1

21 2

1 2

""

# # % #"

Exemplo 1.2

Considerando os dados introduzidos no exemplo 1.1, encontrar as o

vetor de mdias X e as matrizes S e R. Neste exemplo, cada firma de rao,

representa uma das observaes multivariadas, com p = 2 variveis (valor da

venda em reais e nmero de sacos de raes vendidas).

As mdias amostral so:

4

1 j1j 1

1 1X X (80 120 90 110) 1004 4=

= = + + + =

4

2 j2j 1

1 1X X (10 12 6 8) 94 4=

= = + + + =

1

2

1009

= = X

XX

A matriz de covarincia amostral :


S11=[(80-100)2+(120-100)2+(90-100)2+(110-100)2]/3 = 333,333

S22=[(10-9)2+(12-9)2+(6-9)2+(8-9)2]/3 = 6,667

S12=[(80-100)(10-9)+(120-100)(12-9)+(90-100) (6-9)+(110-100)(8-9)]/3 = 20,000

S21=S12=20,000, e

S =

333 333 20 00020 000 6 667

, ,, ,

A correlao amostral :

r1220

33 333 6 6670 424= =

, ,, 3

r21=r12=0,4243

Portanto,

1,0000 0, 4243R

0, 4243 1,0000 =


1.4. Distncias

A maioria das tcnicas multivariadas baseada no simples conceito

de distncia, por mais formidvel que isso possa parecer. O conceito de distncia

euclidiana deve ser familiar para a maioria dos estudantes. Se for considerado um

ponto P=(x1, x2) no plano cartesiano, a distncia deste ponto P da origem O=(0, 0),

definida por d(O,P), dada pelo teorema de Pitgoras por:

d O P x x( , ) = +12 22 (1.5)

Esta situao ilustrada na Figura 1.1. Em geral, se o ponto P tem p

coordenadas, de tal forma que P=(x1, x2, ... xp), a distncia de P da origem

O=(0, 0, ..., 0), pode ser generalizada por:

d O P x x x p( , ) ...= + + +12 22 2 (1.6)


X1

X2

P

d(O, P)

Figura 1.1. Distncia entre um ponto P=(x1, x2) e a origem O=(0, 0), fornecida pelo teorema de Pitgoras.

Todos os pontos (x1, x2, .., xp) que contm uma distncia ao

quadrado, denominada c2, da origem, satisfaz a equao:

d O P x x x cp2

12

22 2 2( , ) ...= + + + = (1.7)

A expresso em (1.7) representa a equao de uma hiperesfera (um

crculo se p = 2), e os pontos eqidistantes da origem por uma distncia d(O, P)

pertencem a essa hiperesfera. A distncia de um ponto P a um ponto arbitrrio Q,

com coordenadas P=(x1, x2, ... xp) e Q=(y1, y2, ... yp) dada por:

( ) ( ) ( )d P Q x y x y x yp p( , ) ...= + + + 1 1 2 2 2 2 2 (1.8)


A distncia euclidiana insatisfatria para muitas situaes

estatsticas. Isso ocorre devido contribuio de cada coordenada ter o mesmo

peso para o clculo da distncia. Quando estas coordenadas representam

medidas so provenientes de um processo que sofre flutuaes aleatrias de

diferentes magnitudes muitas vezes desejvel ponderar as coordenadas com

grande variabilidade por menores pesos em relao quelas com baixa

variabilidade. Isto sugere o uso de uma nova medida de distncia.

Ser apresentada a seguir uma distncia que considera as

diferenas de variao e a presena de correlao. Devido a escolha de a

distncia depender das varincias e das covarincias amostrais, a partir deste

instante, ser utilizado o termo distncia estatstica para distinguir de distncia

euclidiana.

A princpio, ser considerada a construo de uma distncia entre

um ponto P, com p coordenadas, da origem. O argumento que pode ser usado

refere-se ao fato de que as coordenadas de P podem variar no espao produzindo

diferentes posies para os pontos. Para ilustrar, suponha que se tenha n pares

de medidas em duas variveis (x1 e x2) e que as medidas de x1 variam

independentemente das mensuraes em x2. O significado de independente neste

ponto pode ser dado pelo fato de que os valores de x1 no podem ser preditos

com nenhuma acurcia a partir dos valores de x2 e vice-versa. Em adio,

assumido que as observaes de x1 possuem maior variabilidade que as de x2.

Uma ilustrao desta situao est apresentada na Figura 1.2.


-6 -4 -2 0 2 4 6

X2

-6

-5

-4

-3

-2

-1

0

1

2

3

4

5

6

Figura 1.2. Diagrama de disperso, mostrando a maior variabilidade na direo de

x1 do que na direo de x2.

Observando a Figura 1.2, verifica-se que no surpreendente

encontrar desvios na direo de x1 que se afastem da origem consideravelmente,

o que no ocorre na direo de x2. Parece ser razovel, ento, ponderar x2 com

mais peso do que x1 para um mesmo valor, quando as distncias da origem forem

calculadas.


Um modo de fazer isso dividir cada coordenada pelo desvio padro

amostral. Aps a diviso, tm-se as coordenadas estandardizadas 1 1 11*x x s= e

2 2 22*x x s= . Aps eliminar as diferenas de variabilidade das variveis

(coordenadas), determina-se a distncia usando a frmula euclidiana padro:

d O P x xxS

xS

( , ) ( ) ( )* *= + = +1 2 2 2 12

11

22

22 (1.9)

Usando a equao (1.9) todos os pontos tendo como coordenadas

(x1, x2) e com distncia quadrada (c2) da origem devem satisfazer:

12

11

22

22

2xS

xS

c+ = (1.10)

A expresso (1.10) a equao de uma elipse, cujos maiores e

menores eixos coincidem com os eixos das coordenadas. A Figura 1.3 mostra o

caso geral para p = 2 coordenadas.


OX1

X2

cS110.5-cS11

0.5

cS220.5

-cS220.5

Figura 1.3. Elipse de uma distncia estatstica quadrtica d2(O,P)= 12

11

22

22

2xS

xS

c+ = .

Exemplo 1.3

Um conjunto de pares (x1, x2) de duas variveis forneceu 1 2X X 1= = , S11=9 e S22=1. Supe-se que as observaes de x1 so independentes de x2. A

distncia quadrtica de um ponto arbitrrio (P) da origem, uma vez que as

varincias da amostra no so iguais, dada por:

d O Px x2 1

222

9 1( , ) = +


Todos os pontos (x1, x2) que possuem distncias quadrada da origem igual a 1,

satisfazem a equao:

x x12

22

9 11+ = (1.11)

As coordenadas de alguns pontos com distncia quadrtica unitria

da origem foram apresentadas na Tabela 1.2.

Tabela 1.2. Coordenadas de alguns pontos com distncia quadrtica unitria da

origem.

Coordenadas (x1, x2) Distncia ao quadrado

( 0, 1)

( 0,-1)

( 3, 0)

(-3, 0)

09

11

2 21+ =

09

11

2 2

1+ =( )

39

01

2 21+ =

( ) + =39 012 2

1

O grfico da equao (1.11) uma elipse centrada na origem (0,0),

cujo maior eixo o da direo de x1 e o menor da direo de x2. A metade do

maior eixo (semi-eixo maior) c S11 3= e do menor c S22 1= . A elipse de distncia

quadrtica unitria foi plotada na Figura 1.4.


-5 -4 -3 -2 -1 0 1 2 3 4 5

-5

-4

-3

-2

-1

0

1

2

3

4

5

x1

x2

Figura 1.4. Elipse de distncia unitria quadrtica da origem obtida a partir da

equao 1.11.

A expresso (1.9) pode ser generalizada para o clculo da distncia

entre pontos P e Q, cujas coordenadas variam, mutuamente independentemente

uma da outra. O caso mais geral, em que a hiptese de independncia no

satisfeita, ser abordado futuramente.

d P Qx yS

x yS

x y

Sp p

pp( , )

( ) ( ) ( )= + + + 1 12

11

2 22

22

2

" (1.12)


Todos os pontos (P) situados a uma distncia quadrtica constante

de Q, pertencem a uma hiperelipside centrada em Q, cujos maiores e menores

eixos so paralelos aos eixos das coordenadas.

O programa SAS, apresentado a seguir, contm os cdigos

necessrios para a obteno das principais estatsticas descritivas multivariadas

apresentadas nesse captulo. O programa contm cdigos matriciais e ser

abordado com mais detalhe nos prximos captulos. Os dados do exemplo 1.1 so

utilizados para a ilustrao.

Proc IML; X={ 80 10, 120 12, 90 6, 110 8}; Print X; n=nrow(X);p=ncol(X); Xbar=x`*j(n,1,1)/n; Print Xbar; q=i(n)-(1/n)*j(n,n,1); print q; S=(1/(n-1))*X`*q*X; W=(n-1)*S; print S W; V=diag(S); Vroot=half(V); IVroot=inv(Vroot); R=Ivroot*S*Ivroot; Print V Vroot IVroot; Print R; Quit;

Foi motivado nesse captulo o estudo das anlises multivariadas e

tentou-se fornecer alguns rudimentares, mas importantes, mtodos de organizar e

resumir os dados. Em adio, o conceito geral de distncia foi apresentado, e ser

abordado e generalizado nos prximos captulos.


1.5. Exerccios

Considere as amostras com 8 observaes e 3 variveis apresentadas a seguir:

x1 3 5 6 4 8 9 6 7

x2 6 11 11 9 15 16 10 12

x3 14 9 9 13 2 2 9 5

a) Construa o grfico de disperso dos pontos das variveis x1 e x2, x1 e x3, x2 e x3.

Comente sobre sua aparncia.

b) Calcule: X , S e R e interprete os valores em R.

c) Calcule a distncia euclidiana dada em (1.8) de um ponto

P=( x1, x2, x3)=(5, 12, 8) em relao a origem e em relao a X .

d) Calcule as mesmas distncias do item c, usando (1.12).

||[ ]||lgebra vetorial e matricial

2

2.1. Introduo

desejvel que as p respostas multivariadas sejam representadas

por uma notao concisa. Os dados multivariados podem ser dispostos

convenientemente como um arranjo de nmeros, como foi apresentado no

captulo 1. Em geral, um arranjo retangular destes nmeros, com n linhas e p

colunas, por exemplo, chamada de matriz de dimenses n x p. Se por outro lado,

o arranjo consiste em n mensuraes em apenas 1 varivel, ou ainda, de uma

observao multivariada em p variveis, esses arranjos so denominados de

vetores.

Com esse arranjo bidimensional, no s, a notao fica mais

concisa, mas os muitos resultados matemticos de lgebra vetorial e matricial

facilitam a derivao e exposio dos mtodos estatsticos multivariados. Neste

material, os elementos de lgebra vetorial e matricial, sero considerados como

conhecidos. Nesse captulo, no entanto, para os estudantes no familiarizados

com o assunto, ser apresentada uma breve reviso.


2.2. Elementos de lgebra vetorial

De um ponto de vista geomtrico, as observaes multivariadas,

podem ser consideradas como pontos no espao p-dimensional, cujas

coordenadas so dadas por (x1, x2, ..., xp). Esse ponto pode ser visto como o final

de um segmento de reta da origem (0, 0, ..., 0) ao ponto (x1, x2, ..., xp). Tal

segmento de reta denominado de vetor de posio e pode ser denotado

simplesmente por X . O vetor de posies apenas um exemplo de vetor, para os

quais pode ser elaborada a lgebra, baseada nos seguintes postulados.

POSTULADOS

1. Para qualquer vetor X dado um nmero escalar c, a multiplicao do escalar

pelo vetor, resulta em outro vetor Y , definido por:

Y = c X

c ser considerado um nmero real;

2. A adio de dois vetores conduz a um nico vetor definido como:


Z = X + Y

3. A adio de vetores :

Comutativa: X + Y = Y + X

Associativa: X + ( )Y Z+ = ( )X Y Z+ +

4. Se 0 o vetor nulo, ento:

X + 0 = X

0 . X = 0

COMPRIMENTO, NGULO E DISTNCIA

Inicialmente, definido produto interno entre dois vetores, que

representa a soma de produtos de pares de coordenadas correspondentes. Para

dois vetores (n x 1) de posio X e Y , o produto interno ser o escalar, dado por:

n

i i 1 1 2 2 n ni 1

X.Y x y x y x y x y=

= = + + + "


fcil verificar que X.Y Y.X= . Por meio, do produto interno possvel generalizar o teorema de Pitgoras para o espao euclidiano

n-dimensional:

n2 2 2 2 2 2

i 1 2 ni 1

X X.X x x x x d (P,O)=

= = = + + + = " (2.1)

em que P, o ponto do espao n-dimensional, definido pelas coordenadas do

vetor X . A expresso (2.1) o comprimento ao quadrado do vetor X . A

expresso entre mdulo | X | indica a norma de X .

Dessa forma o comprimento do vetor definido por:

X X.X= (2.2)

O ngulo entre dois vetores ( X e Y ) pode ser expresso em funo

do produto interno e do comprimento dos vetores, obtido atravs da lei dos

cosenos, por:

( ) X.YCosX.X Y.Y

=

(2.3)

As distncias apresentadas no captulo 1, entre os pontos

coordenados dos vetores X e Y , podem ser expressos agora como o


comprimento do vetor diferena das coordenadas de X e Y . A distncia entre X

e Y :

d(X, Y) X Y (X Y).(X Y)= = (2.4)

Alm de ser no negativa, essa distncia entre os dois vetores

independente da direo das medidas e satisfaz a desigualdade triangular:

d( X , Y ) d( X , Z ) + d( Y , Z ) (2.5)

Derivada a partir da desigualdade de Cauchy-Schwars:

a.b a . b (2.6)

O que implica, no fato, que o valor do co-seno do ngulo entre a e b no pode exceder a unidade.

ORTOGONALIDADE

Dois vetores no nulos so denominados ortogonais, se o co-seno

do ngulo entre eles for zero. Isto indica que:


X.Y = 0 (2.7)

Muitas vezes desejvel (em sistemas de equaes lineares)

construir uma base ortonormal de vetores, isto , cada vetor da base possui

comprimento unitrio ( )i iX .X 1= e cada par de vetor da base so ortogonais ( )i jX .X 0, i j= . Para um conjunto de vetores arbitrrios pode-se empregar a construo de Gram-Schimidt. O algoritmo est apresentado a seguir,

considerando o conjunto 1 2 nX , X , ..., X de vetores:

Passo 1: normalize 1X :

11 1 1

1 1

XX ; X .X 0X .X

=

Passo 2: Ortonormalize 2X calculando o produto interno entre *1X e 2X , e

subtraindo de 2X os componentes de *1X :

Ortogonalizando 1X e 2X :

( )* *2 2 2 1 1X X X .X X =

Ento, normalizando-se 2X

:


*2 2 2 2

2 2

1X X ; X .X 0X .X

=

Passo 3: Calcule o produto interno de 3X com *1X e

*2X , e subtraia de 3X os

componentes de *1X e *2X ,

( ) ( )* * * *3 3 3 1 1 3 2 2X X X .X X X .X X =

Ento, normalizando-se 3X

:

*3 3 3 3

3 3

1X X ; X .X 0X .X

=

E assim por diante, at o n-simo estgio, quando todos os vetores

entrarem na construo. Se o i-simo vetor for linearmente dependente dos

vetores anteriores, ento iX

ser igual ao vetor nulo, iX 0 = , devendo ser

eliminado do conjunto e o processo deve continuar com o vetor i 1X + . O nmero de

vetores no nulos remanescentes no conjunto, constituem a dimenso do espao

vetorial original.


Exemplo 2.1

Dado o conjunto de vetores, a seguir, utilizar como ilustrao a construo de

Gram-Schimidt.

1 1 01 1 0

X1 0 11 0 1

=

Os vetores de X so dados por:

X = [ 1X 2X 3X ]

Passo 1. Normalize 1X :

*1

111X121

=

Passo 2: Ortonormalize 2X :

Produto interno: 2X .*1X = 1


ortogonalizao: 2

1 1 11 1 11 1X 1.0 1 12 20 1 1

= =

Normalizao: *2

1 11 11 1 1X .1 11 2 21 1

= =

Passo 3: Ortonormalizao de 3X

Produto interno: *3 1X .X 1= e *

3 2X .X 1=

ortogonalizao:

1 12 21 12 2

3 1 12 21 12 2

00 1 1 000 1 1 01 1X 1. ( 1).11 1 1 02 211 1 1 0

+ + = = =

Verifica-se neste passo que 3X linearmente dependente dos

vetores 1X e 2X , e deve ser eliminado da base vetorial. fcil verificar que

3 1 2X X X= . Agrupando os vetores linearmente independentes ortonormalizados

obtm-se a base vetorial de Gram-Schimidt.


1 12 21 12 2

2 1 12 21 12 2

X

=

Pode ser observar facilmente que o produto interno dos vetores em

X2, igual a zero.

Um importante tipo de matriz inversa, denominado de inversa de Moore-

Penrose, obtido de uma base ortonormal das colunas de uma matriz para a qual

se deseja obter a inversa generalizada de Moore-Penrose. Seja A uma matriz de

dimenso qualquer nxp e seja U a base ortonormal de vetores obtida da

ortonormalizao das colunas de A, ento, defini-se T por:

T=UA

Logo, a inversa generalizada de Moore-Penrose (A+) definida por:

A+ = T(TT)-1U.

2.3. Elementos de lgebra matricial

Na lgebra matricial as relaes e operaes so definidas atravs

de operaes em arranjos retangulares dos elementos, denominados de matrizes.

Um exemplo de matriz :


11 12 1p

21 22 2p

n x p

n1 n2 np

a a aa a aAa a a

=

""

# # % #"

O nmero de linhas de uma matriz denominado de ordem de linha

e o nmero de colunas, ordem de colunas. Se o nmero de linhas n e o nmero

de colunas p, diz-se que a matriz possui ordem nxp. Pode-se representar a

matriz por:

A=[aij] i=1, 2,..., n j=1, 2, ..., p (2.8)

Nas anlises multivariadas, muitas vezes, ser feito referncias a

matriz de dados, a qual consiste de p respostas de n observaes ou unidades

experimentais, e ter ordem nxp.

POSTULADOS

1. Igualdade: Duas matrizes necessariamente com o mesmo nmero de linhas e

colunas so iguais, se e somente se os elementos correspondentes, forem

iguais:

A=B aij=bij i=1, 2, ..., n e j=1, 2, ..., p


2. Adio: A soma de duas matrizes de mesma ordem obtida pela soma dos

elementos correspondentes:

A+B = [ aij] + [bij] = [aij + bij]

A adio com matriz nula 0, contendo elementos iguais a zero :

nAp + n0p = nAp

3. Multiplicao por escalar: o produto de um escalar e uma matriz obtido pela

multiplicao de cada elemento da matriz pelo nmero escalar:

cA = c[ aij] = [ caij]

4. Multiplicao de matriz: a multiplicao de matrizes definida para aquelas em

que a ordem coluna do fator que pr multiplica igual a ordem linha do fator

que ps multiplica. Tais matrizes so denominadas conformveis para

multiplicao. O elemento (i, k) da matriz resultante do produto a soma dos

produtos dos elementos correspondentes, da i-sima linha do fator que pr

multiplica com os da k-sima coluna do fator que ps multiplica.

nAq qBp = AB = q

ij jkj 1

a b=

= [ai1b1k + ai2b2k + ... + aiqbqk] = [cik] = C


Em geral AB BA.

A matriz quadrada com unidades na diagonal e zero nas demais

partes denominada de matriz unitria ou identidade:

1 0 00 1 0

0 0 1

=

""

# # % #"

Verifica-se que:

nAp pp = nAp

nn nAp = nAp

A matriz quadrada cujos elementos fora da diagonal principal so

iguais a zero denominada matriz diagonal:

D = diag[d1, d2, ..., dn] =

1

2

n

d 0 00 d 0

0 0 d

""

# # % #"


A pr-multiplicao por uma matriz diagonal, simplesmente re-escala

as linhas do fator que ps multiplica, e a ps-multiplicao re-escala as colunas do

pr-fator.

5. Inverso de matriz: a inversa de uma matriz quadrada A, nxn, chamada de A-1

e definida de tal forma que A A-1 = A-1 A = .

A inversa de um produto de matrizes o produto do inverso dos fatores em

ordem inversa a ordem de multiplicao original:

(AB)-1 = B-1A-1

Pois, B-1A-1AB = B-1B = e AB B-1A-1 = AA-1 =

6. Matriz transposta: uma matriz obtida pela troca de linhas por colunas a partir de

uma matriz especfica denominada de matriz transposta. denotada por A.

nAP = [aij], ento, pAn = [aij] = [aji]

(A + B) = A + B

(AB) = BA


(A-1) = (A)-1

7. Matrizes particionadas: deixe as r linhas de uma matriz A (mxn) ser particionada

das restantes s=m-r linhas, e as p colunas particionadas das remanescentes

q = n - p colunas. Ento, A pode ser representada por submatrizes, como a

seguir:

11 12

21 22

A A rA

A A sp q

=

Seja B uma matriz particionada de forma similar e sejam A e B tais

que suas parties sejam conformveis para adio, logo,

11 11 12 12

21 21 22 22

A B A B rA B

A B A B sp q

+ + + = + +

Suponha agora que B seja particionada em p e q linhas e em t e u

colunas. Ento, possvel verificar que:


11 12 11 12

21 22 21 22

11 11 12 21 11 12 12 22

21 11 22 21 21 12 22 22

A A B Br pAB

A A B Bs qp q t u

A B A B A B A B rA B A B A B A B s

t u

=

+ + = + +

Ainda possvel verificar que:

( ) ( )( ) ( )

1 1 11 1 1 11 1

1 111 1

A A B CA A Bp A B p D CA B D CA Bq C D q CAD CA B D CA B

p q p q

+ =

Mtodo prtico para clculo de matrizes inversas

As rotinas para computadores usualmente fazem uso da verso

compacta do mtodo de Gauss, denominado de mtodo de Gauss-Jordan

(Householder, 1953, 1964).

Os clculos do mtodo de Gauss-Jordan so recursivos, sendo que

os elementos da matriz no estgio i+1 so trocados pelos resultados da chamada

operao pivotante dos elementos do estgio i, por:

( ) ( )( ) ( )

( )i i

kj ji 1 ik k i

jj

a aa a k e j

a+ = AA A A


( )( )

( )i

ji 1j i

jj

aa j

a+ = AA A

( )( )

( )i

kji 1kj i

jj

aa k j

a+ =

( )( )

i 1jj i

jj

1aa

+ =

O elemento ( )ijja chamado de piv, e sua linha e coluna so

chamados de linha e coluna pivotais. Aps n operaes pivotantes, a matriz

original substituda pela sua inversa, garantindo-se que cada linha e coluna seja

pivotada somente uma vez.

Exemplo 2.2

Use o algoritmo de Gauss-jordan para inverter a matriz A (2x2) a seguir:

( )0 4 2A2 2

=

Passo 1. Um bom compromisso com a preciso pivotar a linha e coluna cujo

elemento da diagonal seja o maior de todos os no pivotados. Assim o


elemento escolhido para piv o elemento a11=4. A matriz aps a

primeira ao pivotante :

( )1 14 2112

1 24 4A

12 2 224 4

= =

Passo 2. Neste passo, a nica coluna ou linha no pivotada a 2. Portanto o piv

a22=1, e a matriz resultante da operao pivotante :

( )( )1 1 12 2 2

12

1 112 24 1 1211 21 1

1 11A1 1 22

= = =

Ao final da operao pivotante, a matriz resultante, A(2), a matriz

inversa de A.

Matrizes ortogonais

Classes especiais de matrizes, que sero utilizadas rotineiramente

nas tcnicas multivariadas, so denominadas de matrizes ortogonais, sendo

simbolizadas em geral por Q e caracterizada por:


QtQ = QQt = ou Qt = Q-1

O nome deriva da propriedade de que se Q tem i-sima linha tiq ,

ento, se QQt = implica que ti iq q 1= e ti jq q 0= para ij, sendo que as linhas

possuem tamanho unitrio e so mutuamente ortogonais (perpendiculares). De

acordo com a condio de que QtQ = , as colunas tm a mesma propriedade.

Exemplo 2.3

Dado a matriz Q, a seguir, verifique sua ortogonalidade:

1 12 2

1 12 2

Q =

A transposta de Q dada por:

1 12 2t

1 12 2

Q =

ento,

1 1 1 12 2 2 2t1 1 1 12 2 2 2

2 0 1 01QQ0 2 0 12

= = =


e,

1 1 1 12 2 2 2t

1 1 1 12 2 2 2

2 0 1 01Q Q0 2 0 12

= = =

sendo, QtQ = QQt = ou Qt = Q-1, verificou-se que Q ortogonal.

Determinantes

Uma funo escalar importante de uma matriz A quadrada nxn, o

determinante da mesma. O determinante da matriz A simbolizado por |A| e

definido por:

( )11

ni j

ij ijj 1

A a se n 1

A a A 1 se n 1+=

= == > (2.9)

em que Aij a matriz quadrada (n-1)x(n-1) obtida deletando-se a i-sima linha e a

j-sima coluna de A, para qualquer escolha arbitrria de i=1, 2, ..., n.

Exemplo 2.4

Para ilustrar a definio (2.9), sero consideradas as seguintes matrizes:


4 2 24 1

A [4] B C 2 2 01 2

2 0 2

= = =

A 4= ; 2 3B 4 2 ( 1) 1 1 ( 1) 4.2.1 1 1 1 7= + = = ;

2 3 4

2 3 2 2 3 3

2 3 4

2 0 2 0 2 2C 4 ( 1) 2 ( 1) 2 ( 1)

0 2 2 2 2 0

4 [2 2 ( 1) 0 0 ( 1) ] ( 1) 2 [2 2 ( 1) 0 2 ( 1) ] ( 1)

2 [2 0 ( 1) 2 2 ( 1) ] ( 1) 16 8 8 0

C 0

= + +

= + + + +

+ + = =

=

Propriedades dos determinantes

1. tA A= ;

2. Se uma linha ou coluna de A for multiplicada por uma constante k, o

determinante ficar multiplicado pela constante;

3. Se A multiplicada por uma constante k, o determinante resultante ficar

multiplicado por kn;


nkA k A=

4. Se duas linhas ou duas colunas so trocadas de posio, ento o determinante

muda de sinal;

5. Se duas linhas ou duas colunas so proporcionais, ento o determinante de A

ser igual a zero;

6. O determinante obtido deletando a i-sima linha e j-sima coluna de A

denominado menor de A, e denotado por |Aij|. A relao entre |A| e |Aij| foi

apresentada na definio de determinante (2.9);

7. 11 1A AA

= = ;

8. |AB| = |A||B|.

Determinante e posto (rank)

Se |A|0, ento, A denominada de posto completo, ou como mais comum dizer, A no-singular e A-1 existe. Uma condio necessria e suficiente

para a existncia da inversa de A que |A|0.


Teorema da multiplicao

Seja a matriz A de ordem 2n x 2n, particionada em sub-matrizes

n x n dadas por:

B C nA

D E nn n

=

Supe-se que o determinante de A no nulo, e se necessrio for,

linhas e colunas correspondentes de A devem ser trocadas para assegurar que B

seja no-singular. Como o nmero de trocas de linhas e colunas

necessariamente par, o valor de |A| no se altera. Considere matrizes

elementares, com determinante 1, dadas por:

1

0DB

e 1B C

0

Se A for pr e ps-multiplicada, respectivamente, por essas matrizes

o resultado :


1

1

1

1 1

0 B C B CDB D E 0

B C B 0B C0 DB C E 0 E DB C0

= = +

Ento, A foi reduzida para sua forma quase-diagonal ou bloco

diagonal. Seja uma matriz V (2n x 2n) particionada da seguinte forma:

1

2

V 0 nV

0 V nn n

=

ento, o determinante de v dado por:

1 2V V V=

Aplicando essa regra a A transformada pela pr e ps-multiplicao por

matrizes elementares, cujo determinante igual a 1, o que no altera o valor de

|A|, tem-se:

11

B 0A B E DB C0 E DB C

= =

Observe que se A for quasi-triangular, ou seja, triangular por blocos,

o determinante o produto dos determinantes de suas sub-matrizes principais:


B CB E0 E

=

Agora possvel apresentar e provar o teorema da multiplicao. Se

A e B so matrizes quadradas n x n, ento, |AB|=|A|.|B|. Considere para isso a

identidade:

I A A 0 0 AB0 I I B I B

=

O produto do lado esquerdo da igualdade envolve operaes

elementares que no afeta o determinante. Assim, o determinante de ambos os

lados igualado e o resultado obtido :

A 0 0 ABI B I B

=

Colocando o lado direito na forma quasi-triangular por meio de trocas

nas ltimas n colunas o resultado obtido dado por:

( )nA 0 AB 01I B B I=


Usando o resultado do determinante de uma matriz triangular por

blocos, tm-se:

( )( ) ( )( )

n

n n

2n

A B 1 AB I

A B 1 1 AB

A B 1 AB

AB A B

= = =

=

Infelizmente, no h teorema simples para a soma de matrizes.

Decorre desse teorema que:

1

1

11

IA A

1AA1

AAA

=

== =

Derivadas de vetores e matrizes

As derivadas de funes envolvendo vetores e matrizes so

necessrias em inmeras aplicaes na multivariada e em outras reas. Apesar

de ser possvel escrever essas mesmas funes em uma forma expandida e

tomar as derivadas elemento a elemento pelas regras de diferenciao escalar,

vantajoso definir regras que retenham vetores e matrizes na notao (Bock, 1975).


A seguir so apresentadas as principais regras de diferenciao vetorial e

matricial.

Derivadas de matrizes de funes em relao a variveis escalares

Seja A uma matriz m x n cujos elementos so funes diferenciveis

com relao a uma varivel escalar x. A derivada de A em relao a x uma

matriz m x n:

11 1n

m1 mn

a ax xA

xa ax x

=

"# % #

" (2.10)

Seja A uma matriz m x n de funes diferenciveis em x e B outra

matriz p x q cujos elementos, tambm, so diferenciveis em x. Para cada caso

abaixo, so adotadas dimenses tais que as operaes matriciais sejam

conformveis.

( ) A BA B ; m p, n qx x x

+ = + = = (2.11)

( ) B AAB A B; n px x x

= + = (2.12)


( )1 1 1AA A A ; m n, 0Ax x = = (2.13)

Seja X uma matriz m x n com o elemento xij na i-sima linha e

j-sima coluna, ento,

ijij

X 1x

= (2.14)

em que 1ij uma matriz m x n com 1 na i-sima linha e j-sima coluna e 0 nas

demais posies. Se X for uma matriz diagonal n x n, logo,

iiii

X 1x

= (2.15)

Derivadas de uma funo escalar de matrizes em relao a um vetor ou matriz varivel

Seja g uma funo escalar qualquer de uma matriz X, que pode ser por

exemplo o determinante, o trao, entre outras, ento, a diferenciao de g em

relao a X :


11 1n

m1 mn

g gx x

gX

g gx x

=

# % #"

(2.16)

a) o trao

O trao de uma matriz n x n uma funo que aparece com muita

freqncia na estatstica multivariada, o qual a soma dos elementos da diagonal

principal dessa matriz:

( ) n iii 1

tr aA=

= (2.17)

Para as matrizes A, B e C de ordem m x n, p x q e r x s,

respectivamente, o trao tem as seguintes propriedades:

( ) ( ) ( )tr tr tr , m n p qA B A B= + = = =+ (2.18)

( ) ( )tr tr , m nA A= = (2.19)

( ) ( )ttr tr , m nAA = = (2.20)

( ) ( )tr tr , m q, n pAB BA= = = (2.21)


( ) [ ] ( )tr tr tr , m s, n p, q r(AB)CABC CAB= = = = = (2.22)

Seja C uma matriz r x s de constantes e X uma matriz u x v de

variveis. As seguintes diretivas de derivao do trao de funes de C e X com

relao aos elementos de X, resultam em matrizes de dimenso u x v:

( )tr C 0, r sX

= = (2.23)

( )tr X I, r sX

= = (2.24)

( ) ttr XC C , r v, s uX

= = = (2.25)

( ) ( )t ttr X CX X, r v s uC CX = = = =+ (2.26)

Essas diretivas de derivao so invariantes as permutaes cclicas

sofridas por transposio ou permutao dos fatores de multiplicao de matrizes.

no entanto, as derivadas com relao a transposta de X resultam em transpostas

das matrizes anteriores de ordem v x u. Em particular:


( ) tt

tr XC C , r v, s uX

= = = (2.27)

( ) ( )t t tttr X CX X , r v s uC CX = = = =+ (2.28)

Para obter derivadas de funes elementares das matrizes algumas

diretivas tambm so definidas. Sejam os elementos de A e B funes de X, e

seja C uma matriz de constantes. Ento,

( ) ( ) ( )tr tr trA B A B , m n p qX X X

+ = + = = = (2.29)

( ) ( ) ( )trtr trAB AB AB , m q, n pX X X

= + = = (2.30)

( ) ( )1 2tr trA A A , m n, 0AX X = = (2.31)

( ) ( )1 1 1tr trA C A CA A , m n r s, 0AX X = = = = (2.32)

A barra acima das matrizes anteriores em (2.29) a (2.32) indica que

essas so consideradas constantes para fins de diferenciao.


b) determinante

( ) ( )tt 1X adj , u v, 0X XX XX = = = (2.33)

( ) ( )t t1adjln X X , u v, 0XXX X = = = (2.34)

Restries da varivel de diferenciao

Alguns problemas esto sujeitos a maximizao ou minimizao com

relao a uma varivel que por sua vez est sujeita a restries. Os casos

especiais so queles em que X simtrica. Logo X=Xt e os elementos fora da

diagonal so sujeitos a:

xij = xji i


em que g uma funo escalar de X, U a n x n matriz de multiplicadores de

Lagrange. Logo, X deve satisfazer:

( )tg 1 0U UX 2 + = (2.36)

Como tambm

( ) ( )t t

tt t1 1g g 0U U U U2 2X X + = = (2.37)

Somando essas expresses obtm-se a condio para o extremo

restrito:

tg g 0X X

+ = (2.38)

Outro caso importante de matriz X restrita : se X uma matriz

diagonal n x n e Y uma matriz funo de X, ento,

11 22 nn

tr(Y) tr(Y) tr(Y)tr(Y) Diagx x xX

= " (2.39)

E se X = x , ento,


tr(Y) tr(Y)X x

= (2.40)

Regra da cadeia para funes escalares de matrizes

Seja g uma funo escalar de A diferencivel com relao aos

elementos de A, e deixe os elementos de A ser funo diferencivel de x. Ento,

tg g Atrx A x

= (2.41)

Por exemplo, para |A|0, g=ln|A| de (2.34) tem-se:

( )t tt1g ln ln A AA Atr tr Ax x A x x = = = (2.42)

derivada de uma funo de um vetor com relao a um vetor

Seja um vetor z m x 1, cujos elementos so diferenciveis pelos

elementos 1 x n do vetor [ ]t 1 2 nx x x x= " . A derivada de Z em relao a tx a matriz m x n:


tj ij

z i 1, 2, ..., mzx j 1, 2, ..., nx

= = =

(2.43)

Por exemplo, de (2.26) tem-se a primeira derivada de tx Ax , sendo A

simtrica,

( )tt tr x Axx Ax 2Axx x

= = (2.44)

De (2.43), a segunda derivada representada em forma matricial

por:

( )ttt t t

x Ax xx Ax 2Ax 2Ax x x x

= = = (2.45)

Formas quadrticas

Definindo A como uma matriz simtrica no nula (nxn), e o vetor

t1 2 nx [X X X ]= " a expresso:

n n 1 nt 2

ii i ij i ji 1 i 1 j i 1

Q x A x a X 2 a X X

= = = += = +


dita forma quadrtica, pois s contm termos quadrados ( )2ix e de produtos ( )i jx x .

Exemplo 2.5

Obtenha a expanso da forma quadrtica, dado o vetor x e a matriz A, a seguir:

[ ]1 2 4 1x x x A 1 2 = =

[ ] [ ]1 11 2 1 2 1 22 2

x x4 1Q x x 4x x x 2x

x x1 2 = = + +

2 21 1 2 2Q 4x 2x x 2x = + +

Assumindo, para o momento, que p elementos x1, x2, ..., xp, de um

vetor x so realizaes de p variveis aleatrias X1, X2, ..., Xp pode-se

consider-los como coordenadas de um ponto no espao p-dimensional. A

distncia desse ponto 1 2 p[x x x ]" da origem pode e deve, nesse caso, ser

interpretada em termos de unidades de desvio padro. Desse modo, pode-se

considerar a incerteza inerente (variabilidade) s observaes. Pontos com a

mesma incerteza associada so considerados de mesma distncia da origem.

Introduzindo agora uma frmula geral de distncia mais apropriada tm-se:


( ) n n 1 n2 2ii i ij i ji 1 i 1 j i 1

d a x 2 a x x0,P

= = = += + (2.46)

e garantindo que d2 > 0 para todo ponto P0, e fazendo aij=aji, tm-se:

11 12 1p

121 22 2p2 t

1 p

pp1 p2 pp

0 d x Ax

a a axa a ax xxa a a

< = =

""" # # # % #"

(2.47)

Verifica-se que (2.47) uma forma quadrtica, o que permite que a

interprete como uma distncia. A determinao, dos coeficientes da matriz A de

(2.47) ser apresentada oportunamente.

Classificao de formas quadrticas

As formas quadrticas podem ser classificadas, quanto aos

resultados que produzem. Nesta seo, o interesse residir nas formas

quadrticas no negativas e nas matrizes associadas (denominadas positivas

definidas). Uma condio necessria e suficiente para que A seja positiva definida

(pd) que esta possa ser fatorada por:


tn n n n n nA S S=

e que o posto de S seja n, em que S uma matriz triangular, denominada fator de

Cholesky de A (Bock, 1975). Portanto, se uma matriz admite o fator de Cholesky,

ela positiva definida.

t t t t t t t

2 2 21 2 n

Q x Ax x (SS )x (S x) (S x) z z

Z Z Z

= = = =

= + + +

"

Devido a S ter posto coluna completo, no existe x no nulo, tal que tz S x 0= = . Portanto, a forma quadrtica Q sempre positiva, como foi afirmado.

Se por outro lado, o posto de S for rn, ento o posto de A ser r, e a forma quadrtica Q x 'Ax= 0, denominada positiva semidefinida (psd). Isso se deve

ao fato de que para algum vetor x 0, a igualdade Q = 0, acontece. O algoritmo

para obteno do fator de Cholesky de uma matriz pd, est apresentado a seguir.

Algoritmo para obteno do fator de Cholesky

de uma matriz positiva definida

1. Dada uma matriz A (nxn), com elementos aij.


2. Obteno da transposta do fator de Cholesky St, dada pelo algoritmo abaixo,

sendo que os elementos desta matriz no contemplados pelo mtodo devem

ser considerados iguais a zero:

1a linha: 1j11 11 1j11

aS a S j 1

S= = >

i-sima linha:

12i 1

2ii ii ri

r 1

i 1

ij ij ri rjr 1ii

S a

1S aS

i 2 j i

S

S S

=

=

=

=

>

3. A obteno de S-1, inversa de S, com elementos Sij, dada por:

i 1ii ij rj

rir 1ii ii

ij

1 1S S S S i jS S

para i < j S 0

=

= = >=

4. A obteno da A-1, inversa de A, com elementos aij, em que aij=aji, dada por:


( )n n2ii ri ij ri rjr i r i

a S a S S i j= =

= = >

Exemplo 2.6

Obtenha o fator de Cholesky (S), sua inversa (S-1) e a matriz inversa (A-1), a partir

da matriz A, apresentada a seguir:

4 2 0A 2 2 1

0 1 2

=

Obteno de St:

Primeira linha:

11 12 132 0S 4 2; S 1; S 02 2

= = = = = =

Segunda linha:

[ ]12222 23 1S 2 1 1 S 1 1 0 11 = = = =

Terceira linha:


( ) 122 233S 2 0 1 1 = + =

Logo,

t

2 1 0 2 0 0S 0 1 1 e S 1 1 0

0 0 1 0 1 1

= =

A matriz S-1 obtida por:

Linha 1:

11 12 131S ; S S 0 i j2

= = = <

Linha 2:

22 21 121 1 1S 1; S 1 1 ; S 0 pois i j1 2 2

= = = = =


logo,

1

1 0 021S 1 021 1 12

=

A matriz A-1 obtida por:

Diagonal principal:

( )

2 2 211

222 2

33 2

1 1 1 3a2 2 2 4

a 1 1 2

a 1 1

= + + = = + == =

Demais elementos:

21

31 32

12 21 13 31 23 32

1 1a 1 ( 1) 1;2 2

1 1a 1 ; a 1 ( 1) 1;2 2

1a a 1; a a ; a a 12

= + = = = = =

= = = = = =


Logo,

3 14 2

1

12

1A 1 2 1

1 1

=

O fator de Cholesky S e sua inversa tm as seguintes propriedades:

1. SSt = A

2. S-1S = St(S-1) t =

3. S-1A = S t

4. A(S-1) t = S

5. (S-1)A(S-1) t =

6. (S-1) t (S-1) = A-1


Maximizao de formas quadrticas

Na estatstica multivariada e em outras reas aplicadas, muitas

vezes necessria a maximizao de uma forma quadrtica. Devido forma

quadrtica tQ x Ax= poder ser feita arbitrariamente grande tomando-se os valores

dos elementos de x grandes, necessrio maximizar Q condicionada a alguma

restrio no comprimento de x . Uma conveniente alternativa tomar uma soluo

normalizada de x , ou seja, uma soluo tal que x tenha comprimento unitrio.

Ento a maximizao da forma quadrtica Q pode ser transformada na

maximizao da razo:

t

t

x Axx x

=

para toda matriz A simtrica real. Para a maximizao deve-se tomar a derivada

em relao a x e igualar a zero, resolvendo o sistema obtido, como demonstrado

a seguir.

t tQ x Ax x x2Ax e 2xx x x

= = =

usando a regra do quociente:


t t t

t 2 t t

2Ax(x x) 2(x Ax)x 2 x AxA xx (x x) x x x x

= =

igualando a zero essa derivada e dividindo-a por ( )t2 x x , obtido o sistema homogneo de equaes:

t

t

x AxA x 0x x

=

Desde que t

t

x Axx x

=

, ento para um ponto estacionrio qualquer i,

( )i iA x 0 = (2.48)

Para que o sistema de equaes em (2.48) no possua apenas a

soluo trivial, A-i no pode ter posto completo. Isto significa que seu determinante deve ser zero:

|A-i| = 0 (2.49)

A equao polinomial em , resultado da expanso dos termos a esquerda na equao (2.49) atravs do uso da definio (2.9), chamada de

equao caracterstica de A. A i-sima raiz da equao (i) denominada de valor


caracterstico de A; ix denominado vetor caracterstico de A associado a i.

Outras terminologias podem ser empregadas, tais como, autovalores e

autovetores, ou, valores e vetores prprios, ou ainda, raiz e vetor latente.

Pares de formas quadrticas

de fundamental importncia na anlise multivariada o problema de

maximizar razo entre duas formas quadrticas:

t

t

x Ax B 0x Bx

=

em que B uma matriz pd. O mximo dado da mesma forma que apresentado

anteriormente, a partir da derivada em relao a x , igualando-a a zero, como

apresentado a seguir:

t t

t

x Bx x AxAx Bx (A B)x 0x 2 x Bx

= = = (2.50)

O sistema homogneo de equaes (2.50) ter soluo no trivial

( x 0 ), se e somente se,

A B 0 = (2.51)


Os autovalores () de A em relao a B so denominados de valores prprios, razes caractersticas, e os autovetores de vetores caractersticos ou

prprios. Desde que B seja pd, possvel fator-la atravs do fator de Cholesky,

por:

tB BB S S=

Ento definindo-se tBz S x= e usando as propriedades do fator de

Cholesky tem-se que ( )t1Bx S z= . Agora, se (2.50) for pr multiplicada por 1BS e ( )t1Bx S z= for substitudo na expresso, tm-se:

( )( )

t1 1 1B B B

t1 1B B

S A S B S z 0

S A S z 0

=

=

(2.52)

desde que ( )t1 1B BS B S = A soluo de (2.52) a mesma da obtida pela maximizao de uma

forma quadrtica, apresentada em (2.48), exceto que ( )t1Bx S Z= deve ser recuperado, uma vez que Z obtido. Os autovalores, no entanto, so invariantes

transformao no-singular realizada.


Clculo prtico dos autovalores e autovetores

Ser apresentado aqui o mtodo denominado Power method

derivado por Hotelling (1936). Esse mtodo apropriado para problemas em que

somente r autovalores de maior magnitude e os seus respectivos autovetores so

necessrios (rn). O mtodo iterativo, dado um vetor inicial arbitrrio (0)v . O

vetor do estgio i ser representado por (i)v e o da prxima iterao ser obtido

por:

(i 1) (i)v Av+ =

Usualmente um vetor de elementos iguais a 1 usado como vetor inicial. Os vetores caractersticos devem ser normalizados em cada estgio, para

que o critrio de convergncia seja verificado. Quando uma aproximao desejada

para 1 e 1x sejam alcanados, o segundo autovalor e autovetor devem ser

encontrados na matriz A2, definida por:

t2 1 1 1A A x x= (2.53)

E assim o processo repetido at que um nmero rn de pares de autovalores e autovetores sejam obtidos.


Exemplo 2.7

aplicar o power method e determinar os autovalores e autovetores da matriz

apresentada a seguir:

4 2A

2 1 =

1. Determinao de 1 e 1x

O vetor (0)v ser considerado como: (0)v =

11

Na avaliao da convergncia, o autovetor em cada estgio ser

padronizado atravs da diviso pelo elemento de maior valor do mesmo.

(i) (1) (0) 4 2 1 6

A2 1 1 3v v

= = =

Normalizando (1)v :

6(1) 63 1

26

1v = =


Para avaliar a convergncia, os vetores (0)v e (1)v devem ser comparados. Ser

considerado, convergente se todos os elementos de (1)v forem semelhantes aos

elementos correspondentes de (0)v , para uma preciso pr estipulada, ou seja, de

1x10-8. Neste caso, os vetores diferem consideravelmente.

(ii) (2) (1)12

14 2 5v Av

2 1 2.5 = = =

, normalizando

(2)12

1v

=

Comparando-se (2)v com (1)v , padronizados, verifica-se que so idnticos,

indicando que o critrio de convergncia foi alcanado.

O autovetor 1x obtido pela normalizao de (2)v e o primeiro

autovalor 1, por t1 1 1x A x = .

[ ]

(2)

(2)t (2)1

t1 1 1

0,8944V0, 4472V V

0,8944x A x 4, 4721 2, 2361 5

0, 4472

x = = = = =

2. determinao de 2 e 2x

t2 1 1 1A A x x= = [ ]4 2 0,8944 0 0

5 0,8944 0, 44722 1 0, 4472 0 0

=


Portanto os demais autovalores e autovetores de A so nulos (2=0 e

2x 0= ). Os autovalores da matriz da forma quadrtica podem servir para

classificao das mesmas. Demonstra-se que se todos os autovalores da matriz

A, dado tQ x Ax= , forem positivos e maiores que zero a matriz A positiva

definida e a forma quadrtica positiva. Se A possui autovalores positivos e nulos

a matriz ser psd, e a forma quadrtica poder ser nula para um vetor x 0 . Os resultados apresentados at agora, a respeito de formas

quadrticas, so conseqncias da expanso de matrizes simtricas em um

processo denominado de decomposio espectral. A decomposio espectral de

uma matriz A (nxn), simtrica, dada por:

t t t1 1 1 2 2 2 n n nA e e e e e e= + + + " (2.54)

em que i (i=1, 2, ..., n) so os autovalores de A e ie so os autovetores

normalizados associados.

Exemplo 2.8

Considere a matriz simtrica:

4 2A

2 2 =

com os autovalores e autovetores normalizados, apresentados a seguir:


1 1 2 2

0,8507 0,52575, 2361 e 0,7639 e

0,5257 0,8507 = = = =

Obtenha a decomposio espectral de A.

t1 1 1

3,7893 2,3417e e

2,3417 1, 4471 =

t2 2 2

0, 2111 0,3416e e

0,3416 0,5528 =

4 2 3,7893 2,3417 0, 2111 0,34162 2 2,3417 1, 4471 0,3416 0,5528

= +

A expresso da distncia como raiz quadrada de uma forma

quadrtica positiva definida permite que se obtenha a interpretao geomtrica

baseada nos autovalores e autovetores de uma matriz. Dada uma matriz A, pxp, e

suponha que p=2, os pontos tx =[x1, x2] de distncia constante c da origem

satisfazem a:

t 2 2 211 1 22 2 12 1 2x Ax a X a X 2a X X c= + + =

pela decomposio espectral de A, como no exemplo 2.8, tem-se:


( ) ( )t t

1 1 1 2 2 22 2t t t

1 1 2 2

A e e e e

x Ax X e X e

= + = +

Fazendo ti iy x e= , obtm-se: 2 2 2

1 1 2 2c y y= + que uma elipse, pois i>0. Verifica-

se que 121 1x c e= satisfaz ( )12 2t t 21 1 1 1x Ax c e e c= = e 122 2x c e= fornece a

apropriada distncia na direo de 2e . Portanto, os pontos de distncia c

pertencem a uma elipse cujos eixos so dados pelos autovetores de A com

tamanhos proporcionais ao recproco da raiz quadrada dos autovalores. A

constante de proporcionalidade c. A situao ilustrada na Figura 2.1. Se p>2

os pontos pertencem a uma hiperelipside de distncia c constante da origem,

cujos eixos so dados pelos autovetores de A. O semi eixo na direo i tem

comprimento de i

c

.

x 1

x 2

e1

e2

-0,5 c 1

c 2-0,5

Figura 2.1. Pontos de distncia c constante da origem (1 < 2).


Matriz raiz quadrada

A partir da decomposio espectral, possvel definir uma categoria

de matriz, em funo dos autovalores e autovetores, denominada de matriz raiz

quadrada.

Sendo A (nxn), uma matriz com decomposio espectral dada por

nt

i i ii 1

A e e=

= , pode-se construir uma matriz P, cujas colunas so os autovetores normalizados de A, tal que, [ ]1 2 nP e e e= " , e uma matriz diagonal, como os autovalores de A, tal que, =diag[i]. fcil verificar que:

t

n1 1 t t

i ii 1 i

A P P

1A P P e e =

= = =

(2.55)

Definindo, 1/2 como uma matriz diagonal com i como elemento

da i-sima diagonal, ento, a matriz a seguir definida como matriz raiz quadrada

de A e simbolizada por A1/2.

1 12 2

nt t

i i ii 1

A e e P P=

= = (2.56)


As suas propriedades so:

1. (A1/2)t= A1/2 (A1/2 simtrica)

2. A1/2A1/2=A

3. ( )1 12 2i

n1 t t1i i

i 1A e e P P

=

= =

4. A1/2A-1/2=A-1/2A1/2= e A-1/2A-1/2=A-1

em que A-1/2 = (A1/2)-1

Exemplo 2.9

Obtenha a matriz raiz quadrada e a inversa da matriz utilizada no exemplo (2.8),

usando as equaes (2.55) e (2.56):

4 2A

2 2 =

com autovalores e autovetores normalizados, apresentados a seguir:


1 1 2 2

0,8507 0,52575, 2361 e 0,7639 e

0,5257 0,8507 = = = =

As matrizes P e foram obtidas pelos autovalores e autovetores, e esto apresentadas a seguir:

0,8507 0,5257 5, 2361 0P

0,5257 0,8507 0 0,7639 = =

1 1 15,2361 2 21 1 t

1 10,7639 2

00,8507 0,5257 0,8507 0,5257A P P

00,5257 0,8507 0,5257 0,8507 1 = = =

1 12 2 tA P P

5, 2361 00,8507 0,5257 0,8507 0,5257 1,8975 0,63240,5257 0,8507 0,5257 0,8507 0,6324 1, 26490 0,7639

= = = =

A seguir, um programa SAS apresentado contendo os principais

comandos para a realizao das vrias operaes matriciais e vetoriais descritas

nesse captulo.


/* Capitulo 2 de multivariada - principais operaes matriciais descritas */ /* por meio do proc iml. Rotinas de inverso, multiplicao, transposio */ options nodate nonumber ps=1000 ls=76; proc iml; /* elementos de algebra vetorial*/ x1={1,1,1,1}; x2={1,1,0,0}; x3={0,0,1,1}; print x1 x2 x3; y=4*x1; z=x1+x2; print y z; yz=y` * z; yy=y`*y; /*distancia quadratica*/ dy=sqrt(yy); /* distancia da origem*/ zz=z`*z; dz=sqrt(zz); costeta=yz/(dy*dz); print yz yy zz dy dz costeta; /* elementos de algebra matricial*/ x=x1||x2||x3;/* concatenando vetores para obter uma matriz*/ xpx=x`*x; xx=xpx#xpx; /* produto de xpx elemento a elemento por xpx*/ print x xpx xx; /*calculo da base ortonormal de Gramshimidt - a matriz p contm as colunas ortonormalizadas de X*/ Call Gsorth(p, t, lindep, X); print lindep p t; /* calculo de autovalores e autovetores */ pu=eigvec(xpx); /* pu matriz de autovetores */ au=eigval(xpx); /* au vetor de autovalores */ print pu; print au; a={4 2,2 2}; /* matriz A*/ ainv=inv(a); /* inversa de A*/ deta=det(a); /* determinante de A*/ print a ainv deta; c={4 2 2,2 2 0, 2 0 2}; detc=det(c); print c detc; /* fator de Cholesky A=S`S em que S e uma matriz triangular superior */ /* S e a transposta do fator de Cholesky */ Sc=root(c); /* matriz c e singular, porem o SAS calcula assim mesmo o fator de Cholesky */ /* pode-se observar que a ultima linha, da matriz Sc e nula devido a isso*/ Sa=root(a); b={4 2 0,2 2 1,0 1 2}; print b; sb=root(b); print Sc Sa sb; /*maximizao de pares de formas quadrticas */ /* resolver (D - lG)e=0 */ D={4 2,2 2}; G={7 1,1 4}; print D G; Sg=root(G); /* transposta do fator de Cholesky de G */ Sginv=inv(Sg); /* inversa da transposta do fator de Cholesky de G */


print Sg Sginv; II=Sginv`*G*Sginv; /* mostrar que igual a identidade */ print ii; H=Sginv`*D*Sginv; /* operar D, e em seguida extrair auto valores e vetores */ print H; /* D transformada */ zh=eigvec(H); /* zh matriz de autovetores */ auh=eigval(H); /* auh vetor de autovalores */ xh=Sginv*zh; /* matriz de autovetores recuperados */ teste=xh`*g*xh; print teste;/*mostrar que resulta na identidade*/ print xh; print auh; /* obtencao de matriz raiz quadrada - exemplificar com a matriz D */ aud=eigval(D); /* autovalores de D*/ lamb=diag(aud); /* diagonalizando aud e resultado em lamb */ print lamb; lambS=root(lamb); /* achando a raiz quadrada de lamb */ avd=eigvec(D); /* autovetores de D em avd */ Droot=avd*lambS*avd`; /* usando a definio para encontrar a matriz raiz quadrada de D */ print Droot; DD=avd*lamb*avd`; /* checando propriedades */ print DD; /* deve ser igual a D */ quit;

2.4. Exerccios

2.1. Sejam os vetores x =[3, 2, 4] e y '=[-1, 2, 2]

(a) plote os dois vetores

(b) encontre (i) o comprimento de x , (ii) o ngulo entre x e y, e (iii) a distncia

entre x e y.

(c) plote os vetores x x.1 e y y.1 ( x 3= e y = 1).


2.2. Dada a matriz

1 1 0 01 1 0 0

X 1 0 1 01 0 1 01 0 0 1

=

(a) Ortonormalize as colunas de X, usando a construo de Gram-Schimidt.

(b) Determine o vetor (coluna de x) linearmente dependente.

(c) Determine o posto coluna de X, a partir da construo de Gram-Schimidt

realizada em (a).

2.3. Dadas as matrizes

4 2 2 6 4 2A 2 2 0 B 4 4 0

2 0 4 2 0 6

= =

(a) Obtenha a inversa de A e de B, usando o algoritmo de Gauss-Jordan.

(b) Verifique usando o processo de Gauss-Jordan que (AB)-1=B-1A-1.

2.4. Verifique se a matriz


0,8507 0,5257P

0,5257 0,8507 =

uma matriz ortogonal.

2.5. Seja

8 1A

1 2 =

(a) Calcule o determinante de A.

(b) Com base em (a) a matriz A pode ser considerada positiva definida? Porque?

(c) Obtenha o fator de Cholesky, e confirme a resposta dada em (b).

(d) Determine os autovalores e autovetores de A.

(e) Obtenha a decomposio espectral de A.

(f) Encontre A-1.


(g) Encontre os autovalores e autovetores de A-1. Verifique que relao tem como

os valores encontrados em (d).

2.6. Considere as matrizes

4 4,001 4 4,001A B

4,001 4,002 4,001 4,002001 = =

As matrizes so idnticas, exceto por pequenas diferenas no

elemento, a22 e b22 devida a arredondamentos. Mostre que A-1 = -3B-1 (pequenas

mudanas, talvez devido a arredondamentos, podem causar substanciais

diferenas na inversa).

2.7. Verifique se a forma quadrtica

2 21 1 2 2Q 2x 2x x 4x= +

positiva definida.

Sugesto: Verificar se tQ x Ax= positiva, pode ser feita verificando se A pd.

2.8. Dada as matrizes


4 1 2 1A B

1 2 1 1 = =

(a) determine os autovalores e autovetores que maximizam a razo

t

t

x Ax B 0x Bx

=

Obs. O que equivalente a resolver o sistema determinantal dado por (2.51)

A B 0 = .

(b) Determine a matriz raiz quadrada de A e de B.

2.9. Dada a matriz de covarincia amostral (S)

25 2S

2 4 =

(a) Determine R, dada D1/2, definida por:


12

11

22

pp

S 0 0

0 S 0D

0 0 S

=

""

# # % #"

Sendo ( ) ( )1 12 21 1R D S D =

(b) Verifique a relao

( ) ( )1 12 2S D R D=

||[ 3 ]||Amostragem multivariada

3.1. Introduo

Com os conceitos de lgebra vetorial introduzidos no captulo 2,

pode-se aprofundar na interpretao geomtrica das estatsticas descritivas X , S

e R. A maioria das explicaes usam a representao das colunas de X, como p

pontos no espao n dimensional. Ser introduzida neste instante a pressuposio

de que as observaes constituem uma amostra aleatria. De uma forma

simplificada, amostra aleatria significa (i) que as medidas tomadas em diferentes

itens (unidades amostrais ou experimentais) so no relacionadas uma com as

outras, e (ii) que a distribuio conjunta das p variveis permanece a mesma para

todos os itens. Essa estrutura de amostra aleatria que justifica uma escolha

particular de distncia e dita a geometria para a representao n dimensional dos

dados. Finalmente, quando os dados podem ser tratados como uma amostra

aleatria inferncia estatstica ter por base um slido fundamento.


3.2. Geometria amostral

Uma observao multivariada uma coleo de medidas em p

variveis tomadas na mesma unidade amostral ou experimental. No captulo 1,

item 1.3, as n observaes obtidas foram dispostas em um arranjo (Matriz) X por,

11 12 1 1

21 22 2 2

1 2

1 2

k p

k p

j j jk jp

n n nk np

x x x xx x x x

Xx x x x

x x x x

=

" "" "

# # # # # #" "

# # # # % #" "

em que cada linha de X representa uma observao multivariada. Desde que o

conjunto todo de mensuraes muitas vezes uma particular realizao de

variveis aleatrias, diz-se que os dados representam uma amostra de tamanho n

de uma populao p variada.

Os dados podem ser plotados por um grfico com p coordenadas. As

colunas de X representam n pontos no espao p dimensional. Esse tipo de grfico

fornece informaes de locao dos pontos e de variabilidade. Se os pontos

pertencem a uma esfera, o vetor de mdias amostrais, X , o centro de balano

ou de massa. Se a variabilidade ocorre em mais de uma direo, pode-se detectar

pela matriz de covarincia, S. Uma medida numrica nica de variabilidade

fornecida pelo determinante da matriz de covarincia.


Exemplo 3.1

Calcule o vetor mdia X para a matriz X apresentada a seguir. Plote os n = 3

pontos no espao p=2 (bidimensional) e localize X no diagrama resultante.

2 1X 3 0

2 2

=

A mdia amostral dada por:

( ) ( )( )

2 3 2 3 1X

11 0 2 3

+ + = = + +

O primeiro ponto dado por [ ]t1X 2 1= , o segundo por [ ]t2X 3 0= , e o terceiro por [ ]t3X 2 2= . A Figura 3.1 mostra os pontos juntamente com X , centro de massa ou de balano, obtidos a partir da matriz X.


-4 -3 -2 -1 0 1 2 3 4

-3

-2

-1

0

1

2

3

x3

x1

x2

x_

1

2

Figura 3.1. Diagrama com n=3 pontos no espao bidimensional (p=2) mostrando o

centro de massa, X .

Uma representao alternativa obtida atravs da considerao de p

pontos no espao n dimensional. Os elementos das linhas de X so utilizados

como coordenadas.


11 12 1 1

21 22 2 2

1 2

1 2

1 2

=

=

" "" "

# # # # # #" "

# # # # % #" "

" "

k p

k p

j j jk jp

n n nk np

k p

x x x xx x x x

Xx x x x

x x x x

y y y y

As coordenadas do k-simo ponto [ ]tk 1k 2k nky x x x= " determinada pela n-upla de todas as medidas da k-sima varivel. conveniente

representar tky como vetor ao invs de pontos.

Exemplo 3.2

Plote os dados da matriz X, com p=2 vetores no espao tridimensional (n=3)

2 13 03 2

X =

[ ]t1y 2 3 2= e [ ]t2y 1 0 2=


1

2

3

0

Y

Y 2

1

Figura 3.2. Diagrama da matriz de dados X como p=2 vetores no espao

tridimensional.

Muita das expresses algbricas que sero encontradas na anlise

multivariada, podem ser relacionadas s noes geomtricas de ngulos,

comprimento (norma) e volumes. Isto importante, pois representaes

geomtricas facilitam a compreenso e conduz a novas vises. Infelizmente, o ser

humano est limitado a visualizar objetos no espao tridimensional, e as

representaes da matriz X no sero teis se n>3. No entanto, os

relacionamentos geomtricos e os conceitos estatsticos associados, descritos

para o espao tridimensional ou bidimensional, permanecem vlidos para

dimenses maiores.


possvel, em funo do exposto, prover uma interpretao

geomtrica ao processo de encontrar a mdia amostral. O vetor 1 (nx1) ser

definido por t1 =[1 1 1]. O vetor 1 forma um ngulo igual com cada um dos

eixos coordenados, de tal forma que ( )1 n 1 tenha comprimento unitrio e mesmo ngulo de direo. Considerando o vetor [ ]tk 1k 2k

Download - Estatística Multivariada.pdf

Top Related