análisis de correspondencias múltiples - stat.rice.edujrojo/pasi/lectures/costa...

31
Análisis de Correspondencias Múltiples CIMPA-UCR Análisis de Correspondencias Múltiples (ACM)

Upload: phamhuong

Post on 29-Sep-2018

223 views

Category:

Documents


0 download

TRANSCRIPT

Análisis de Correspondencias Múltiples

CIMPA-UCR

Análisis de Correspondencias

Múltiples

(ACM)

Análisis de Correspondencias Múltiples

CIMPA-UCR

Lebart, 1974

Hacer análisis de correspondencias sobre:

• Tabla disyuntiva completa

• Tabla de Burt

Representación simultánea de todas las modalidades.

Ojo: # de modalidades

Bibliografía: Lebart et al. (inglés)

Lebart et al. (español)

Greenacre (inglés)

Escofier & Pagès (francés)

ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES

Análisis de Correspondencias Múltiples

CIMPA-UCR

ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES

n: individuos

p: variables cualitativasTipo de

Sexo Prov salario

1 M Alajuela Alto

2 F Heredia Bajo

3 F San Jose Muy Alto

4 M Cartago Bajo

Tabla disyuntiva completa:

M F SJ A C H MB B M A MA …

1 1 0 0 1 0 0 0 0 0 1 0

2 0 1 0 0 0 1 0 1 0 0 0

3 0 1 1 0 0 0 0 0 0 0 1

4 1 0 0 0 1 0 0 1 0 0 0

M M M M

M

Análisis de Correspondencias Múltiples

CIMPA-UCR

M F Sjo Ala Car Her MB B M A MA …

M 240 0 100 60 44 36

F 0 259 103 66 39 51

SJ 100 103 203 0 0 0

A 60 66 0 126 0 0

C 44 39 0 0 83 0

H 36 51 0 0 0 87

MB

B

M

A

M

Tabla de Burt (contingencia generalizada)

ANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES

Análisis de Correspondencias Múltiples

CIMPA-UCRANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES

La tabla de datos: Tabla de Burt

ind SEXO EDAD INGRESO

1 F 5 Medio

2 F 3 Alto

3 M 4 Bajo

4 F 1 Bajo

5 F 2 Medio

6 M 5 Alto

7 F 2 Medio

8 M 3 Bajo

9 M 1 Alto

10 F 4 Medio

F M 1 2 3 4 5 B M A

F 6 1 2 1 1 1 1 4 1

M 4 1 0 1 1 1 2 0 2

1 1 1 2 1 0 1

2 2 0 2 0 2 0

3 1 1 2 1 0 1

4 1 1 2 1 1 0

5 1 1 2 0 1 1

B 1 2 3

M 4 0 4

A 1 2 3

18 12

Sexo Edad Ingresos

Ingre

sos

Edad

Sex

o

Análisis de Correspondencias Múltiples

CIMPA-UCRANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES

ACM Análisis de Correspondencias de una tabla

disyuntiva completa⇔

3

3

0 1 0 0 1 0 0 0 1 3

3

3

3

3

Profesión Edad Sexo

3n

nin

div

iduos

Estructura particular

de la tabla

Propiedades

particulares del

análisis

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM: AFC DE UNA TABLA DISYUNTIVA

ijz qzi =•

jz•

1p •• jqpL11

1

i

nnq

)( ijzZ =

=0

1ijz

Márgenes:

n = # individuos

q = # variables cualitativas

pk = #modalidades de la variable k

= total de columnas∑=

=q

k

kpp1

•iz

jz•

= q pues hay q unos en la fila i

# individuos que tienen modalidad j

nqzij

ij

=∑∑

Matriz a diagonalizar:

11 11 −− == BDq

ZDZq

S t

)(con jzdiagD •=

Análisis de Correspondencias Múltiples

CIMPA-UCRANÁLISIS DE CORRESPONDENCIAS MÚLTIPLES

n puntos en qℜ

F2

F1

p puntos en nℜ

Edad 1 Edad 3

Edad 2

Prof 1

Prof 4

Prof 3Prof 2M

F

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM: CASO DE 2 VARIABLES

Análisis factorial de correspondencias

Disyuntiva completa Burt Contingencia

1 P1 P21

n

(Z1) (Z2)

Z

0 0 1 0 0 1 0 0

0

0

00

1 P1 P21

1

P1

P2

1

B=Zt Z

P1

P2

K=Z2t Z1

zλ 2

zB λλ = ( )12 −= zK λλ

Análisis de Correspondencias Múltiples

CIMPA-UCRACM: NUBES DE PUNTOS - PERFILES

Perfiles- fila (individuos)

Puntos (coordenadas): Tabla:

Peso:

Métrica:

Distancia χ2:

q

Z

Z

Z ij

i

ij=

Zq

1

nnq

q

nq

Zi 1==•

• jZ

nqdiag

( )∑=

−=′p

j

jiij

j

ZZZq

niid

1

22 1),(

Perfiles- columna (modalidades)

Puntos (coordenadas):

Peso:

Métrica:

Distancia χ2:

j

ij

Z

Z

nq

Z j•

( )ndiagq

nqdiag

Z

nqdiag

i

=

=

•2

1

2 ),( ∑= ′•

−=′

n

i j

ji

j

ij

Z

Z

Z

Znjjd

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM: DISTANCIA DE χ2

Perfiles de fila:

con : modalidades que tiene solo un individuo i o i’

Más parecidos si tienen más modalidades en común.

( ) ∑∑′∈ •=

=−=′iiMj j

p

j

jiij

j Zq

nZZ

Zq

niid

11),(

2

1

2

iiM ′

Perfiles de columna:

Entre más objetos tengan sólo una de j o j’ mayor es la distancia

[ ] [ ]jj

n

i j

ji

j

ij

ZZ

jjindcardjjindcardn

Z

Z

Z

Znjjd

′••= ′•

′+′=

−=′ ∑

no,(no,(),(

2

1

2

Análisis de Correspondencias Múltiples

CIMPA-UCRINTERPRETACIÓN

• Dos modalidades escogidas por los mismos

individuos coinciden

•Dos individuos son cercanos si escogen las mismas

modalidades

• Modalidades con poco efectivo están alejadas del

centro de gravedad

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM: INERCIA

=

nnG

1,...,

1Centro de gravedad de nube de modalidades

1121

),(1

221

2

2 −=

+−=

−=

•= ••= •

∑∑j

n

i j

ij

j

ijn

i j

ij

Z

n

nnZ

Z

Z

Zn

nZ

ZnGjd

Distancia mayor si el efectivo es pequeño

Inercia de la modalidad j:

−=

−==

••

n

Z

qZ

n

nq

ZGjd

nq

ZjI

j

j

jj1

11),()( 2

Mayor inercia si el efectivo es pequeño

Análisis de Correspondencias Múltiples

CIMPA-UCR ACM: INERCIA

Inercia de la variable k:

)1(1

11

)()(11

−=

−== ∑∑

=

=

k

p

j

jp

j

pqn

Z

qjIkI

kk

Crece con el número de modalidades

Si pk = 2 mínimoq

1

Inercia total:

1)(1

)1(1

)( −=−=−==∑ ∑q

pqp

qp

qkII

k k

k

No tiene significado estadístico

Análisis de Correspondencias Múltiples

CIMPA-UCR ACM: SOLUCIÓN

Diagonalización:

ααα

ααααα

ααα

ψλψ

ϕλϕϕ

λ

=

=⇒=

=

−−

t

t

t

ZZDq

ZZDq

uD

uuZDZq

1

11

1

1

1

1En :

pℜ

factor

En : nℜ

Relaciones de transición:

α

α

α

α

α

α

ϕλ

ψ

ψλ

ϕ

Zq

ZDt

1

1 1

=

= −

Análisis de Correspondencias Múltiples

CIMPA-UCRACM: SOLUCIÓN

Relaciones baricéntricas:

∑∑

∑∑

∈•= •

∈= •

==

==

)(1

)(1

11

11

jIi

i

j

i

n

i j

ij

j

iPj

jj

p

j i

ij

i

ZZ

Z

qZ

Z

α

α

α

α

α

α

α

α

α

α

ψλ

ψλ

ϕ

ϕλ

ϕλ

ψ

P(i) modalidades que tiene i

I (j) modalidades que tiene j

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM: INTERPRETACIÓN

• Proximidad entre individuos en términos de parecido:

- Dos individuos se parecen si tienen casi las

mismas modalidades:

• Proximidad entre modalidades de variables diferentes

en términos de asociación:

- Son cercanos puesto que globalmente están

presentes en los mismos individuos

• Proximidad entre modalidades de una misma variable

en términos de parecido:

- Son excluyentes por construcción

- Si son cercanas es porque los individuos que las

poseen presentan casi el mismo comportamiento

en las otras variables

Análisis de Correspondencias Múltiples

CIMPA-UCR

CONCEPTOS SOCIOLÓGICOS EN LA EDUCACIÓN C.R.Opinión: var 1, … , var 5/var 6, … , var 10

Señalización: sexo, tipo colegio, ingr, reli, poli, edpa, edma

Libertad y empresa privadaVar 1. La empresa privada es necesaria para la libertad

Var 2. Se puede entrar en un sindicato sin ser perseguido

Var 3. Si se trabaja en una e.p. no hay tiempo para ocuparse de la familia

Var 4. Los trabajadores deben repetar las órdenes de su patrono sin criticarlas

Var 5. Mi padre debe dedicarle más tiempo a la empresa o institución donde

trabaja

Democracia y EjércitoVar 6. Un país democrático no necestita ejército

Var 7. Un país con ejército es un país totalitario

Var 8. Es necesario que C.R. tenga ejército para defenderse de amenazas

externas

Var 9. La existencia de un ejército en C.R. podría llevar a una dictadura militar

a corto plazo

Var 10. E.E. U.U. no es un país democrático porque tiene ejército

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

• Clasificacion de variables cuya asociacion

es medida con el T de Chuprov

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo

Análisis de Correspondencias Múltiples

CIMPA-UCR

ACM Ejemplo