análisis de correspondencias

Post on 05-Jan-2016

46 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Análisis de correspondencias. Procedimiento para el AC. - PowerPoint PPT Presentation

TRANSCRIPT

Análisis de correspondencias

Procedimiento para el AC

1. Se estandariza la tabla de frecuencias relativas dividiendo por (la raiz cuadrada de) los totales de fila y columna. Esta estandarización se hace para que dos filas (columnas) tengan la misma estructura sin efectos de escala. Sea Z la nueva matriz.

• Interpretación: una variable binomial tiene media np y desviación típica (npq)1/2. Si p es pequeño se aproxima por (np)1/2.

• Cada celda tiene una desviación estandar distinta que podemos estimar por el producto de sus frecuencias relativas por filas (fri)1/2 y columnas (frj)1/2. Estandarizando su desviación típida las hacemos comparables.

2. Se calculan valores y vectores propios de las matrices Z’Z y ZZ’ donde Z es la matriz de frecuencias relativas estandarizada.

3. Se toman los dos vectores propios ligados a los dos mayores valores propios (excluyendo el uno) de la matriz Z’Z (o del matriz ZZ’) y se proyectan las filas (columnas) sobre ellos.

Puntos de columna y de fila

Simétrica Normalización

Dimensión 1

1.51.0.50.0-.5-1.0

Dim

ensi

ón 2

.6

.4

.2

.0

-.2

-.4

-.6

-.8

-1.0

val

prof

3

2

1

43

2

1

Idea del método AC

Dada una matriz F de frecuencias relativas representar conjuntamente en un mismo gráfico las filas y las columnas con la mínima pérdida de información

Procedimiento:Comencemos con las filas ¿Cómo representarlas?• Primer Problema: Si no estandarizamos por el

total, dos filas con la misma estructura pueden parecer muy distintas

Necesidad de estandarizar

• Llamemos Df a la matriz diagonal que tiene las frecuencias relativas de las filas en la diagonal principal

• Igualmente Dc será la matriz diagonal de las frecuencias de las columnas

Podemos estandarizar las filas dividiendo cada una por su frecuencia relativa, obteniendo la matriz

Segundo Problema: Con datos cualitativos la distancia razonable entre dos filas es la ji cuadrado, no la distancia euclídea

top related