econometria vanessa santiago
TRANSCRIPT
Presentación #1:Manual de Análisis Factorial(páginas 215 – 262)
Vanessa Santiago OlivaresUniversidad InteramericanaMATE 6600 Econometría
Introducción
El Capítulo 7 se toca el tema del análisis factorial usando la técnica RLa técnica R busca identificar relaciones entre factores y variables cuando se usan los mismos instrumentos de medida en muchos sujetos Antes de la sección 7.5 (página 215) se describe el método Varimax para realizar el análisis
Método de Criterios en Tandem
El método pretende usar rotaciones de los factores para poder identificar relaciones fuertes y únicas entre dichos factores y las variables
Este método hace uso de dos criterios para realizar la separación y rotación de los datos
Método de Criterios en Tandem
Criterio I - Se basa en el siguiente principio
Si dos variables están correlacionadas, deben aparecer en el mismo factor
Método de Criterios en Tandem
Matemáticamente se expresa así:
∑∑∑= = =
=m
k
n
i
n
jjkikij aarF
1 1 1
222'
∑=
=n
kjkikij aar
1
donde
es la correlación entre la variable i y la variable j
aik es el peso de la variable i en el factor k
a jk es el peso de la variable j en el factor k
Método de Criterios en Tandem
Luego de la rotación, los factores cuyo peso es demasiado pequeño (<0.3) se descartan
Los criterios marginales (entre 0.3 y 0.45) y fuertes (>0.45) pasan a una segunda rotación, conocida como el Criterio II
Método de Criterios en Tandem
Criterio II - Se basa en el siguiente principio
Si dos variables no están correlacionadas, no deben aparecer en el mismo factor
Método de Criterios en Tandem
Matemáticamente se expresa así:
( )∑∑∑= = =
−=m
k
n
i
n
jjkikij aarF
1 1 1
222'1 donde
rij es la correlación entre la variable i y la variable j
aik es el peso de la variable i en el factor k
a jk es el peso de la variable j en el factor k
Método de Criterios en Tandem
El método de los Criterios en Tandemproduce resultados similares al método Varimax cuando se aplican siguiendo los mismos controles
Estrategia de Trabajo para el Análisis Factorial
1. Extraer factores con el método de residuo mínimo hasta alcanzar convergencia
2. Inspeccionar los factores y eliminar los que tengan un peso de 0.2 o menos
3. Rotar bajo el Criterio I y desechar los factores con peso de 0.3 o menos
Estrategia de Trabajo para el Análisis Factorial
4. Rotar bajo el Criterio II y eliminar los factores que no se aumenten o pierdan su carácter básico
5. Continuar proceso de eliminación con el Criterio I
6. La solución final puede ser rotada para satisfacer otros criterios del investigador
Principios de Diseño
El investigador debe ser libre para definir el área que desea estudiar
Definir el dominioEstablecer estructura factorial hipotéticaFormular el modelo factorial con los factores esperados y las hipótesis alternativas
Principios de Diseño
Escoger las variables con las que se quiere trabajar
Frecuentemente, el investigador se encuentra con que debe generar nuevas variables con las características deseadas que sirvan de variables indicadoras de los factores que se conjetura aparecerán.Cada factor debe tener cinco o más variables como buenos indicadoresMientras más variables, más seguro que se encuentre una relación en las rotaciones
Jerarquía Factorial
Se refiere a la importancia de los factores en el modelo finalLa presencia de factores de bajo nivel jerárquico que resultan de la introducción de variables con varianza solapada, a menudo, no es prevista por el investigadorAnte esto, es prudente repasar el análisis luego de eliminar o combinar variables para suprimir factores de baja jerarquía
Jerarquía Factorial
Otra forma de impulsar factores de interés es mediante la extracción de factores de bajo nivel y realizando rotacionesLa dificultad de este método estriba en la capacidad de identificar correctamente el número de factores que se deben eliminar
Jerarquía Factorial
Aunque los factores de alto nivel son útiles para algunos fines, generalmente se desea tener un modelos con factores de jerarquía intermedia ya que se ha encontrado que son más útiles para fines cinetíficos.
Variables
Las variables deben generar datos continuos y distribuidos normalmenteLas regresiones de pares de variables deben ser linealesEsto permite que el coeficiente de correlación Pearson produzca resultados confiables
Variables
Las escalas de medida afectan los resultados del análisis factorial y las correlaciones encontradasPara variables que no son continuas, sino categóricas, es deseable tener 12 o más grados en vez de dos o tresLas variables incluidas en la misma matriz no deberían ser dependientes unas de otras
Variables
Muestras de tamaño 50 ofrecen fiabilidad muy ineficiente de los coeficientes de correlaciónMuestras de tamaño 1000 son más adecuadas para la mayoría de los fines del análisis factorial
Variables
Para el trabajo exploratorio es importante garantizar que haya mucha varianza, por tanto, el tamaño de la muestra pasa a un segundo planoPara refinar el modelo hipotetisado, la muestra debe ser grande (representativa de la población) para asegurar correlaciones precisas
Coeficientes de Correlación
El coeficiente de correlación de Pearson es apropiado para las diversas situaciones que ocupan al análisis factorialEl inconveniente que tiene es que es intensivo en cómputos matemáticos, lo que dificulta su aplicación por el método manual
Coeficientes de Correlación
Otros coeficientes disponibles:ϕ - Se emplea cuando las variables representas dicotomías absolutas
Punto Biserial – Se emplea cuando una de las variables es una dicotomía absoluta, y la otra es continua y aproximadamente normal
Coeficiente de Correlación
Otros coeficientes disponibles:Biserial – Se emplea cuando una de las variables se distribuye normalmente pero ha sido artificialmente dicotomizada, y la otra es continua y aproximadamente normal
Tetracórico – Se emplea cuando ambas variables estén distribuidas normalmente pero artificialmente dicotomizadas
Coeficientes de Correlación
Se debe evitar variables dicotómicas siempre que sea posibleSe debe intentar tener variables continuas o con, al menos, 12 categoríasCalcular la correlación Pearson, que ofrece buena resolución
Errores Comunes
1. Recoger datos antes de planificar2. Usar variables con malas
distribuciones y regresiones inapropiadas
3. Usar variables que no son independientes entre si
4. Sobre-determinar factores5. Utilizar demasiadas variables
complejas
Errores Comunes
6. Incluir variables muy similares7. No proporcionar buenas variables
indicadores de un factor8. Procedimientos deficientes de
muestreo9. No incluir suficientes factores en el
análisis10.Utilización de coeficientes de
correlación inadecuados
Errores Comunes
11.Utilización de estimaciones inapropiados
12.Extraer demasiado pocos factores13.Procedimientos de rotación
deficientes14.Interpretar el primer factor extraído
como un factor general15.Sacar conclusiones con evidencia
insuficiente
Técnica Q
Esta técnica es similar a la técnica R, pero hace comparaciones entre las columnas de la matriz en vez de las filas
Establece correlaciones entre los sujetos en vez de las pruebasPuesto que las pruebas utilizadas no son iguales, requiere normalización de los datos
Técnica Q
Al tipificar o normalizar los datos, el promedio se vuelve cero y la desviación estándar 1
Este proceso causa que los efectos importantes se aumenten y los no importantes se supriman
Técnica Q
La estabilidad del coeficiente de correlación depende de que se tome una muestra grande y representativa de casos de la población
Con la técnica R, esto significa usar muchos sujetos con un número limitado de variablesCon la técnica Q, esto significa medir muchas variables para un número limitado de sujetos
Problema de la Rotación en el Análisis Mediante la Técnica Q
Los sujetos deben ser cuidadosamente seleccionados para obtener resultados factoriales significativos
No hacerlo causaría que no se pueda discriminar entre los sujetos y parezca que todos pertenecen al mismo grupo
Técnica P
Utilizado para el análisis clínicoLa matriz está compuesta por observaciones (columnas) de las mismas variables (filas) para el mismo sujetoLos factores derivados de la técnica P representan grupos de variables sustancialmente correlacionadas
Técnica P
Este análisis es apropiado para variables con variaciones medibles a través del tiempo pero que sean inmunes al efecto de práctica, aprendizaje o errorTiene poco potencial para características que son estables en el individuo
Otras Técnicas
Técnica O – Similar a la técnica P, pero comparando columnas en vez de filas de la matriz de datosTécnica T – Correlaciones entre las ocasiones en que grupos de individuos se comportan de forma similarTécnica S – Correlaciona dos individuos sobre una serie de acontecimientos en los que se miden las variables de interés