universidad de el salvadorri.ues.edu.sv/id/eprint/12805/1/19200205.pdf · 2017. 2. 28. ·...
TRANSCRIPT
-
UNIVERSIDAD DE EL SALVADOR FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA
ESCUELA DE MATEMÁTICA
“TEORÍA DE MODELOS MULTINIVEL Y SUS APLICACIONES”.
PRESENTADO POR:
WELMAN DEL CARMEN ROSA ALVARADO
PARA OPTAR AL GRADO DE:
LICENCIADO EN ESTADÍSTICA
ASESOR:
DR. JOSÉ NERYS FUNES TORRES
ASESOR ADJUNTO:
LIC. RENÉ ARMANDO PEÑA
CIUDAD UNIVERSITARIA, SEPTIEMBRE DE 2005
-
UNIVERSIDAD DE EL SALVADOR RECTORA : Dra. María Isabel Rodríguez SECRETARIA GENERAL : Licda. Alicia Margarita Rivas de Recinos.
FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA DECANO EN FUNCIONES : M.Sc. José Héctor Elías Díaz SECRETARIO : Lic. Víctor Manuel Durán Belloso
ESCUELA DE MATEMÁTICA DIRECTOR : Lic. Mauricio Hernán Lovo Córdova
ii
-
TRABAJO DE GRADUACIÓN APROBADO POR: COORDINADOR :
Lic. Mauricio Hernán Lovo Córdova ASESOR :
Dr. José Nerys Funes Torres. ASESOR ADJUNTO :
Lic. René Armando Peña
iii
-
DEDICATORIA
Le agradezco y dedico a Dios, a la Universidad de El Salvador, a mis padres Maria Adela
Alvarado y Ángel Fabricio Rosa, por darme la oportunidad de finalizar este trabajo de
graduación. De igual manera deseo expresar mi agradecimiento a mis asesores Dr. José
Nerys Funes Torres y el Lic. René Armando Peña, quienes por sus enseñanzas
contribuyeron en gran parte para el desarrollo del presente trabajo de graduación.
Welman del Carmen Rosa Alvarado
iv
-
ÍNDICE. Contenido Pág.
Introducción………….………………………………………………………….......vii Capítulo I: Introducción a la Teoría de Modelos Multinivel…………………..….1
1.1 Antecedentes de los modelos multinivel…………………………………..…...3 1.2 El modelo de ecuación estructural………………………………….…….…...12 1.3 La naturaleza de los modelos multinivel……………………………………...16 1.4 Conjeturaciones previas al análisis multinivel…………………………….….24 1.5 Enfoques multinivel basado por el análisis de regresión múltiple,
ANOVA y ANCOVA……………………………………………………..…..26 1.6 El error de Medida………………………………………………………….....29
Capítulo II: Teoría de Modelos Multinivel…………………………………….…..32
2.1 El modelo 2 niveles y notación básica……………………………………..…..34 2.2 El modelo de dos niveles…………………………………………………..…..39 2.3 Estimación de los parámetros para el modelo de componentes de varianza….41 2.4 El modelo de 2 niveles incluyendo coeficientes aleatorios……………...…….47 2.5 Estructura general y estimación para un modelo multinivel de dos niveles.......50 2.6 Estimación de los parámetros del Modelo Multinivel general de tres niveles..68 2.7 Residuales……………………………………………………………………...81 2.8 Estadistica inferencial………………………………………………………….84
2.8.1 Error estándar..........................................................................................84 2.8.2 Contrastes………………………………………………………….…...85
Capítulo III: Aplicación de Modelos Multinivel………………………………..…..87
3.1 Objetivos de la aplicación………………………………………………….….90 3.2 Descripción de los datos…………………………………………………….…91
3.2.1 Descripción de Variables……………………………………………....92
3.3 Técnica de Análisis……………………………………………………………93 3.3.1 Test Estadístico………………………………………………………..93 3.3.2 Estrategia de Análisis: niveles de agregación………………………....93
3.4 Análisis multinivel para Lenguaje y Matemática……………………………..94
v
-
3.4.1 Las diferencias geográficas y del rendimiento escolar para
Lenguaje y Matemática………………………………………………95 3.4.2 Modelo Nulo para Lenguaje………………………….……...……….95 3.4.3 Modelo Multinivel geográfico para Lenguaje…………………….….99 3.4.4 Modelo Nulo Matemática………………………………….…..……104 3.4.5 Modelo Multinivel geográfico para Matemática………….………...104
3.5 La familia y el contexto de la escuela……………………………………….106 3.6 Cultura institucional y práctica en el aula…………………………………...116 3.7 Modelo optimal de factores asociados al rendimiento en Lenguaje
y Matemática……………………………………………………….…...…...121 3.7.1 Las variables…………………………………………………………122 3.7.2 Modelo óptimo para Lenguaje………………………………………123 3.7.3 Modelo óptimo para Matemática…………………………………….129 3.7.4 La diagnosis del modelo mediante los residuos para el nivel 1……...134 3.7.5 La diagnosis del modelo mediante los residuos para el nivel 2……...136
Capítulo IV: Conclusiones…………………………………………………………138
4.1 Conclusiones para Lenguaje…………………………………………………139 4.2 Conclusiones para Matemática………………………………………………141
REFERENCIAS BIBLIOGRÁFICAS……………………………………………143 ANEXOS……………………………………………………………………………146
vi
-
INTRODUCCIÓN
Actualmente es frecuente encontrar en diversas investigaciones de las áreas de la
educación y de la salud el uso de la Teoría de Modelos Multinivel como alternativa
metodológica de acercar el contexto del individuo a la explicación de la causalidad. Lo
que se pretende con esta metodología es representar de una manera precisa aquellos
fenómenos en los que la recogida de datos presenta una estructura anidada. En ese
sentido el modelo multinivel tiene en cuenta el agrupamiento de los individuos en otras
unidades, es decir, donde no solo se han seleccionado una serie de sujetos, sino también
una serie de unidades contextuales a los que éstos pertenecen, tales como: hospitales,
clases, escuelas, municipios, empresas u otras instituciones; situaciones en las que se
tienen estructuras particulares de los datos, las cuales no pueden ser considerados en un
análisis de regresión clásico; en caso que se utilice este tipo de regresión se llegaría a las
siguientes consecuencias: la producción de sesgos en los errores típicos de los
estimadores y el aumento de la probabilidad de rechazar la hipótesis nula de no
asociación, cuando ésta es cierta.
Conceptualmente, los modelos multinivel son básicamente un modelo de regresión de
efectos mixtos, en donde se estudia una relación lineal entre dos o más variables en
estudios realizados mediante un muestreo por agrupamiento, es decir, una técnica
correlacional adecuada para analizar variaciones en las características de los sujetos que
son miembros de un grupo que a su vez, hace parte de otra agrupación, o sea, mediciones
que forman una estructura agrupada y jerárquica. El modelo permite la descomposición
de la variación de una variable criterio (como por ejemplo, rendimiento) en sus
componentes “dentro del grupo” (dentro-escuela, dentro-departamentos) y “entre grupo”
(entre-escuela, entre-departamento) y el análisis de la asociación entre variables en esos
niveles de agregación.
vii
-
Todos estos aspectos serán abordados en el presente trabajo de graduación que está
estructurado en cuatro capítulos: introducción a la teoría multinivel, teoría de modelos
multinivel, aplicación y conclusiones. Como énfasis de una comprensión conceptual y
práctica de cómo utilizar esta técnica estadística cuando se tiene una situación anidada en
los datos.
En el primer capítulo se presentan los antecedentes de los modelos multinivel, el modelo
de ecuación estructural y se define el modelo multinivel como un modelo de regresión de
efectos mixtos, en donde se estudia una relación lineal entre dos o más variables en
estudios realizados mediante un muestreo por agrupamiento.
En el segundo capítulo se estudian los supuestos tanto de un modelo de regresión simple
como un modelo multinivel de dos y de tres niveles, además se presenta el método de
estimación de los parámetros para el modelo de componentes de varianza y la estimación
de los parámetros fijos y aleatorios del modelo multinivel de dos y tres niveles a partir de
los enfoques ANOVA (Análisis de varianza) y ANCOVA (Análisis de covarianzas).
En el tercer capítulo se desarrolla una aplicación de los modelos multinivel, disponiendo
de la base de datos de un estudio realizado en diversos países de Latinoamérica, el cual
consistió en aplicar un instrumento de recolección de información a: alumnos, profesores,
padres de familia y escuela. El objetivo de esta aplicación es identificar las condiciones
en las que los alumnos de tercero y cuarto grados de educación básica, alcanzan los
aprendizajes en Lenguaje y Matemática, según el resultado registrado en pruebas
estandarizadas. Esto, para buscar un modelo óptimo de Lenguaje y Matemática, de tal
manera que se logre encontrar cuales son los factores asociados al rendimiento de los
estudiantes en la prueba de Lenguaje y Matemática.
En el cuarto capítulo se concluye a partir de la aplicación realizada con la técnica
multinivel tanto para Lenguaje y Matemática. Se presenta además, un ejemplo de
predicción de la puntuación que obtendría un estudiante en Lenguaje y Matemática
basado en el contexto en el que vive y se desenvuelve académicamente.
viii
-
Finalmente dentro de este trabajo se presentan los anexos de algunas corridas realizadas
en el software HLM (Modelos Jerárquicos Lineales) y las referencias bibliográficas que
se utilizó para el desarrollo de este trabajo de graduación.
ix
-
CAPÍTULO I INTRODUCCIÓN A LA TEORÍA DE MODELOS MULTINIVEL. Introducción.
A lo largo de la historia los problemas del mundo real han sido abordados desde
diferentes perspectivas. Muchas disciplinas han contribuido a su conceptualización, de
hecho, sus características diferenciadoras en los distintos momentos históricos se han ido
perfilando desde la filosofía hasta la política, pasando por las aportaciones de la
psicología, de la economía y de la teoría de la organización. Pero no ha sido hasta el siglo
XX cuando se ha realizado un intento sistemático en construir un cuerpo de conocimiento
sobre los problemas y sobre los fenómenos que en el se dan.
Este capítulo esta estructurado de la siguiente manera:
Antecedentes de los modelos multinivel: aquí se presentan las metodologías que
fueron fundamentales para el nacimiento de esta teoría, tales como: el modelo de
Cronbach, causal y de regresión múltiple.
El modelo de ecuación estructural: este es un modelo que permite separar las
relaciones para cada conjunto de variables dependientes. Describiendo además los
problemas que este modelo permite atacar, como: validez de las relaciones causales,
interrelaciones y medida.
1
-
La naturaleza de los modelos multinivel: se define el concepto de lo que es en si la
teoría multinivel, el cual hace referencia a un modelo de efectos mixtos, donde se
estudia una relación lineal entre dos o más variables en estudios realizados mediante
un muestro por agrupamiento, es decir, una técnica correlacional adecuada para
analizar variaciones en las características de los sujetos que son miembros de un
grupo que a su vez, hace parte de otra agrupación, o sea, mediciones que forma de
una estructura agrupada y jerárquica. Mencionando además a diversos autores que
han aplicado el análisis multinivel en áreas de la educación, salud, epidemiología, etc.
Todo con el fin de buscar la conexión entre las características del individuo y el
contexto social en que se desenvuelve.
Conjeturaciones previas al análisis multinivel: en este apartado se describe a groso
modo que la teoría multinivel es una metodología fundamentalmente estadística para
el análisis de datos que presentan una estructura jerárquica, y principalmente cuando
los datos se han obtenido a través de la técnica de muestro por conglomerado.
Enfoques multinivel basado por el análisis de regresión múltiple, ANOVA y
ANCOVA: se estudian los conceptos sobre el análisis de varianza y de covarianza,
que son fundamentales para estimar los componentes de varianza, para luego estimar
los parámetros tanto fijo y aleatorios de un modelo multinivel de dos y tres niveles.
El error de Medida: se menciona lo relacionado al error de medida, además de
describir algunas metodologías claves para tratar el error de medida en diversos
estudios de investigación.
2
-
1.1 ANTECEDENTES DE LOS MODELOS MULTINIVEL. En la actualidad los investigadores se ven obligados a recoger un gran número de
medidas para poder captar de forma adecuada la complejidad de los fenómenos del
mundo real, e indagar o buscar un modelo estadístico. De tal manera, que nos permita
tomar una connotación específica sobre su estructura, las relaciones entre sus
componentes, su funcionamiento y los cambios que experimenta el sistema en su
totalidad o en sus componentes. Los conocimientos generales por una investigación en
particular, se unen a otros conocimientos ya existentes, acumulados durante mucho
tiempo por otros investigadores, sea en la forma de aporte original o como confirmatorio
de hallazgos ya existentes. Cualquiera que sea la situación que se enfrente, la
investigación es siempre la búsqueda de la solución a algún problema de conocimiento.
La construcción de modelos estadísticos o modelos matemáticos aplicados se incluye
dentro de lo que ha venido a denominarse modelación estadística (“statistical
modelling”). Como señala Lindsey (1993), con el modelo estadístico se pretende
descubrir la variabilidad en los datos observados mediante procedimientos matemáticos.
Además, se formula en términos del o los constructos hipotéticos que no se pueden
observar o medir directamente. Ejemplo de tales contructos son: la confianza,
autoestima, discriminación, rendimiento, motivación, capacidad, etc. Sin embargo, para
definir los constructos hipotéticos se debe primero incluir la clasificación de esos
constructos como dependientes (causado, criterio, endógeno) o independiente (causal,
explicativo, exógeno). En segundo lugar, para cada constructo dependiente, la teoría
especifica cuales de los otros constructos se postula para ser dependiente. La
construcción puede también incluir una declaración sobre la muestra y/o el tamaño
relativo del efecto directo de un constructo en otra.
Las dos relaciones claves para la construcción del modelo estadístico son: la primera es
que las relaciones entre construcciones hipotéticas constituyen la pieza estructural del
modelo y la segunda es que las relaciones entre indicadores o variables observables y
constructos teóricos constituyen la pieza fundamental de la medida del modelo.
3
-
En todo caso la construcción de un modelo estadístico consistirá en una serie de procesos
encaminados a explicar el comportamiento de una variable respuesta, relacionado con
indicadores exógenos. Sin embargo, debido a que la explicación de la variable criterio en
función de las variables exógenas no es perfecta, se incluye un término residual, es decir,
el término del error que puede estar formado por los efectos de otros indicadores sobre
las variables endógenas, por errores de medición, etc. Además, la variable o nivel
independiente del tratamiento se supone que es fijado por el experimentador (valores
conocidos).
Desde el punto de vista cualitativo, al explicar el comportamiento de la variable
respuesta, se pueden tener tres posibles modelos diferentes, a saber:
a) Que la variabilidad observada en los datos sea totalmente explicada por el
modelo, lo cual daría lugar a considerarlo como un modelo absolutamente
determinístico y formal.
b) Que la variabilidad observada en los datos sea totalmente explicada por factores
aleatorios, lo cual daría lugar a un modelo aleatorio, la base del cual puede
encontrarse en la ejecución de errores de muestreo, de medida o debido a las
características inherentes del sistema observado.
c) Que la variabilidad observada en los datos necesite de la participación de factores
sistemáticos y aleatorios, lo que da lugar a los modelos probabilísticos o
estocásticos.
La modelación estadística consiste en buscar un modelo que genere los datos con un
mínimo error posible. Según Arnau, 1981; las etapas de la modelación estadística en
esencia vienen a englobar los mismos contenidos, pudiéndose resumir como las
siguientes: identificación, estimación, validación y metadiagnóstico.
4
-
Una vez entendido el modelo estadístico tradicional, lo que se pretende ahora es poder
representar de una manera precisa aquellos fenómenos en los que la recogida de datos
presenta una estructura anidada. En ese sentido el modelo multinivel tiene en cuenta
el agrupamiento de los individuos en otras unidades, es decir, donde no solo se han
seleccionado una serie de sujetos, sino también una serie de unidades contextuales a
los que éstos pertenecen, tales como: hospitales, clases, escuelas, municipios, empresas
u otras instituciones; situaciones en las que se tienen estructuras particulares de los
datos, las cuales no pueden ser considerados en un análisis de regresión clásico; en
caso que se utilice este tipo de regresión se llegaría a las siguientes consecuencias: la
producción de sesgos en los errores típicos de los estimadores y el aumento de la
probabilidad de rechazar la hipótesis nula de no asociación, cuando ésta es cierta.
A continuación se presentan ciertas metodologías que fueron fundamentales para el
inicio del estudio del análisis multinivel.
i) Modelo de Cronbach (Cronbach y Webb, 1975):
Este modelo propone obviar el problema de multicolinealidad en los datos, logrando dar
una mejor interpretación en los parámetros de dicho modelo. Es un modelo de regresión
donde las variables individuales están centradas en la media de su grupo y variables
contextuales centradas en la media global.
En términos matemáticos este modelo se resume de la siguiente forma:
( ) ( ). . . ..1 2i ij j jijy x x x x xα γ ijβ β ε= + + − + − +
Donde es la variable de i-ésimo individuo en el j-ésimo grupo, es la media del
grupo j-ésimo y
ijx . jx
..x es la media global.
5
-
ii) Análisis Causal.
La filosofía define el término causalidad como una ley en virtud de la cual se producen
efectos. El principio de causalidad establece la conexión entre causa y efecto, y es uno de
los fundamentos del conocimiento humano. Por ello la causalidad es considerada como
una ley natural de absoluta validez.
La esencia del análisis causal reside en la unificación de los comportamientos de los
componentes de un sistema para deducir el comportamiento del sistema global. Estos
comportamientos deben ser comprendidos en el contexto de sistema global, atendiendo a
las conexiones entre los componentes que constituyen el sistema. Por otra parte el
comportamiento de cada parte del sistema permite la realización de una función, y
subfunciones. Tal identificación de los subsistemas con funciones conocidas ayuda al
análisis causal.
La utilización del modelo causal tiene cierta tradición en el área de la prevención de
riesgos laborales de trabajos originales de Meliá (1998). En la construcción de este
modelo, se parte de la distinción de los modelos causales de los accidentes en dos grandes
categorías: los modelos secuenciales (que tratan la cadena de eventos que conducen al
accidente) y los modelos estructurales (que desarrollan la interacción persona-máquina).
El modelo causal (ver figura 1.1) psicosocial responde a un planteamiento integrador de
los factores organizacionales y de naturaleza psicosocial. Las variables que incluye son
las siguientes:
• Clima de seguridad: variable que el ambiente de seguridad existente en la empresa
e impulsado por la dirección de la organización.
• Riesgo basal: concepto asociado a la actividad de la empresa, reflejando los
riesgos inherentes y específicos a una determinada industria o tipo de tarea.
6
-
• Respuesta de los superiores: variable que recoge la conducta y actitud de los
supervisores en materia de seguridad, así como los mecanismos de comunicación
y de contingencia, en el contexto de la prevención.
• Respuesta de los compañeros: factor psicosocial que trata de medir la respuesta
frente a problemas de seguridad por parte de los compañeros, en base al tipo de
respuesta y su frecuencia.
• Conducta hacia la seguridad del trabajador: descrita mediante comportamientos
específicos tales como orden, cumplimiento de las normas, utilización de
maquinaria defectuosa, etc.
• Riesgo basal: variable que refleja el riesgo de una determinada tarea en su
contexto, con independencia de las acciones en materia de prevención del riesgo
que adopte el trabajador que la realice.
• Riesgo real: mide la probabilidad de ser víctima de un accidente de trabajo.
Obsérvese que esta variable recoge los efectos tanto de las conductas como de las
condiciones de trabajo (riesgo basal).
• Accidentalidad: variable criterio indicador de la existencia de un accidente.
Medida mediante el número de accidentes laborales sufridos por el trabajador en
los últimos cinco años.
Un análisis causal psicosocial de los accidentes laborales (Meliá, 1998) se aplica a una
muestra de 316 trabajadores, con contrato mercantil o fijos, representando una variedad
de sectores industriales, propiedad (públicas y privadas), características organizativas y
ámbito de actuación (local, regional, nacional y multinacional). El modelo se ajusta
correctamente, ofreciendo parámetros con el signo acorde con las hipótesis realizadas,
una mayoría son estadísticamente significativos (sólo dos incumplen esta premisa).
7
-
Como conclusión, el autor indica que el modelo confirma que la variable clima de
seguridad (impulsada por la gestión) influye sobre la conducta hacia la seguridad, directa
e indirectamente a través de la respuesta de superiores y compañeros. De igual forma, el
modelo muestra relaciones directas consistentes de la conducta y el riesgo basal sobre el
riesgo real que, a su vez, influye sobre la accidentalidad.
Figura 1.1: Modelo causal psicosocial de los accidentes laborales.
Pascual (1993), dio otro gran aporte al análisis causal, al desarrollar en el área de la
educación, el liderazgo transformacional de Bass (1985), sosteniendo así tres premisas
claves de por qué el liderazgo es un indicador fundamental en la mejora de la eficacia de
los centros educativos, distinguiendo teóricamente dos grandes estilos de liderazgo, lo
que se denomina liderazgo transformacional y liderazgo transaccional, así mismo habla
de un tercer comportamiento directivo al que da el nombre de no liderazgo. Así, define el
liderazgo transformacional como aquel formado por carisma, consideración individual,
estimulación intelectual, inspiración y en el caso de la organización escolar agrega un
factor denominado tolerancia psicológica.
Según el modelo causal de liderazgo planteado por Pascual, a groso modo se clasifican
tres niveles. Por un lado variables relativas al nivel de colaboradores (ejemplo: la
satisfacción de los colaboradores con el líder, la disposición de realizar un mayor
esfuerzo por incrementar la calidad de trabajo, etc.). En el segundo nivel, variables
8
-
relativas a los efectos directos en la organización como puede ser la eficacia organizativa
del centro, la capacidad de cambio en el centro, etc. Por último los efectos que puede
tener el liderazgo en las actitudes de los alumnos. De modo que este modelo causal
considera como unidad de análisis el centro educativo, pretendiendo así, saber cuales eran
las variables relevantes a nivel de organización que aglutinan una serie de otras variables
más específicas y que pudieran ser efectos directos relacionados con el ejercicio de un
liderazgo transformacional.
Teniendo presente, por un lado el enfoque teórico de Bass, y por otro aquellas variables
más relevantes que se asocian con el liderazgo en los centros educativos como variables
mediadoras la participaron y la satisfacción con el trabajo docente en el centro, variables
de control a nivel de centros (tamaño del centro, tipo del centro). Lo que se trata es
establecer un modelo causal que sea una explicación plausible de los efectos del
liderazgo sobre la eficacia escolar.
A continuación se presenta la especificación inicial del modelo relacional de liderazgo y eficacia escolar que pretendemos validar.
Tabla 1.1: Constructos y dimensiones del modelo de liderazgo transformacional de Bass.
Carisma personalizante
Consideración Individual
Estimulación Intelectual Inspiración
Tolerancia Psicológica
Entusiasmo Trato personal Animación al cambio Implicación Humor
Credibilidad Apoyo Potenciación de un mayor esfuerzo Identidad
El principio de validez del modelo causal es a través del sistema de ecuaciones
estructurales. Donde las variables que conforman un constructo complejo, como es el
liderazgo, y que en nuestra propuesta se estructura como una variable independiente, se
denomina variable latente exógena. Mientras que aquellas variables que aparezcan
asociadas, tanto directa como indirectamente a los efectos de un liderazgo
transformacional, y cuyas varianzas intentamos explicar, recibe el nombre de variables
latentes endógenas.
9
-
Sin embargo, los estudios realizados mediante un análisis causal no son sencillos, el rigor
científico requiere, entre otros, la realización de “experimentos”. Estos experimentos
precisan la formación de dos o varios grupos (de tratamiento y de control) por asignación
aleatoria.
Por tanto, para la realización de un modelo causal donde los diseños sean
cuasiexperimentales y no experimentales 1, se necesita el uso de modelos causales no-
experimentales (modelos de estructuras de covarianzas o de ecuaciones estructurales) ya
que en su planteamiento tradicional, adolecen de ciertos problemas a la hora de asegurar
la validez de la relación causal, interrelación integra efectos interrelacionados y tratar con
los problemas de medida. Esto se tratará a profundidad en el siguiente apartado de este
capítulo.
Murillo (1990) hace sus consideraciones sobre la utilización del analisis causal,
destacando dos graves inconvenientes, uno de carácter práctico, que tiene gran dificultad
para que se ajusten los datos a un modelo, y otro de carácter Técnico, que no tiene en
cuenta la situación jerárquica de los datos. De hecho, es una alternativa muy poco
utilizada en la investigación sobre organizaciones y más en el campo psicológico.
iii) Modelo de regresión múltiple.
La regresión múltiple es el método de análisis apropiado cuando el problema del
investigador incluye una única variable métrica dependiente que se supone está
relacionada con una o más variables métricas independientes. El objetivo del análisis de
la regresión múltiple es predecir los cambios en la variable dependiente en respuesta a
cambios en varias de las variables independientes. Este objetivo se consigue muy a
menudo a través de la regla estadística de los mínimos cuadrados.
1 Meliá JL. Un modelo causal psicosocial de los accidentes laborales. Anuario de Psicología 1998; 29(3): 25-43.
10
-
Aunque el uso de esta técnica ha sido común desde los inicios de la investigación sobre
eficacia, con el tiempo ha experimentado algunos cambios en su aplicación. Como es, el
utilizar estas técnicas a partir de distintos predictores, introduciendo la aplicación al
cálculo de los residuales de regresión, tomando como base características individuales de
los sujetos o medias ponderadas de las escuelas.
Por ejemplo, en estudios del área de la educación, el uso de las puntuaciones residuales se
realiza como medida de la eficacia de la escuela a través de la diferencia entre las
puntuaciones predicha a partir de las características individuales del sujeto (nivel
socioeconómico, nivel cultural de los padres, rendimiento previo, etc.) y la puntuación
obtenida realmente por el mismo. Tiene la ventaja de que evita los sesgos que se
producen en la estimación de los efectos de los tratamientos cuado los grupos no son
equivalentes, aunque es evidente que no se realiza un ajuste total para todas las
diferencias entre las escuelas. Para Castejon (1994), la técnica de residuales más
adecuado para la identificación de escuelas eficaces, estableciendo cuatro formas de
llevar a cabo los análisis de datos y de regresión (modelo dentro de la escuela); por otra,
el análisis puede ser "ponderado" o "no ponderado" según el número de sujetos
pertenecientes a cada escuela. En el análisis empírico que realiza para comparar cada uno
de los cuatro índices de eficacia, cada uno de ellos a partir de: a) puntuaciones residuales
a partir de la ecuación de regresión múltiple con datos de los centros; b) puntuaciones
residuales a partir de la ecuación de regresión múltiple con datos de los centros obtenidos
a partir de la media ponderada de los sujetos; c) medias de las puntuaciones residuales
para cada alumno a partir de la ecuación de regresión; d) igual que el anterior, con la
media residual estandarizada para cada alumno a partir de la ecuación de regresión.
Examinado además la consistencia entre dichos índices, concluye poniendo de manifiesto
la existencia de centros cuyo rendimiento supera el predicho y, por tanto, muestran un
efecto significativo, aunque moderado, de la escuela, coincidiendo con los resultados
obtenidos por otros autores, y, por otra parte, el alto nivel de consistencia y concordancia
entre los índices resultantes. Sin embargo, los cuatro índices comparados tienen serios
problemas debido a la utilización del análisis de regresión, donde los datos presentan una
estructura anidad. Llegando así, a poder concluir de forma errónea.
11
-
1.2 EL MODELO DE ECUACIÓN ESTRUTURAL.
El modelo de ecuaciones estructurales se podría definir como un modelo causal no-
experimental que permite separar las relaciones para cada conjunto de variables
dependientes. En su aceptación más simple, el modelo de ecuaciones estructurales
proporciona la técnica de estimación más adecuada y eficiente para series de estimación
de ecuaciones simultáneas mediante regresiones múltiples.
El uso de este tipo de modelos causales permite atacar los problemas de interrelación, de
medida y validez de la relación causal.
Validez de las relaciones causales: el interés y la peculiaridad de las relaciones
causales radican en el elemento de “producción” o “fuerza” que la causa tiene
sobre el efecto. En el estudio de este tipo de relaciones suelen considerarse como
necesarias las tres condiciones de John Stuart Mill2.
• Covariación entre las presuntas causa y efecto.
• Precedencia temporal de la causa.
• Ausencia de explicaciones alternativas para la relación.
El cumplimiento de estas condiciones, y principalmente la tercera de las mismas, es el
que lleva a la necesidad de realizar diseños experimentales, diseños en los que se aíslan
las unidades a estudiar (ausencia de alternativas) y se realiza una prueba controlada
(precedencia) para, posteriormente, examinar el efecto (covariación).
Sin embargo existe un enfoque alternativo al análisis experimental, que consiste en
formular la teoría incluyendo todas las variables que son importantes a juicio del
investigador. La formulación así realizada determina la estructura de la matriz de
covarianzas de todas las variables, estructura que es contrastable.
2 Cook TD, Campbell DT. Quasi-experimentation. Design and Analysis Issues for Field Settings. Rand McNally College Publishing: Chicago, 1979.
12
-
De esta forma, se dispone de un instrumento que permite rechazar la teoría si los datos no
soportan las conclusiones deducidas. Dicho de otra manera, se tiene un método de
refutación en investigación no experimental.
Interrelaciones: El problema de las interrelaciones resulta de menor importancia
que los otros dos. Una vez que se ha especificado cuidadosamente la teoría, la
técnica del análisis de la covarianza permite resolver el problema.
La especificación de la teoría requiere incluir todas las variables importantes, el problema
es ¿dónde parar?. Un posible procedimiento consiste en ir incluyendo las variables que
son causa común de cada par de variables causa-efecto, siempre que al menos una de las
dos esté incluida en la hipótesis original.
Figura 1.2: Derivación de las teorías causales.
La figura 1.2 ilustra este procedimiento. La hipótesis inicial se muestra en la fig. 2.a. A
partir de dicha hipótesis, se buscan otras variables que sean causa común de cada par de
variables causa-efecto. En la ilustración aparecen dos nuevas variables (u, v), que
aparecen como causa común de las variables originales (x,y), fig. 2.b. Como ambas
13
-
variables x e y están representadas en la hipótesis original, las nuevas variables deben
explicitarse en el modelo. A continuación volvemos a examinar cada par de variables
causa-efecto; en este examen aparecen dos nuevas variables (w,z), fig. 2.c. La variable w
es causa común de las variables x,u; como x está incluida en la hipótesis original,
explicitamos w en el modelo. Sin embargo, la variable z es causa común de las variables
u,v; como ninguna de estas variables aparece en la hipótesis inicial, el procedimiento
indica que esta variable no es necesario explicitarla. Por último, fig. 2.d, todas las
variables que no son efecto de ninguna otra (w,v), variables predeterminadas o exógenas,
se unen con un arco con flechas en los dos extremos, indicando que pueden existir otros
efectos, más lejanos, no explicitados en el modelo. Evidentemente, la explicación de la
variable u será incompleta (no hemos incluido a z en el modelo), algo que resulta
secundario para validar la hipótesis inicial (Fig. 2.a).
Problemas de medición: según el modelo causal sobre la prevención de riesgos
laborales3. Los problemas de medida en este tipo de modelos tienen dos orígenes:
por un lado, la información sobre prevención de riesgos laborales puede ser
interpretada de distinta manera por diferentes sujetos y, por lo tanto, estar sujeta a
error; por otro lado, los conceptos organizacionales (tales como clima de
seguridad, motivación, comportamiento, etc.) son difíciles de evaluar con una
única variable. Una de las características de la metodología que se propone es que
permite tratar fácilmente ambos problemas.
Para terminar de entender mejor la metodología, los modelos de ecuaciones estructurales
utilizan una representación simbólica: los diagramas de trayectoria (path diagrams),
gráficos en los que causa y efecto se unen mediante flechas dirigidas, a continuación
presentamos como ejemplo un digrama path extraido de un estudio de factores asociados
al rendimiento de los estudiantes que se sometieron a la PAES 20004.
3 Dalrymple H, Redinger C y otros. Occupational Health and Safety Management Systems: Review and Analysis of International, National, and Regional Systems and Proposals for a New International Document. Informe preparado por The International Occupational Hygiene Association para la OIT: Ginebra, 1998. 4 Carlos Roberto Briones et al., Factores asociados al rendimiento de los estudiantes que se sometieron a la PAES 2000. Pág. 84-85. Ministerio de Educación, Dirección Nacional de Monitoreo y Evaluación. El Salvador.
14
-
En el diagrama de la figura 1.3, se consideran tres aspectos importantes que tienen
relación con los factores demográficos: “edad”, en términos de si se está o no en el tramo
“normal” para el momento de someterse a la prueba, o bien si hay atraso en el
bachillerato o adelanto; “relación de masculinidad”, que da la proporción hombre/mujer
en el conjunto de alumnos”, qué alumnos trabajan y estudian o solamente estudian. En
dicho diagrama se observa que la edad aparece como el factor demográfico más
importante (beta=-0.252): a mayor edad, menor resultado en la prueba, e indica la
importancia de que no se produzcan retrasos en cursar el bachillerato y que se logre
retener al alumnado.
En su conjunto, los factores demográficos considerados permiten explicar un 8%
(smc=0.08) de las variaciones de los resultados globales de la PAES.
Figura 1.3: Diagrama Path de factores demográficos.
Edad
El modelo de ecuación estructural se caracteriza por dos componentes básicos: el modelo
estructural y el modelo de medida. El modelo de medida permite al investigador usar
varias variables (indicadores), para una única variable dependiente o independiente. Por
ejemplo, la variable dependiente puede ser un concepto representado por una escala
aditiva, tal como el amor propio.
En el modelo de medida el investigador puede evaluar la contribución de cada ítem de la
escala así como incorporar como la escala mide el concepto (fiabilidad) en la estimación
Masculinidad
Labor
Factores demográficos
Error-0.252
0.10
0.0
Smc: 0.08 -0.11
15
-
de las variables dependientes e independientes. Este procedimiento es similar al
desarrollo del análisis factorial de los ítems de la escala y utiliza las cargas factoriales en
la regresión.
En tal caso, el modelo estructural es el modelo “guía”, que relaciona variables
independientes y dependientes. En tales situaciones, la teoría, antes que la experiencia u
otras directrices, permitiera al investigador distinguir qué variables independientes
predicen cada variable dependiente. Los modelos previamente discutidos que incluyen
múltiples variables dependientes (análisis multivariante de la varianza y correlación
canónica) no son apropiados en esta situación. Dado que permiten sólo una única relación
entre variables dependientes e independientes.
1.3 LA NATURALEZA DE LOS MODELOS MULTINIVEL.
Actualmente es frecuente encontrar en los estudios más importantes del mundo científico
y, en general, en los del área de la salud y educación. El uso de los modelos multinivel
como alternativa metodológica de acercar el contexto del individuo a la explicación de la
causalidad. Las causas que se asocian a la ocurrencia de un evento en salud,
frecuentemente se estudian de manera estática en el sentido de que no se tiene en cuenta
el análisis prospectivo o retrospectivo del ambiente social o cultural que rodea al
individuo, debido a definiciones importantes, tales como ausencia de variables,
imposibilidad de relacionar el contexto o el ambiente o dificultades en la aplicación
metodológica, entre otras.
Esto ha implicado que el investigador llegue a sentirse potencialmente incapaz de
explicar metodológicamente las causas de uno o varios eventos, puesto que
frecuentemente se omiten características importantes que pertenecen a la dinámica
ecológica donde interactúa el individuo, como el ambiente del trabajo, la comunidad, la
familia y los aspectos culturales y sociales, entre otros.
16
-
Recientemente, las ciencias sociales y la epidemiología han intentado suplir la necesidad
de una explicación más global de la morbilidad o la mortalidad, buscando la conexión
entre las características del individuo y el contexto social en el que este se desenvuelve.
Resultados obtenidos mediante la técnica del análisis multinivel han sido importantes
dentro de muchos campos de la investigación, por ejemplo Bryk AS (1992) dando un
aporte a la teoría multinivel, relacionando en un primer momento una variable respuesta
cuantitativa con las características individuales del estudiante y variables asociadas al
ambiente escolar mediante un conjunto de variables exploratorias de uno y otro nivel de
jerarquía. Este modelo lo definió como modelo lineal de coeficientes aleatorios.
Sandoval JJ. (2001), a dado otro aporte a epidemiología, al desarrollar un modelo
multinivel con el objeto de estudiar la sociedad y las diferentes formas de organización
social que afectan la salud de los colectivos humanos y su bienestar. En particular,
estudia la frecuencia, la distribución de los estados de salud en las poblaciones y su
relación con los determinantes sociales, de tal manera que va más allá del análisis de los
factores de riesgo individuales e incluye también estudios en el contexto social de los
individuos en el cual se produce el fenómeno salud-enfermedad. Como lo señala Dodge
KA (2002), algunos estudios epidemiológicos han mostrado principios metodológicos de
cómo estudiar las relaciones que los grupos poblacionales, el ambiente, las comunidades
y la sociedad en general tienen con la agresividad en niños. Es por ello que el estudio
realizado por Sandoval (2001) sobre el comportamiento agresivo y pro-social en niños,
en concordancia con las características individuales y los factores sociales relacionados
con las escuelas. Se estimaron las relaciones de las variables ajustado por los síntomas de
hiperactividad con déficit de atención y la edad del niño. La variable endógena está
conformada por los síntomas de agresividad indirecta, variable cuantitativa con nivel de
medición de intervalo, constituida mediante las puntuaciones factoriales de los resultados
del dominio “síntomas de agresividad indirecta”. El modelo relacionó la variable
respuesta cuantitativa con las características individuales del estudiante y las asociadas al
ambiente escolar mediante un conjunto de variables explorativas de uno y otro nivel de
17
-
jerarquía. El modelo describió las variables exploratorias en cada nivel, controlando por
los posibles efectos de confusión.
Otros autores como Maas, Cora J.M., and Snijders, Tom A.B., (2003) han dado un mayor
acercamiento al análisis multinievel, especialmente al caso de medidas repetidas para
datos completos e incompletos, donde, comúnmente son analizados a menudo por el
análisis de variación multivariante (MANOVA). Dando así una mayor estimación
mediante el modelo lineal jerárquico (HLM) mediante el uso de los modelos de efectos
aleatorios.
El análisis de datos mediante estos modelos es capaz de apresar dicha estructura, como
menciona Goldstein (1995) cada uno de los niveles de la estructura jerárquica es
representado formalmente con su propio submodelo. Cada submodelo expresa las
relaciones entre variables dentro de un determinado nivel y el conjunto de submodelos
especifica de qué modo variables de un nivel influyen en las relaciones que ocurren a otro
nivel distinto, quedando de este modo formalizada esta estructura anidada de los datos.
Definición de los modelos multinivel.
Los modelos multinivel son básicamente un modelo de regresión de efectos mixtos, en
donde se estudia una relación lineal entre dos o más variables en estudios realizados
mediante un muestro por agrupamiento, es decir, una técnica correlacional adecuada para
analizar variaciones en las características de los sujetos que son miembros de un grupo
que a su vez, hace parte de otra agrupación, o sea, mediciones que forman una estructura
agrupada y jerárquica. El modelo permite la descomposición de la variación de una
variable criterio (como por ejemplo, rendimiento) en sus componentes “dentro del grupo”
(dentro-escuela, dentro-departamentos) y “entre grupo” (entre-escuela, entre-
departamento) y el análisis de la asociación entre variables en esos niveles de agregación.
18
-
Los modelos multinivel permiten además estimar un conjunto separado de
establecimientos de efectos de coeficientes para cada unidad organizacional, y luego
modelar las variaciones en el conjunto de coeficientes de las organizaciones como
productos multivariados a ser explicados por factores organizacionales (recursos de los
centros educativos). Por ejemplo, a partir del nivel de los estudiantes se estiman puntajes
promedios de logro de los centros, los que en un segundo nivel se correlacionan con
diferentes características de éstos, es decir, los modelos multinivel ofrecen distintas
alternativas que se traducen en ventajas respecto de los modelos tradicionales en una
población cuya naturaleza sea anidada dentro de contexto, dando una versión más realista
ya que modelan cada nivel de jerarquía y no requieren de la independencia entre los
grupos.
El análisis multinivel se ha extendido y generalizado el análisis de varianza introducido
por Fisher (1880-1962), surgiendo en contextos de aplicaciones diversas, ejemplo en
educación un investigador educativo puede, ir a un grupo de escuelas y recoger datos
sobre el nivel socioeconómico de los alumnos y su rendimiento académico, a fin de
contrastar si existe una relación funcional entre ambas variables. Tendríamos así dos
tipos de unidades experimentales: el sujeto y la escuela, correspondiente a lo que la
literatura se denomina también como primer y segundo nivel de análisis. En el caso del
sujeto, la variable de interés es el rendimiento académico. En el caso de las escuelas, las
variables de interés son sus respectivas medias y pendientes de asociación entre el nivel
socioeconómico y rendimiento, expresados mediante los estimadores de sus rectas de
regresión.
Básicamente, como señala Burnstein et, al. (1981), el principal interés consistirá en
modelizar los resultados intra-organización como funciones sistemáticas tanto de
características individuales, como de variaciones entre contexto o entre grupos. Es decir,
constatará si existe variabilidad en las rectas de regresión entre las distintas escuelas. De
esa manera, y mediante una consideración integrada de ambos niveles de análisis, se
pretende cuantificar y contrastar hipótesis estadísticas acerca de la incidencia de los
19
-
distintos contextos académicos en el rendimiento escolar y en su relación con el nivel
socioeconómico del alumno.
En la investigación multinivel como ya hemos mencionado se ocupa del análisis de datos
donde las observaciones se jerarquizan dentro de grupos. Entonces, las variables se
pueden definir en cualquier unidad de análisis de la jerarquía. Algunas de estas variables
se pueden medir directamente en su nivel natural; por ejemplo, en los resultados
académicos de un estudiante se identifican minimamente dos niveles: nivel 1,
características del estudiante; nivel 2, características de la institución educativa.
Hay dos acercamientos a menudo criticados para analizar las características de los
diversos niveles en un solo nivel. En el primer acercamiento es que todas las
características de un nivel superior se desagregan a un nivel más bajo. Es decir,
asignando a todos los individuos una variable que refleje la denominación de su grupo a
que ellos pertenecen. En este acercamiento, todas las variables desagregadas se asumen
ser independientes. El segundo acercamiento, los datos en el nivel individual se agregan
al nivel más alto. La idea implícita en casi todos los usos del término “datos agregados”
es que la variable agregada es simplemente un índice agregado de propiedades de
unidades de nivel inferior, y no una medida directa de una propiedad del nivel superior.
Pero no siempre es cierto ya que son un tipo de variables grupales que se construye
“agregando” matemáticamente las características de los individuos del grupo. Se han
empleados los términos “variables analíticas” y “variables agregadas” como sinómino de
“variables derivadas”. También se ha recurrido al término “variables contextuales” como
sinómino de “variables derivadas”.
El análisis multinivel puede representarse metafóricamente por la “teoría de la rana en el
charco”, que se refiere a la idea que una rana pequeña de individuos puede estar en un
charco grande o una rana en un charco pequeño. Aplicado al ejemplo del estudiante
indica que un alumno moderadamente inteligente en un contexto sumamente inteligente
puede llegar a desmotivarse y así llegar a no tener éxito. Mientras el mismo alumno en un
contexto considerado menos inteligente puede llegar a tener éxito. Así, el efecto de una
20
-
inteligencia individual de alumnos depende por término medio de la inteligencia de otro
alumno.
Ahora bien, antes de presentar las definiciones teóricas de los modelos multinivel, se
comenta el tipo de variables que se consideran en los modelos multinivel.
Variables Globales y absolutas: son las que se refieren únicamente al nivel en que
están definidas, sin referencia a ninguna otra unidad o nivel de análisis. Por
ejemplo, la inteligencia podría ser una variable global (se mide a nivel individual).
Variables Relacionales: son las que conforman un nivel simple y describen las
relaciones de una unidad a otra siempre dentro del mismo nivel. Por ejemplo, los
índices de popularidad de un profesor se consideran variables relacionales en el
nivel individual.
Variables Analíticas y estructurales: estas se refieren a variables de niveles
inferiores que se agregan en unidades mayores. Las variables analíticas se refieren a
la agregación de una variable global en un nivel más bajo. Por ejemplo, las
características sociales de los individuos son variables analíticas cuando se agregan
para toda una comunidad.
Variables contextuales: estas definen a las superunidades; todas las unidades en
los niveles más bajos reciben el mismo valor en la variable que se mide en la
superunidad a la cual pertenecen. Por ejemplo, el área geográfica, comunidad, etc.
De las variables descritas anteriormente, se presenta el siguiente esquema, adaptado de
Swanborn (1981).
21
-
Tabla 2: Esquema adaptado a Swanborn (1981).
Nivel 1 2 3 …
Global Analítica
Relacionales Estructurales
Contextual Global Analítica
Relacionales Estructurales
Contextual Global …
Relacionales …
Tipo de variable
Contextual …
Idealmente, una teoría de multinivel debe especificar cuales variables pertenecen a cada
nivel, es decir, investigar de qué manera las variables grupales (macrovariables), las
individuales (microvariables) y sus interacciones se relacionan con los resultados a nivel
individual. Los efectos entre el individuo y el nivel del contexto requieren la
especificación de algún proceso dentro de los individuos que causa que esos individuos
sean influidos diferencialmente por ciertos aspectos de su contexto.
Tratando el ejemplo que venimos explorando, observamos que se han definido dos
niveles de agregación, el estudiante y la escuela. Y según el esquema dado anteriormente,
podríamos agregar variables derivadas de un nivel superior a un nivel más bajo, tal es el
caso como las características socioeconómicas del estudiante y familia, capital cultural y
social de las familias, áreas urbanas o rurales, el grado de involucramiento de las familias
de los alumnos en actividades escolares, y el apoyo de niveles superiores del sistema
educativo.
Con el fin de profundizar en el concepto de agregado y desagregado, tomaremos siempre
el ejemplo del estudiante. Lo que se pretende es medir la variable endógena (rendimiento
del estudiante), en primera instancia agregamos la variable contextual nivel
socioeconómico del estudiante. Esto lo hacemos para que conozcamos cual será el
impacto real de los diferentes factores sobre el rendimiento de los estudiantes, lo cual
eliminaremos el efecto que el nivel socioeconómico del estudiante y su familia tienen
sobre los resultados académicos. Ahora bien si desagregamos la variable nivel
22
-
socioeconómico de la escuela, entonces este modelo busca estimar el rendimiento
promedio de los estudiantes en las diferentes pruebas eliminado el efecto que sobre los
puntajes tiene el nivel socioeconómico medio de los alumnos del centro. En otras
palabras, trata de depurar la media general del rendimiento, aislando el efecto que sobre
ella tiene el nivel socioeconómico de cada establecimiento, expresado en términos del
promedio del nivel socioeconómico de sus estudiantes.
Tipos de modelos multinivel.
En los ejemplos citados anteriormente y mediante el esquema de variables adaptado a
Swanborn (1981), un modelo multinivel de dos niveles de jerarquía, pueden ser
expandido a más niveles de jerarquía. Algunos investigadores pueden estar interesados en
describir los cambios de las respuestas de una enfermedad con respecto al tiempo y,
desde esta perspectiva, el análisis multinivel puede ser utilizado para mostrar el efecto
temporal que se tiene sobre los grupos de estudio. Por ejemplo, en un estudio longitudinal
en el nivel 1 se consideraría los individuos. Así, el nivel 2 representaría las mediciones
repetidas en diferentes lugares, y el nivel 3 podrían ser los lugares. Algunos ejemplos de
estructura de encuestas transversales repetidas, se presentan en los estudios
multicéntricos5.
Otro tipo es el de estructura de mediciones repetidas se podría considerar en un nivel 1 la
medición de la ocasión, el nivel 2, el individuo y nivel 3, los lugares del país. Así, el nivel
1 representa la medición repetida del evento en mismo individuo. Tales estructuras
permiten explorar el cambio individual dentro de un grupo.
Los modelos multinivel pueden utilizarse también para representar diferentes variables
respuestas relacionadas de un mismo individuo. En la necesidad de examinar diversas
variables simultáneamente para evaluar, por ejemplo, la salud física de un individuo, las
diferentes mediciones del cuerpo formarían un conjunto de respuestas en el nivel 1, las
cuales estarían anidadas entre individuos (nivel 2), que a su vez estarían anidados en
5 Benavides FG, Benach J, Diez-Roux AV, Roman C. How do types of employement relate to health indicators? Findings from the second European survey on working conditions. J Epidemiol Community Health 2000.
23
-
diferentes instituciones de salud. Este tipo se conoce como estructura de clasificación
cruzada. Estudios con este enfoque pueden ser ecológicos o espaciales6.
1.4 CONJETURACIONES PREVIAS AL ANÁLISIS MULTINIVEL.
En diversas áreas de investigación se han observado la existencia de estructuras
jerárquicas en los datos, producto de la agrupación de unidades dentro de otras unidades
en diferentes niveles que conforma una jerarquía. Por ejemplo, una muestra de una
población se puede describir como una muestra llamado pasos múltiples: primero
tomamos una muestra de unidades del nivel más alto (por ejemplo, las escuelas), y luego
probamos las sub-unidades de las unidades disponibles (por ejemplo, buscar
características de los estudiantes y de las escuelas). En tales muestras, las observaciones
individuales generalmente no son completamente independientes. Esto es, porque los
estudiantes en la misma escuela tienden a ser semejantes unos de otros, a causa de
procesos de selección (por ejemplo, algunos profesores pueden darle mérito a algunos
estudiantes considerados talentosos, mientras que otros seria lo contrario) y a causa del
historial común que ellos han compartido en la misma escuela. Como resultado de eso, la
correlación mediana (expresado en el llamado intra-correlación de clase) entre variables
medidas en estudiantes de la misma escuela, será más alto que la correlación mediana
entre variables medidos en estudiantes de escuelas diferentes. Las diversas pruebas
estadísticas uniformes se inclinan pesadamente en la suposición de independencia de las
observaciones. Pero si esta suposición se viola, las estimaciones de los errores uniformes
de pruebas estadísticas convencionales serán demasiado pequeñas, y dará resultados
falsamente significativos. A todo esto se le considera un efecto de diseño, y el
procedimiento para la corrección será calcular los errores uniformes por métodos
ordinarios de análisis, es decir, estimar la intra-correlación de clase entre los encuestados
dentro de grupos. Algunos de estos procedimientos de corrección son bastantes poderosos
(Skinner, Holt & Herrero, 1989). De hecho, estos procedimientos de corrección se
podrían aplicar en el análisis multinivel. Sin embargo, en la mayoría de los problemas
multinivel es que no solo tenemos anidados los individuos dentro de grupos, sino que
6 Bramm AW, Van den EP, Prince MJ, Beekman AT, Kivela SL, Lawlor BA et, al. Religión as a crosscultural determinant of depresión in elderly Europeans: results from the EURODEP collaboration. Psychol Med 2001.
24
-
también tenemos variables medidas en todos los niveles disponibles. Las variables que
combinan los niveles diferentes en un modelo estadístico son un problema diferente que
estimar y corregir el diseño. Es por ello que los modelos multinivel se diseñan para
analizar las variables de niveles diferentes simultáneamente, usando un modelo
estadístico que incluya varias dependencias.
Supongamos por ejemplo, si se quiere estudiar a escala nacional la calidad de vida de los
ancianos que viven en una residencia de forma permanente. En este caso se puede
establecer una estructura jerárquica de 2 niveles, donde los ancianos se sitúan en el nivel
1 y las residencias en el nivel 2. Podemos suponer que dentro de cada residencia los
ancianos tienen a ser más similares en sus comportamientos y características, o más aun,
las residencias presentan características propias, lo que puede afectar a la calidad de vida
de los ancianos. Si la calidad de vida se considera una variable de respuesta de tipo
continua, a la que se le ajusta un modelo de regresión, considerando una característica
(exógeno) de los ancianos, podríamos encontrar como resultado una de estas tres
situaciones7, tal como se observa en la figura 4:
a) Las rectas de regresión para cada residencia son iguales, lo que llevaría a
considerar un único nivel en el análisis de los datos.
b) Las rectas de regresión difieren solo en el intercepto.
c) difieren tanto en el intercepto como en la pendiente, lo que nos lleva a pensar en
construir un modelo que considere los distintos niveles en la jerarquía de los
datos.
7 Catalán- Reyes MJ., et al. Utilización de los modelos multinivel en investigación sanitaria.
25
-
Figura 4: Ejemplo hipotético de un ajuste de regresión para la calidad de vida de los ancianos en cuatro
residencias.
Para hacer frente a esta problemática, el análisis multinivel es una metodología
fundamental para el análisis de datos que presentan una estructura jerárquica, y
principalmente cuando los datos se han obtenido a través de la técnica de muestro por
conglomerado, es decir, ocurre cuando en una investigación existen además de los
sujetos, otras unidades de análisis tales como escuelas, municipios, empresas, hospitales,
etc. La existencia de estas agrupaciones naturales queda reflejada en la estructura de los
datos, hace que se incumpla el supuesto del muestreo aleatorio simple y que muchas
técnicas estadísticas convencionales, tales como el análisis de varianza (ANOVA) efectos
fijos o la regresión clásica sea inapropiada.
1.5 ENFOQUES MULTINIVEL BASADO POR EL ANÁLISIS DE REGRESIÓN MULTIPLE, ANOVA Y ANCOVA.
Históricamente, los problemas de multinivel han guiado a enfoques de análisis que
basándose por un análisis de regresión múltiple, el análisis de variación, o de algún otro
método uniforme de análisis. Una situación análoga en un contexto de análisis de
regresión diferencia el análisis de covarianza clásico del modelo multinivel. Recordemos
que el análisis de covarianza es una combinación de análisis de varianza y de regresión
clásico. Se haría un análisis de regresión ordinario, por ejemplo, entre el número de horas
de preparación para un examen y rendimiento académico a fin de estudiar la eficacia de
los hábitos de estudio en una población de alumnos. En el análisis de covarianza clásico
se incluiría el estudio de esta relación en un diseño de dos o más grupos, como por
ejemplo, dos tipos de entrenamiento en hábitos de estudio con respecto a un grupo de
26
-
control. Los sujetos en este caso podrían ser asignados aleatoriamente a uno de los grupos
y se podrían contrastar hipótesis tanto sobre las diferencias entre los métodos de estudio,
como sobre la eficacia del tiempo invertido.
Los efectos de interés en este caso son fijos, puesto que se han elegido premeditadamente
dos programas de entrenamiento de estudios específicos frente a un grupo de control.
Tendríamos análisis de covarianza de efectos mixtos o modelo multinivel si en lugar de
estos programas concretos, el objetivo fuera, por ejemplo, el contrastar la eficacia de las
horas de estudio en una selección de escuelas al azar. En este caso habría dos tipos de
unidades experimentales, la escuela y el alumno, y las medidas de los alumnos dentro de
cada escuela estarían correlacionadas, por lo que el modelo de efectos fijos no sería
apropiado.
En el análisis multinivel, todo el conjunto de problemas es conceptual, es decir, si el
analista no es muy cuidadoso en la interpretación de los resultados, puede cometer la
falacia del nivel injustificadamente, que se compone de analizar los datos en un nivel, y
las conclusiones que dibujan en otro nivel. Una de las falacias mejor conocidas es la
falacia ecológica, que interpreta los datos agregados en el nivel individual, es decir,
inferir conclusiones a escala individual a partir de datos grupales. La otra falacia que
podría surgir es el hacer inferencias en un nivel más alto a partir de un análisis
realizado en un nivel más bajo, se conoce también la falacia atomística, es decir, hacer
inferencias sobre la variabilidad intergrupal (o relación entre variables grupales) a
partir de datos individuales. A este concepto a veces se ha denominado falacia
individualista.
Una manera más general de ver los datos multinivel es investigar las relaciones entre las
variables que se miden en varios niveles jerárquicos diferentes. Por ejemplo, una
pregunta común es cómo varias variables individuales y de grupo influyen una sola
variable individual del resultado. Típicamente, parte de las variables individuales. En el
pasado, tales datos se analizaban cuando generalmente un análisis de regresión múltiple
convencional con una variable dependiente en el nivel más bajo (individuo) y una
27
-
colección de forma explicativa de variables en todos los niveles disponibles. (Boyd y
Iversen, 1979; Roberts y Burtein, 1980). Desde que este enfoque analiza todos los datos
disponibles en un solo nivel, se sufre el problema conceptual y estadístico como el que
producir sesgos en la estimación del error típico de medida y un aumento en la
probabilidad de cometer el error de rechazar la hipótesis de asociación lineal cuando esta
es cierta.
El análisis multinivel modela explícitamente estas relaciones jerárquicas, eliminando
estos sesgos, proporcionando además estimaciones de interés psicológico sobre la
variabilidad y replicabilidad de los coeficientes de regresión en los distintos contextos
sociales (Robinson, 1950), y sobre la influencia de estos en el comportamiento del
individuo.
En los últimos 50 años se han desarrollado diferentes métodos de estimación tal es el
caso el de componente de varianza, aplicable a datos desequilibrados bajo modelos
mixtos. Es decir, la existencia de correlación entre observaciones hace que el modelo
de regresión por mínimos cuadrados ordinarios produzca sesgos en la estimación del
error cuadrático medio, y por tanto producirá errores de inferencia. El grado de sesgo
depende de la magnitud de la correlación entre los grupos tanto de la variable
endógena como la exógena, así como del número de unidades experimentales.
En diversos estudios como en psicología, es frecuente que un contexto de regresión
implicaría que no solamente el número de unidades de nivel inferior sea el mismo para
cada unidad experimental del nivel superior, sino que también la distribución de los
valores de las variables exógenas sea también la misma para todos los grupos del nivel
superior. Tal como ocurre en el análisis de experimentos en estos casos, es aconsejable
recurrir al procedimiento de Máxima Verosimilitud que es un método clásico de
estimación de parámetros (no necesariamente varianza) asociada a funciones de densidad
o probabilidades de variables aleatorias, con la restricción de que los parámetros han de
estar en el espacio paramétrico. Produciendo estimadores con propiedades deseables con
28
-
muestras grandes, tales como consistencia y eficacia, es decir, si se recoge gran cantidad
de datos, el estimador será aproximadamente insesgado y con varianza mínima.
1.6 EL ERROR DE MEDIDA.
En muchas áreas de la investigación, los estudios pueden implicar variables que no se
pueden observar directamente. Por ejemplo, la capacidad matemática de una persona no
se puede medir directamente, solamente el funcionamiento en una serie de preguntas en
una prueba de matemática. También, los datos recogidos de encuestadores contienen
error de respuesta (es decir, hay variación de la respuesta en respuestas a la misma
pregunta cuando está administrado en varias ocasiones a la misma persona). El error de
medida puede ocurrir en variables explicativas, dependientes o independientes. La
confiabilidad de variables explicativas es una pregunta metodológica importante. Cuando
se sabe la confiabilidad, las correcciones se pueden hacer (Fuller, 1987), si las medidas
repetidas están disponibles, la confiabilidad se puede incorporar en el modelo y estimar
directamente. El uso de variables explicativas no fiables conduce a la valoración en
polarización negativa de los coeficientes de la regresión y la inferencia estadística que
resulta puede ser muy engañosa a menos que se hagan los ajustes cuidadosos.
Por otro lado, ya en el contexto de modelos de ecuaciones simultaneas o modelos de
ecuaciones estructurales con variables observables, en ocasiones denominados path
análisis, en Gillespie y Fox (1980) se señalan los posibles efectos en modelos recursivos,
modelos en que la causalidad fluye en un único sentido, indicando que se produciría
atenuación en los coeficientes gamma, aquellos que van de variables exógensas a
endógenas, y sin embargo sesgo positivo en los coeficientes beta (aquellos que van de
una variables endógenas a otras). Este último efecto podría llevar a una atenuación de las
varianzas entre errores. Resultados para un modelo no recursivo (Fergusson y Horwood,
1986) mostraron que al aumentar el error de medida aleatorio, aumentaba el valor de los
coeficientes gamma, mientras los coeficientes beta disminuían. Thompson y Getty (1994)
ofrecen otro ejemplo de efectos de la fiabilidad de las medidas en un modelo no
recursivo, modelo en que se plantea doble sentido en la causalidad donde una variable
29
-
antecedente puede también ser consecuente. Es por ello que una forma alternativa de
tratar el error de medida aleatoria es mediante modelos de ecuaciones estructurales con
variables latentes. Estos permiten efectos, predicciones entre factores, en lugar de solo
plantear relaciones entre variables observables. El concepto y la teoría estadística que
permite las ecuaciones de regresión simultáneas entre factores fueron introducidos por
Jöreskog (1970; 1973), y se basan en una idea simple, incorporar en un mismo modelo el
análisis factorial confirmatorio y el modelo de ecuaciones estructurales con variables
observables.
Aunque el asunto del modelo de error de medida ha recibido hoy en día la verdadera
atención considerable en la literatura multinivel, ésta atención se ha centrado en los
modelos lineales de error de medida, más específicamente, el modelo aditivo clásico del
error de medida (Carroll et al., 1995; Fuller, 1987; Goldstein, 1987; Longford, 1993).
Este modelo se basa en la asunción de la homocedasticidad, que exige la variación igual
de los errores de medida condicionales en diversos niveles de la variable endógena. Es
decir, en la terminología usado cuando se discuten las medidas específicas por estrato son
“homogéneas” cuando son iguales y “heterogéneas” cuando son significativamente
diferentes. Obviamente, una medida resumen es mejor en una situación en que la medida
que esta siendo resumida es homogénea en los estratos. En caso habitual, para una
medida de razón efecto, la homogeneidad entre los estratos es equivalente a tasas o
razones que se adaptan a un modelo multiplicativo de efectos conjuntos (absolutos), la
homogeneidad es equivalente a un modelo aditivo de efectos conjuntos. Modificación de
la medida del efecto significa heterogeneidad para esa medida. Por ejemplo en la
investigación educativa, el gasto del pre-test de los estudiantes, el estado socioeconómico
o la inteligencia se utilizan a menudo como variables explicativas en los resultados del
examen de los estudiantes. Además, los resultados del examen de los estudiantes o las
capacidades se miden conforme a error o no se pueden observar directamente. Los errores
de medida asociados a las variables explicativas o a las variables que no pueden ser
observadas directamente no se toma en consideración.
30
-
La atención esta también en un modelo no lineal de error de medida y de un modelo
estructural no lineal, esto es debido a que los modelos multinivel fueron desarrollados
originalmente para variables con distribución normal y bajo los supuestos de una
distribución normal de los errores en cada individuo, estos métodos han sido
generalizados para situaciones en los que las variables de respuesta es binomial, nominal
u ordinal y para procesos donde la probabilidad del evento es pequeña y se puede
modelar con una distribución de Poisson. Se llama función vínculo de nivel 1 (link
funtion) a la transformación de la variable dependiente de nivel 1 que se iguala a una
combinación lineal de los coeficientes de las variables explicativas. Esta función puede
ser una función logística binomial, ordinal, multinomial o una transformación de Poisson.
31
-
CAPÍTULO 2
TEORÍA DE LOS MODELOS MULTINIVEL Introducción. En este capítulo se presenta el fundamento teórico de modelos multinivel, el cual esta
estructurado en los siguientes apartados:
El modelo de dos niveles y su notación, en primer lugar se aborda este contenido a
partir de un ejemplo desarrollado por Golstein en 1999, donde se hacen algunas
conjeturaciones sobre el modelo de regresión clásica. Se define el modelo parcial con
situación multigrupo, estableciendo así los supuestos para un modelo de regresión
simple.
El modelo de dos niveles, se define el modelo lineal mixto y se estudian los supuestos
básicos.
Estimación de los parámetros para el modelo de componentes de varianza, aquí se
estiman los parámetros del modelo multinivel de dos niveles pero considerando el
modelo donde no se incluye ninguna variable aleatoria al modelo (el enfoque
ANOVA).
El modelo de 2 niveles incluyendo coeficientes aleatorios, en este apartado se realiza
la estimación de los parámetros del modelo multinivel de dos niveles, considerando
una variable aleatoria al modelo (el enfoque ANCOVA).
32
-
Estructura general y estimación para un modelo multinivel de dos niveles, aquí se
estiman los parámetros del modelo multinivel general de dos niveles. Se parte con la
incorporación de dos variables aleatorias al modelo lineal mixto, para poder así
generalizarlo a tantas variables aleatorias que se deseen incorporar al modelo
multinivel de dos niveles.
Estimación de los parámetros del Modelo general de tres niveles. De igual manera
como se desarrolló la estimación de los parámetros tanto fijo como aleatorios de un
modelo multinivel general de dos niveles, se hace para un modelo multinivel general
de tres niveles.
33
-
2.1 El modelo de 2 niveles y notación básica
Para entrar en materia, se presenta un ejemplo del estudio realizado por Goldstein
(1999) a partir de los resultados obtenidos por alumnos en escuelas primarias (Junior
School Proyect) en Londres, realizado por Mortimore et al (1988). Goldstein, utilizó una
submuestra aleatoria de la data de Mortimore, considerando 728 alumnos en 50 escuelas
y como unidad de medida a los alumnos que están en cuarto año de aprendizaje, en el
cual los alumnos cumplen sus ocho años de vida. Por otra parte, dentro de este estudio se
utilizaron las puntuaciones de la prueba de matemática administrada en dos momentos
junto con la información recogida del contexto social de los alumnos y de su género.
Regresión lineal simple
Para introducirnos a la teoría multinivel se hacen algunas conjeturaciones sobre que tipo
de relación seria de interés conocer a partir de la información de los gráficos.
En la figura 2.1 según el ejemplo tratado se muestra el diagrama de dispersión de las
puntuaciones de la prueba de matemática en alumnos de 11 años de edad sobre las
puntuaciones de la prueba de matemática en alumnos de 8 años de edad. En este
diagrama no se hace ninguna distinción entre las escuelas a las cuales los alumnos
pertenecen. Observamos que existe una dispersión estrecha de las puntuaciones de
alumnos en edad de 11 años con el aumento de las puntuaciones de alumnos en edad de 8
años. Es importante recalcar que al no haber distinción entre escuelas, no podemos ver si
la escuela influye sobre las puntuaciones de los alumnos.
34
-
11 a
ños M
atem
átic
a
8 años Matemática
Figura 2.1: Diagrama de dispersión de las puntuaciones de la prueba de las matemáticas en alumnos de 11 años de edad sobre las
puntuaciones de la prueba de matemática en alumnos de 8 años de edad.
En figura 2.2 se presenta para un caso particular de dos escuelas que han sido
seleccionadas aleatoriamente, representadas por diversos símbolos. Observamos que
conforme aumentan las puntuaciones de los alumnos de 8 años, las puntuaciones de
alumnos de 11 años están entre 20 y 30 para la escuela 1 (símbolo círculo). Ahora bien,
para esa misma escuela las puntuaciones de mayor edad se sobre pone a las puntuaciones
de alumnos con menor edad. Sin embargo, si trazamos dos líneas de regresión para dichas
escuelas, se tiene que las rectas no son paralelas, indicando que la escuela 2 (símbolo
triángulo) tiene mejores puntuaciones en la prueba que la escuela 1. Además, hay un
punto de intersección en las dos rectas o un balance de las puntuaciones obtenidas en
alumnos de 8 y 11 años. Pero que el cambio surge después de ese punto de intersección,
se observa que no solo la edad o variable explicativa del nivel alumno influye en su
puntuación, sino que podemos pensar que existen otras características de la escuela, de tal
modo que las características de la escuela estarían influyendo en las puntuaciones de los
alumnos.
35
-
11 a
ños M
atem
átic
a
8 años Matemática
Figura 2.2: Diagrama de dispersión de las puntuaciones de la prueba de matemática para dos escuelas.
De las conjeturaciones hechas anteriormente, se escribe un modelo de regresión simple
para una escuela, relacionando las puntuaciones de la prueba de matemática en alumnos
de 11 años con las puntuaciones de 8 años, de la siguiente manera:
iiy ix eα β= + + (2.1)
Donde es la puntuación del i-ésimo alumno, iy ix la edad del alumno,
( 1 2, ,..., n )β β β β ′= es el efecto que tiene la edad sobre la puntuación del i-ésimo
alumno y ( 1 2, ,..., n)α α α α ′= es el promedio de las puntuaciones eliminando el efecto
de la edad de los alumnos.
Pero en la ecuación 2.1 solamente tenemos una regresión que permite conocer el efecto
de la edad sobre la puntuación del estudiante en una escuela en particular con una
muestra de tamaño estudiantes. Ahora bien, si queremos conocer el efecto de la edad
sobre la puntuación de los estudiantes de más de una escuela, con muestras de tamaño
1k
jk en cada una, entonces tendríamos n modelos de regresión lineal, de tal modo que podamos conocer que tanto influye la edad sobre la puntuación del i-ésimo alumno en la
36
-
j-ésima escuela. Esto implica el ajuste de n modelos de regresión, mediante una forma
parcial para cada escuela con tamaño jk , tenemos
Para la escuela 1: 1 1 111 ; 1, 2, ...,i ii iy 1x e kβα= + + =
Para la escuela 2: 2 2 222
; 1, 2, ...,i ii
iy 2x e kβα= + + =
Para la escuela n: ; 1, 2, ...,n in innin
iy nx e kβα= + + =
El sistema de ecuaciones de los n modelos anteriores se puede simplificar con el modelo
siguiente:
j ij ijjijy x eβα= + + (2.2) 1, 2, ..., ; 1, 2, ...,ji jk= = n
Donde
ijy es la puntuación del i-ésimo alumno en la j-ésima escuela.
ijx es la edad sobre la puntuación del i-ésimo alumno en la j-ésima escuela.
α representa el promedio de la puntuación muestral.
jβ representa los pesos asociados a la característica en la muestra completa. ijx
ije es una variable aleatoria que representa el error de ajuste del modelo del i-ésimo alumno en la j-ésima escuela.
Los deben cumplir las siguientes hipótesis: ije
a) La perturbación tiene esperanza nula, es decir:
( ) 0ijeE =
37
-
b) La varianza de la perturbación es siempre constante, y no depende de x ; conocido
como homocedasticidad de la perturbación.
( ) 2var ij eoe σ=
c) La perturbación tiene una distribución normal. Esta hipótesis es consecuencia del
teorema central del límite.
d) Las perturbaciones son independientes entre si.
Estas cuatro condiciones pueden expresarse igualmente respecto a la variable respuesta, o
dependiente, como sigue:
a) La esperanza de la respuesta depende linealmente de x . Tomando esperanzas en
(2.2), se tiene:
( ) ( )j ijj
j ij ijjijy x eE Ex
βαβα +
= + +=
b) La varianza de la distribución de es constante. ijy
( ) 2var eoijy σ=
c) La distribución de para cada y x es normal.
d) Las observaciones son independientes entre sí. ijy
38
-
Ahora, si utilizamos el modelo de regresión (2.2) se tendrían que estimar α , β y 2eoσ
que representa 2n+1 parámetros, suponiendo que jα , jβ y
2
eoσ es fijo para cada
escuela . 1, 2, ...,j n=
2.2 El modelo de dos niveles.
Con el fin de conocer otras variables aleatorias que no han sido medidas en el alumno se
debe considerar los parámetros como variables aleatorias. Es por ello que para hacer la
ecuación (2.2) más auténtica de dos niveles, dejamos jα y jβ como variables
aleatorias convertidas. Para la consistencia de la notación sustituiremos jα por 0 jβ y
jβ por 0 jβ y asumiremos que
0 10 0 1 1, , 1, 2, ...,j jj j ju u nβ β β β= + = + = (2.3)
Donde
0 jβ es el logro promedio por escuela, está representado como una función de la gran
media 0β o media de todas las escuelas, más una variable aleatoria 0 ju que captura la
variación en la puntuación promedia a través de escuelas. Dicho de otra forma el 0 ju
contiene las variables no observables que hacen que la nota promedio de cada escuela no
sean iguales. Por ejemplo, si todas las escuelas tuviesen media constante, entonces
. 0 0ju =
1 jβ es el efecto de la variable edad, está representado como una función de la estimación
de la media de las pendientes relativas al efecto de la variable edad más una variable
aleatoria 1 ju que captura la variación de los pesos asociados a la característica edad a
través de escuelas. La variable 1 ju recoge todas las variables no observables en la
escuela que influyen en la edad de los estudiantes y hace que el peso de la variable edad
39
-
difiera entre escuelas. Si el peso de la variable edad de los estudiantes fuese el mismo en
todas las escuelas, entonces . 1 0ju =
Sustituyendo (2.3) en (2.2) tenemos que,
( )0 1 00 1 ij j j ij ijijy x u u x eβ β= + + + + (2.4)
Donde ijy se ha expresado como la suma de una parte fija del modelo 0 1 ijxβ β+ y una
parte aleatoria dentro de las escuelas. Que al final la expresión (2.4)
resulta ser un modelo lineal de efectos mixtos.
0 1j j ij iju u x e+ + 0
=
Para las perturbaciones se establecen los siguientes supuestos:
a) Las variables aleatorias y tiene esperanza nula, es decir: 0 ju 1 ju
( ) ( )0 1 0j jE Eu u= (2.5)
b) La varianza de cada variable aleatoria y es siempre constante, y no depende
de
0 ju 1 jux .
( ) ( ) ( )2 20 0 1 1 0 1 0var , var , cov ,j u j u j j uu u u uσ σ= = = 1σ (2.6)
c) Las perturbaciones son independientes entre si.
Para la variable respuesta o dependiente, se tiene que:
a) La esperanza de la respuesta depe