universidad de el salvadorri.ues.edu.sv/id/eprint/12805/1/19200205.pdf · 2017. 2. 28. ·...

UNIVERSIDAD DE EL SALVADOR FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA

ESCUELA DE MATEMÁTICA

“TEORÍA DE MODELOS MULTINIVEL Y SUS APLICACIONES”.

PRESENTADO POR:

WELMAN DEL CARMEN ROSA ALVARADO

PARA OPTAR AL GRADO DE:

LICENCIADO EN ESTADÍSTICA

ASESOR:

DR. JOSÉ NERYS FUNES TORRES

ASESOR ADJUNTO:

LIC. RENÉ ARMANDO PEÑA

CIUDAD UNIVERSITARIA, SEPTIEMBRE DE 2005

UNIVERSIDAD DE EL SALVADOR RECTORA : Dra. María Isabel Rodríguez SECRETARIA GENERAL : Licda. Alicia Margarita Rivas de Recinos.

FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA DECANO EN FUNCIONES : M.Sc. José Héctor Elías Díaz SECRETARIO : Lic. Víctor Manuel Durán Belloso

ESCUELA DE MATEMÁTICA DIRECTOR : Lic. Mauricio Hernán Lovo Córdova

ii

TRABAJO DE GRADUACIÓN APROBADO POR: COORDINADOR :

Lic. Mauricio Hernán Lovo Córdova ASESOR :

Dr. José Nerys Funes Torres. ASESOR ADJUNTO :

Lic. René Armando Peña

iii

DEDICATORIA

Le agradezco y dedico a Dios, a la Universidad de El Salvador, a mis padres Maria Adela

Alvarado y Ángel Fabricio Rosa, por darme la oportunidad de finalizar este trabajo de

graduación. De igual manera deseo expresar mi agradecimiento a mis asesores Dr. José

Nerys Funes Torres y el Lic. René Armando Peña, quienes por sus enseñanzas

contribuyeron en gran parte para el desarrollo del presente trabajo de graduación.

Welman del Carmen Rosa Alvarado

iv

ÍNDICE. Contenido Pág.

Introducción………….………………………………………………………….......vii Capítulo I: Introducción a la Teoría de Modelos Multinivel…………………..….1

1.1 Antecedentes de los modelos multinivel…………………………………..…...3 1.2 El modelo de ecuación estructural………………………………….…….…...12 1.3 La naturaleza de los modelos multinivel……………………………………...16 1.4 Conjeturaciones previas al análisis multinivel…………………………….….24 1.5 Enfoques multinivel basado por el análisis de regresión múltiple,

ANOVA y ANCOVA……………………………………………………..…..26 1.6 El error de Medida………………………………………………………….....29

Capítulo II: Teoría de Modelos Multinivel…………………………………….…..32

2.1 El modelo 2 niveles y notación básica……………………………………..…..34 2.2 El modelo de dos niveles…………………………………………………..…..39 2.3 Estimación de los parámetros para el modelo de componentes de varianza….41 2.4 El modelo de 2 niveles incluyendo coeficientes aleatorios……………...…….47 2.5 Estructura general y estimación para un modelo multinivel de dos niveles.......50 2.6 Estimación de los parámetros del Modelo Multinivel general de tres niveles..68 2.7 Residuales……………………………………………………………………...81 2.8 Estadistica inferencial………………………………………………………….84

2.8.1 Error estándar..........................................................................................84 2.8.2 Contrastes………………………………………………………….…...85

Capítulo III: Aplicación de Modelos Multinivel………………………………..…..87

3.1 Objetivos de la aplicación………………………………………………….….90 3.2 Descripción de los datos…………………………………………………….…91

3.2.1 Descripción de Variables……………………………………………....92

3.3 Técnica de Análisis……………………………………………………………93 3.3.1 Test Estadístico………………………………………………………..93 3.3.2 Estrategia de Análisis: niveles de agregación………………………....93

3.4 Análisis multinivel para Lenguaje y Matemática……………………………..94

v

3.4.1 Las diferencias geográficas y del rendimiento escolar para

Lenguaje y Matemática………………………………………………95 3.4.2 Modelo Nulo para Lenguaje………………………….……...……….95 3.4.3 Modelo Multinivel geográfico para Lenguaje…………………….….99 3.4.4 Modelo Nulo Matemática………………………………….…..……104 3.4.5 Modelo Multinivel geográfico para Matemática………….………...104

3.5 La familia y el contexto de la escuela……………………………………….106 3.6 Cultura institucional y práctica en el aula…………………………………...116 3.7 Modelo optimal de factores asociados al rendimiento en Lenguaje

y Matemática……………………………………………………….…...…...121 3.7.1 Las variables…………………………………………………………122 3.7.2 Modelo óptimo para Lenguaje………………………………………123 3.7.3 Modelo óptimo para Matemática…………………………………….129 3.7.4 La diagnosis del modelo mediante los residuos para el nivel 1……...134 3.7.5 La diagnosis del modelo mediante los residuos para el nivel 2……...136

Capítulo IV: Conclusiones…………………………………………………………138

4.1 Conclusiones para Lenguaje…………………………………………………139 4.2 Conclusiones para Matemática………………………………………………141

REFERENCIAS BIBLIOGRÁFICAS……………………………………………143 ANEXOS……………………………………………………………………………146

vi

INTRODUCCIÓN

Actualmente es frecuente encontrar en diversas investigaciones de las áreas de la

educación y de la salud el uso de la Teoría de Modelos Multinivel como alternativa

metodológica de acercar el contexto del individuo a la explicación de la causalidad. Lo

que se pretende con esta metodología es representar de una manera precisa aquellos

fenómenos en los que la recogida de datos presenta una estructura anidada. En ese

sentido el modelo multinivel tiene en cuenta el agrupamiento de los individuos en otras

unidades, es decir, donde no solo se han seleccionado una serie de sujetos, sino también

una serie de unidades contextuales a los que éstos pertenecen, tales como: hospitales,

clases, escuelas, municipios, empresas u otras instituciones; situaciones en las que se

tienen estructuras particulares de los datos, las cuales no pueden ser considerados en un

análisis de regresión clásico; en caso que se utilice este tipo de regresión se llegaría a las

siguientes consecuencias: la producción de sesgos en los errores típicos de los

estimadores y el aumento de la probabilidad de rechazar la hipótesis nula de no

asociación, cuando ésta es cierta.

Conceptualmente, los modelos multinivel son básicamente un modelo de regresión de

efectos mixtos, en donde se estudia una relación lineal entre dos o más variables en

estudios realizados mediante un muestreo por agrupamiento, es decir, una técnica

correlacional adecuada para analizar variaciones en las características de los sujetos que

son miembros de un grupo que a su vez, hace parte de otra agrupación, o sea, mediciones

que forman una estructura agrupada y jerárquica. El modelo permite la descomposición

de la variación de una variable criterio (como por ejemplo, rendimiento) en sus

componentes “dentro del grupo” (dentro-escuela, dentro-departamentos) y “entre grupo”

(entre-escuela, entre-departamento) y el análisis de la asociación entre variables en esos

niveles de agregación.

vii

Todos estos aspectos serán abordados en el presente trabajo de graduación que está

estructurado en cuatro capítulos: introducción a la teoría multinivel, teoría de modelos

multinivel, aplicación y conclusiones. Como énfasis de una comprensión conceptual y

práctica de cómo utilizar esta técnica estadística cuando se tiene una situación anidada en

los datos.

En el primer capítulo se presentan los antecedentes de los modelos multinivel, el modelo

de ecuación estructural y se define el modelo multinivel como un modelo de regresión de

efectos mixtos, en donde se estudia una relación lineal entre dos o más variables en

estudios realizados mediante un muestreo por agrupamiento.

En el segundo capítulo se estudian los supuestos tanto de un modelo de regresión simple

como un modelo multinivel de dos y de tres niveles, además se presenta el método de

estimación de los parámetros para el modelo de componentes de varianza y la estimación

de los parámetros fijos y aleatorios del modelo multinivel de dos y tres niveles a partir de

los enfoques ANOVA (Análisis de varianza) y ANCOVA (Análisis de covarianzas).

En el tercer capítulo se desarrolla una aplicación de los modelos multinivel, disponiendo

de la base de datos de un estudio realizado en diversos países de Latinoamérica, el cual

consistió en aplicar un instrumento de recolección de información a: alumnos, profesores,

padres de familia y escuela. El objetivo de esta aplicación es identificar las condiciones

en las que los alumnos de tercero y cuarto grados de educación básica, alcanzan los

aprendizajes en Lenguaje y Matemática, según el resultado registrado en pruebas

estandarizadas. Esto, para buscar un modelo óptimo de Lenguaje y Matemática, de tal

manera que se logre encontrar cuales son los factores asociados al rendimiento de los

estudiantes en la prueba de Lenguaje y Matemática.

En el cuarto capítulo se concluye a partir de la aplicación realizada con la técnica

multinivel tanto para Lenguaje y Matemática. Se presenta además, un ejemplo de

predicción de la puntuación que obtendría un estudiante en Lenguaje y Matemática

basado en el contexto en el que vive y se desenvuelve académicamente.

viii

Finalmente dentro de este trabajo se presentan los anexos de algunas corridas realizadas

en el software HLM (Modelos Jerárquicos Lineales) y las referencias bibliográficas que

se utilizó para el desarrollo de este trabajo de graduación.

ix

CAPÍTULO I INTRODUCCIÓN A LA TEORÍA DE MODELOS MULTINIVEL. Introducción.

A lo largo de la historia los problemas del mundo real han sido abordados desde

diferentes perspectivas. Muchas disciplinas han contribuido a su conceptualización, de

hecho, sus características diferenciadoras en los distintos momentos históricos se han ido

perfilando desde la filosofía hasta la política, pasando por las aportaciones de la

psicología, de la economía y de la teoría de la organización. Pero no ha sido hasta el siglo

XX cuando se ha realizado un intento sistemático en construir un cuerpo de conocimiento

sobre los problemas y sobre los fenómenos que en el se dan.

Este capítulo esta estructurado de la siguiente manera:

Antecedentes de los modelos multinivel: aquí se presentan las metodologías que

fueron fundamentales para el nacimiento de esta teoría, tales como: el modelo de

Cronbach, causal y de regresión múltiple.

El modelo de ecuación estructural: este es un modelo que permite separar las

relaciones para cada conjunto de variables dependientes. Describiendo además los

problemas que este modelo permite atacar, como: validez de las relaciones causales,

interrelaciones y medida.

1

La naturaleza de los modelos multinivel: se define el concepto de lo que es en si la

teoría multinivel, el cual hace referencia a un modelo de efectos mixtos, donde se

estudia una relación lineal entre dos o más variables en estudios realizados mediante

un muestro por agrupamiento, es decir, una técnica correlacional adecuada para

analizar variaciones en las características de los sujetos que son miembros de un

grupo que a su vez, hace parte de otra agrupación, o sea, mediciones que forma de

una estructura agrupada y jerárquica. Mencionando además a diversos autores que

han aplicado el análisis multinivel en áreas de la educación, salud, epidemiología, etc.

Todo con el fin de buscar la conexión entre las características del individuo y el

contexto social en que se desenvuelve.

Conjeturaciones previas al análisis multinivel: en este apartado se describe a groso

modo que la teoría multinivel es una metodología fundamentalmente estadística para

el análisis de datos que presentan una estructura jerárquica, y principalmente cuando

los datos se han obtenido a través de la técnica de muestro por conglomerado.

Enfoques multinivel basado por el análisis de regresión múltiple, ANOVA y

ANCOVA: se estudian los conceptos sobre el análisis de varianza y de covarianza,

que son fundamentales para estimar los componentes de varianza, para luego estimar

los parámetros tanto fijo y aleatorios de un modelo multinivel de dos y tres niveles.

El error de Medida: se menciona lo relacionado al error de medida, además de

describir algunas metodologías claves para tratar el error de medida en diversos

estudios de investigación.

2

1.1 ANTECEDENTES DE LOS MODELOS MULTINIVEL. En la actualidad los investigadores se ven obligados a recoger un gran número de

medidas para poder captar de forma adecuada la complejidad de los fenómenos del

mundo real, e indagar o buscar un modelo estadístico. De tal manera, que nos permita

tomar una connotación específica sobre su estructura, las relaciones entre sus

componentes, su funcionamiento y los cambios que experimenta el sistema en su

totalidad o en sus componentes. Los conocimientos generales por una investigación en

particular, se unen a otros conocimientos ya existentes, acumulados durante mucho

tiempo por otros investigadores, sea en la forma de aporte original o como confirmatorio

de hallazgos ya existentes. Cualquiera que sea la situación que se enfrente, la

investigación es siempre la búsqueda de la solución a algún problema de conocimiento.

La construcción de modelos estadísticos o modelos matemáticos aplicados se incluye

dentro de lo que ha venido a denominarse modelación estadística (“statistical

modelling”). Como señala Lindsey (1993), con el modelo estadístico se pretende

descubrir la variabilidad en los datos observados mediante procedimientos matemáticos.

Además, se formula en términos del o los constructos hipotéticos que no se pueden

observar o medir directamente. Ejemplo de tales contructos son: la confianza,

autoestima, discriminación, rendimiento, motivación, capacidad, etc. Sin embargo, para

definir los constructos hipotéticos se debe primero incluir la clasificación de esos

constructos como dependientes (causado, criterio, endógeno) o independiente (causal,

explicativo, exógeno). En segundo lugar, para cada constructo dependiente, la teoría

especifica cuales de los otros constructos se postula para ser dependiente. La

construcción puede también incluir una declaración sobre la muestra y/o el tamaño

relativo del efecto directo de un constructo en otra.

Las dos relaciones claves para la construcción del modelo estadístico son: la primera es

que las relaciones entre construcciones hipotéticas constituyen la pieza estructural del

modelo y la segunda es que las relaciones entre indicadores o variables observables y

constructos teóricos constituyen la pieza fundamental de la medida del modelo.

3

En todo caso la construcción de un modelo estadístico consistirá en una serie de procesos

encaminados a explicar el comportamiento de una variable respuesta, relacionado con

indicadores exógenos. Sin embargo, debido a que la explicación de la variable criterio en

función de las variables exógenas no es perfecta, se incluye un término residual, es decir,

el término del error que puede estar formado por los efectos de otros indicadores sobre

las variables endógenas, por errores de medición, etc. Además, la variable o nivel

independiente del tratamiento se supone que es fijado por el experimentador (valores

conocidos).

Desde el punto de vista cualitativo, al explicar el comportamiento de la variable

respuesta, se pueden tener tres posibles modelos diferentes, a saber:

a) Que la variabilidad observada en los datos sea totalmente explicada por el

modelo, lo cual daría lugar a considerarlo como un modelo absolutamente

determinístico y formal.

b) Que la variabilidad observada en los datos sea totalmente explicada por factores

aleatorios, lo cual daría lugar a un modelo aleatorio, la base del cual puede

encontrarse en la ejecución de errores de muestreo, de medida o debido a las

características inherentes del sistema observado.

c) Que la variabilidad observada en los datos necesite de la participación de factores

sistemáticos y aleatorios, lo que da lugar a los modelos probabilísticos o

estocásticos.

La modelación estadística consiste en buscar un modelo que genere los datos con un

mínimo error posible. Según Arnau, 1981; las etapas de la modelación estadística en

esencia vienen a englobar los mismos contenidos, pudiéndose resumir como las

siguientes: identificación, estimación, validación y metadiagnóstico.

4

Una vez entendido el modelo estadístico tradicional, lo que se pretende ahora es poder

representar de una manera precisa aquellos fenómenos en los que la recogida de datos

presenta una estructura anidada. En ese sentido el modelo multinivel tiene en cuenta

el agrupamiento de los individuos en otras unidades, es decir, donde no solo se han

seleccionado una serie de sujetos, sino también una serie de unidades contextuales a

los que éstos pertenecen, tales como: hospitales, clases, escuelas, municipios, empresas

u otras instituciones; situaciones en las que se tienen estructuras particulares de los

datos, las cuales no pueden ser considerados en un análisis de regresión clásico; en

caso que se utilice este tipo de regresión se llegaría a las siguientes consecuencias: la

producción de sesgos en los errores típicos de los estimadores y el aumento de la

probabilidad de rechazar la hipótesis nula de no asociación, cuando ésta es cierta.

A continuación se presentan ciertas metodologías que fueron fundamentales para el

inicio del estudio del análisis multinivel.

i) Modelo de Cronbach (Cronbach y Webb, 1975):

Este modelo propone obviar el problema de multicolinealidad en los datos, logrando dar

una mejor interpretación en los parámetros de dicho modelo. Es un modelo de regresión

donde las variables individuales están centradas en la media de su grupo y variables

contextuales centradas en la media global.

En términos matemáticos este modelo se resume de la siguiente forma:

( ) ( ). . . ..1 2i ij j jijy x x x x xα γ ijβ β ε= + + − + − +

Donde es la variable de i-ésimo individuo en el j-ésimo grupo, es la media del

grupo j-ésimo y

ijx . jx

..x es la media global.

5

ii) Análisis Causal.

La filosofía define el término causalidad como una ley en virtud de la cual se producen

efectos. El principio de causalidad establece la conexión entre causa y efecto, y es uno de

los fundamentos del conocimiento humano. Por ello la causalidad es considerada como

una ley natural de absoluta validez.

La esencia del análisis causal reside en la unificación de los comportamientos de los

componentes de un sistema para deducir el comportamiento del sistema global. Estos

comportamientos deben ser comprendidos en el contexto de sistema global, atendiendo a

las conexiones entre los componentes que constituyen el sistema. Por otra parte el

comportamiento de cada parte del sistema permite la realización de una función, y

subfunciones. Tal identificación de los subsistemas con funciones conocidas ayuda al

análisis causal.

La utilización del modelo causal tiene cierta tradición en el área de la prevención de

riesgos laborales de trabajos originales de Meliá (1998). En la construcción de este

modelo, se parte de la distinción de los modelos causales de los accidentes en dos grandes

categorías: los modelos secuenciales (que tratan la cadena de eventos que conducen al

accidente) y los modelos estructurales (que desarrollan la interacción persona-máquina).

El modelo causal (ver figura 1.1) psicosocial responde a un planteamiento integrador de

los factores organizacionales y de naturaleza psicosocial. Las variables que incluye son

las siguientes:

• Clima de seguridad: variable que el ambiente de seguridad existente en la empresa

e impulsado por la dirección de la organización.

• Riesgo basal: concepto asociado a la actividad de la empresa, reflejando los

riesgos inherentes y específicos a una determinada industria o tipo de tarea.

6

• Respuesta de los superiores: variable que recoge la conducta y actitud de los

supervisores en materia de seguridad, así como los mecanismos de comunicación

y de contingencia, en el contexto de la prevención.

• Respuesta de los compañeros: factor psicosocial que trata de medir la respuesta

frente a problemas de seguridad por parte de los compañeros, en base al tipo de

respuesta y su frecuencia.

• Conducta hacia la seguridad del trabajador: descrita mediante comportamientos

específicos tales como orden, cumplimiento de las normas, utilización de

maquinaria defectuosa, etc.

• Riesgo basal: variable que refleja el riesgo de una determinada tarea en su

contexto, con independencia de las acciones en materia de prevención del riesgo

que adopte el trabajador que la realice.

• Riesgo real: mide la probabilidad de ser víctima de un accidente de trabajo.

Obsérvese que esta variable recoge los efectos tanto de las conductas como de las

condiciones de trabajo (riesgo basal).

• Accidentalidad: variable criterio indicador de la existencia de un accidente.

Medida mediante el número de accidentes laborales sufridos por el trabajador en

los últimos cinco años.

Un análisis causal psicosocial de los accidentes laborales (Meliá, 1998) se aplica a una

muestra de 316 trabajadores, con contrato mercantil o fijos, representando una variedad

de sectores industriales, propiedad (públicas y privadas), características organizativas y

ámbito de actuación (local, regional, nacional y multinacional). El modelo se ajusta

correctamente, ofreciendo parámetros con el signo acorde con las hipótesis realizadas,

una mayoría son estadísticamente significativos (sólo dos incumplen esta premisa).

7

Como conclusión, el autor indica que el modelo confirma que la variable clima de

seguridad (impulsada por la gestión) influye sobre la conducta hacia la seguridad, directa

e indirectamente a través de la respuesta de superiores y compañeros. De igual forma, el

modelo muestra relaciones directas consistentes de la conducta y el riesgo basal sobre el

riesgo real que, a su vez, influye sobre la accidentalidad.

Figura 1.1: Modelo causal psicosocial de los accidentes laborales.

Pascual (1993), dio otro gran aporte al análisis causal, al desarrollar en el área de la

educación, el liderazgo transformacional de Bass (1985), sosteniendo así tres premisas

claves de por qué el liderazgo es un indicador fundamental en la mejora de la eficacia de

los centros educativos, distinguiendo teóricamente dos grandes estilos de liderazgo, lo

que se denomina liderazgo transformacional y liderazgo transaccional, así mismo habla

de un tercer comportamiento directivo al que da el nombre de no liderazgo. Así, define el

liderazgo transformacional como aquel formado por carisma, consideración individual,

estimulación intelectual, inspiración y en el caso de la organización escolar agrega un

factor denominado tolerancia psicológica.

Según el modelo causal de liderazgo planteado por Pascual, a groso modo se clasifican

tres niveles. Por un lado variables relativas al nivel de colaboradores (ejemplo: la

satisfacción de los colaboradores con el líder, la disposición de realizar un mayor

esfuerzo por incrementar la calidad de trabajo, etc.). En el segundo nivel, variables

8

relativas a los efectos directos en la organización como puede ser la eficacia organizativa

del centro, la capacidad de cambio en el centro, etc. Por último los efectos que puede

tener el liderazgo en las actitudes de los alumnos. De modo que este modelo causal

considera como unidad de análisis el centro educativo, pretendiendo así, saber cuales eran

las variables relevantes a nivel de organización que aglutinan una serie de otras variables

más específicas y que pudieran ser efectos directos relacionados con el ejercicio de un

liderazgo transformacional.

Teniendo presente, por un lado el enfoque teórico de Bass, y por otro aquellas variables

más relevantes que se asocian con el liderazgo en los centros educativos como variables

mediadoras la participaron y la satisfacción con el trabajo docente en el centro, variables

de control a nivel de centros (tamaño del centro, tipo del centro). Lo que se trata es

establecer un modelo causal que sea una explicación plausible de los efectos del

liderazgo sobre la eficacia escolar.

A continuación se presenta la especificación inicial del modelo relacional de liderazgo y eficacia escolar que pretendemos validar.

Tabla 1.1: Constructos y dimensiones del modelo de liderazgo transformacional de Bass.

Carisma personalizante

Consideración Individual

Estimulación Intelectual Inspiración

Tolerancia Psicológica

Entusiasmo Trato personal Animación al cambio Implicación Humor

Credibilidad Apoyo Potenciación de un mayor esfuerzo Identidad

El principio de validez del modelo causal es a través del sistema de ecuaciones

estructurales. Donde las variables que conforman un constructo complejo, como es el

liderazgo, y que en nuestra propuesta se estructura como una variable independiente, se

denomina variable latente exógena. Mientras que aquellas variables que aparezcan

asociadas, tanto directa como indirectamente a los efectos de un liderazgo

transformacional, y cuyas varianzas intentamos explicar, recibe el nombre de variables

latentes endógenas.

9

Sin embargo, los estudios realizados mediante un análisis causal no son sencillos, el rigor

científico requiere, entre otros, la realización de “experimentos”. Estos experimentos

precisan la formación de dos o varios grupos (de tratamiento y de control) por asignación

aleatoria.

Por tanto, para la realización de un modelo causal donde los diseños sean

cuasiexperimentales y no experimentales 1, se necesita el uso de modelos causales no-

experimentales (modelos de estructuras de covarianzas o de ecuaciones estructurales) ya

que en su planteamiento tradicional, adolecen de ciertos problemas a la hora de asegurar

la validez de la relación causal, interrelación integra efectos interrelacionados y tratar con

los problemas de medida. Esto se tratará a profundidad en el siguiente apartado de este

capítulo.

Murillo (1990) hace sus consideraciones sobre la utilización del analisis causal,

destacando dos graves inconvenientes, uno de carácter práctico, que tiene gran dificultad

para que se ajusten los datos a un modelo, y otro de carácter Técnico, que no tiene en

cuenta la situación jerárquica de los datos. De hecho, es una alternativa muy poco

utilizada en la investigación sobre organizaciones y más en el campo psicológico.

iii) Modelo de regresión múltiple.

La regresión múltiple es el método de análisis apropiado cuando el problema del

investigador incluye una única variable métrica dependiente que se supone está

relacionada con una o más variables métricas independientes. El objetivo del análisis de

la regresión múltiple es predecir los cambios en la variable dependiente en respuesta a

cambios en varias de las variables independientes. Este objetivo se consigue muy a

menudo a través de la regla estadística de los mínimos cuadrados.

1 Meliá JL. Un modelo causal psicosocial de los accidentes laborales. Anuario de Psicología 1998; 29(3): 25-43.

10

Aunque el uso de esta técnica ha sido común desde los inicios de la investigación sobre

eficacia, con el tiempo ha experimentado algunos cambios en su aplicación. Como es, el

utilizar estas técnicas a partir de distintos predictores, introduciendo la aplicación al

cálculo de los residuales de regresión, tomando como base características individuales de

los sujetos o medias ponderadas de las escuelas.

Por ejemplo, en estudios del área de la educación, el uso de las puntuaciones residuales se

realiza como medida de la eficacia de la escuela a través de la diferencia entre las

puntuaciones predicha a partir de las características individuales del sujeto (nivel

socioeconómico, nivel cultural de los padres, rendimiento previo, etc.) y la puntuación

obtenida realmente por el mismo. Tiene la ventaja de que evita los sesgos que se

producen en la estimación de los efectos de los tratamientos cuado los grupos no son

equivalentes, aunque es evidente que no se realiza un ajuste total para todas las

diferencias entre las escuelas. Para Castejon (1994), la técnica de residuales más

adecuado para la identificación de escuelas eficaces, estableciendo cuatro formas de

llevar a cabo los análisis de datos y de regresión (modelo dentro de la escuela); por otra,

el análisis puede ser "ponderado" o "no ponderado" según el número de sujetos

pertenecientes a cada escuela. En el análisis empírico que realiza para comparar cada uno

de los cuatro índices de eficacia, cada uno de ellos a partir de: a) puntuaciones residuales

a partir de la ecuación de regresión múltiple con datos de los centros; b) puntuaciones

residuales a partir de la ecuación de regresión múltiple con datos de los centros obtenidos

a partir de la media ponderada de los sujetos; c) medias de las puntuaciones residuales

para cada alumno a partir de la ecuación de regresión; d) igual que el anterior, con la

media residual estandarizada para cada alumno a partir de la ecuación de regresión.

Examinado además la consistencia entre dichos índices, concluye poniendo de manifiesto

la existencia de centros cuyo rendimiento supera el predicho y, por tanto, muestran un

efecto significativo, aunque moderado, de la escuela, coincidiendo con los resultados

obtenidos por otros autores, y, por otra parte, el alto nivel de consistencia y concordancia

entre los índices resultantes. Sin embargo, los cuatro índices comparados tienen serios

problemas debido a la utilización del análisis de regresión, donde los datos presentan una

estructura anidad. Llegando así, a poder concluir de forma errónea.

11

1.2 EL MODELO DE ECUACIÓN ESTRUTURAL.

El modelo de ecuaciones estructurales se podría definir como un modelo causal no-

experimental que permite separar las relaciones para cada conjunto de variables

dependientes. En su aceptación más simple, el modelo de ecuaciones estructurales

proporciona la técnica de estimación más adecuada y eficiente para series de estimación

de ecuaciones simultáneas mediante regresiones múltiples.

El uso de este tipo de modelos causales permite atacar los problemas de interrelación, de

medida y validez de la relación causal.

Validez de las relaciones causales: el interés y la peculiaridad de las relaciones

causales radican en el elemento de “producción” o “fuerza” que la causa tiene

sobre el efecto. En el estudio de este tipo de relaciones suelen considerarse como

necesarias las tres condiciones de John Stuart Mill2.

• Covariación entre las presuntas causa y efecto.

• Precedencia temporal de la causa.

• Ausencia de explicaciones alternativas para la relación.

El cumplimiento de estas condiciones, y principalmente la tercera de las mismas, es el

que lleva a la necesidad de realizar diseños experimentales, diseños en los que se aíslan

las unidades a estudiar (ausencia de alternativas) y se realiza una prueba controlada

(precedencia) para, posteriormente, examinar el efecto (covariación).

Sin embargo existe un enfoque alternativo al análisis experimental, que consiste en

formular la teoría incluyendo todas las variables que son importantes a juicio del

investigador. La formulación así realizada determina la estructura de la matriz de

covarianzas de todas las variables, estructura que es contrastable.

2 Cook TD, Campbell DT. Quasi-experimentation. Design and Analysis Issues for Field Settings. Rand McNally College Publishing: Chicago, 1979.

12

De esta forma, se dispone de un instrumento que permite rechazar la teoría si los datos no

soportan las conclusiones deducidas. Dicho de otra manera, se tiene un método de

refutación en investigación no experimental.

Interrelaciones: El problema de las interrelaciones resulta de menor importancia

que los otros dos. Una vez que se ha especificado cuidadosamente la teoría, la

técnica del análisis de la covarianza permite resolver el problema.

La especificación de la teoría requiere incluir todas las variables importantes, el problema

es ¿dónde parar?. Un posible procedimiento consiste en ir incluyendo las variables que

son causa común de cada par de variables causa-efecto, siempre que al menos una de las

dos esté incluida en la hipótesis original.

Figura 1.2: Derivación de las teorías causales.

La figura 1.2 ilustra este procedimiento. La hipótesis inicial se muestra en la fig. 2.a. A

partir de dicha hipótesis, se buscan otras variables que sean causa común de cada par de

variables causa-efecto. En la ilustración aparecen dos nuevas variables (u, v), que

aparecen como causa común de las variables originales (x,y), fig. 2.b. Como ambas

13

variables x e y están representadas en la hipótesis original, las nuevas variables deben

explicitarse en el modelo. A continuación volvemos a examinar cada par de variables

causa-efecto; en este examen aparecen dos nuevas variables (w,z), fig. 2.c. La variable w

es causa común de las variables x,u; como x está incluida en la hipótesis original,

explicitamos w en el modelo. Sin embargo, la variable z es causa común de las variables

u,v; como ninguna de estas variables aparece en la hipótesis inicial, el procedimiento

indica que esta variable no es necesario explicitarla. Por último, fig. 2.d, todas las

variables que no son efecto de ninguna otra (w,v), variables predeterminadas o exógenas,

se unen con un arco con flechas en los dos extremos, indicando que pueden existir otros

efectos, más lejanos, no explicitados en el modelo. Evidentemente, la explicación de la

variable u será incompleta (no hemos incluido a z en el modelo), algo que resulta

secundario para validar la hipótesis inicial (Fig. 2.a).

Problemas de medición: según el modelo causal sobre la prevención de riesgos

laborales3. Los problemas de medida en este tipo de modelos tienen dos orígenes:

por un lado, la información sobre prevención de riesgos laborales puede ser

interpretada de distinta manera por diferentes sujetos y, por lo tanto, estar sujeta a

error; por otro lado, los conceptos organizacionales (tales como clima de

seguridad, motivación, comportamiento, etc.) son difíciles de evaluar con una

única variable. Una de las características de la metodología que se propone es que

permite tratar fácilmente ambos problemas.

Para terminar de entender mejor la metodología, los modelos de ecuaciones estructurales

utilizan una representación simbólica: los diagramas de trayectoria (path diagrams),

gráficos en los que causa y efecto se unen mediante flechas dirigidas, a continuación

presentamos como ejemplo un digrama path extraido de un estudio de factores asociados

al rendimiento de los estudiantes que se sometieron a la PAES 20004.

3 Dalrymple H, Redinger C y otros. Occupational Health and Safety Management Systems: Review and Analysis of International, National, and Regional Systems and Proposals for a New International Document. Informe preparado por The International Occupational Hygiene Association para la OIT: Ginebra, 1998. 4 Carlos Roberto Briones et al., Factores asociados al rendimiento de los estudiantes que se sometieron a la PAES 2000. Pág. 84-85. Ministerio de Educación, Dirección Nacional de Monitoreo y Evaluación. El Salvador.

14

En el diagrama de la figura 1.3, se consideran tres aspectos importantes que tienen

relación con los factores demográficos: “edad”, en términos de si se está o no en el tramo

“normal” para el momento de someterse a la prueba, o bien si hay atraso en el

bachillerato o adelanto; “relación de masculinidad”, que da la proporción hombre/mujer

en el conjunto de alumnos”, qué alumnos trabajan y estudian o solamente estudian. En

dicho diagrama se observa que la edad aparece como el factor demográfico más

importante (beta=-0.252): a mayor edad, menor resultado en la prueba, e indica la

importancia de que no se produzcan retrasos en cursar el bachillerato y que se logre

retener al alumnado.

En su conjunto, los factores demográficos considerados permiten explicar un 8%

(smc=0.08) de las variaciones de los resultados globales de la PAES.

Figura 1.3: Diagrama Path de factores demográficos.

Edad

El modelo de ecuación estructural se caracteriza por dos componentes básicos: el modelo

estructural y el modelo de medida. El modelo de medida permite al investigador usar

varias variables (indicadores), para una única variable dependiente o independiente. Por

ejemplo, la variable dependiente puede ser un concepto representado por una escala

aditiva, tal como el amor propio.

En el modelo de medida el investigador puede evaluar la contribución de cada ítem de la

escala así como incorporar como la escala mide el concepto (fiabilidad) en la estimación

Masculinidad

Labor

Factores demográficos

Error-0.252

0.10

0.0

Smc: 0.08 -0.11

15

de las variables dependientes e independientes. Este procedimiento es similar al

desarrollo del análisis factorial de los ítems de la escala y utiliza las cargas factoriales en

la regresión.

En tal caso, el modelo estructural es el modelo “guía”, que relaciona variables

independientes y dependientes. En tales situaciones, la teoría, antes que la experiencia u

otras directrices, permitiera al investigador distinguir qué variables independientes

predicen cada variable dependiente. Los modelos previamente discutidos que incluyen

múltiples variables dependientes (análisis multivariante de la varianza y correlación

canónica) no son apropiados en esta situación. Dado que permiten sólo una única relación

entre variables dependientes e independientes.

1.3 LA NATURALEZA DE LOS MODELOS MULTINIVEL.

Actualmente es frecuente encontrar en los estudios más importantes del mundo científico

y, en general, en los del área de la salud y educación. El uso de los modelos multinivel

como alternativa metodológica de acercar el contexto del individuo a la explicación de la

causalidad. Las causas que se asocian a la ocurrencia de un evento en salud,

frecuentemente se estudian de manera estática en el sentido de que no se tiene en cuenta

el análisis prospectivo o retrospectivo del ambiente social o cultural que rodea al

individuo, debido a definiciones importantes, tales como ausencia de variables,

imposibilidad de relacionar el contexto o el ambiente o dificultades en la aplicación

metodológica, entre otras.

Esto ha implicado que el investigador llegue a sentirse potencialmente incapaz de

explicar metodológicamente las causas de uno o varios eventos, puesto que

frecuentemente se omiten características importantes que pertenecen a la dinámica

ecológica donde interactúa el individuo, como el ambiente del trabajo, la comunidad, la

familia y los aspectos culturales y sociales, entre otros.

16

Recientemente, las ciencias sociales y la epidemiología han intentado suplir la necesidad

de una explicación más global de la morbilidad o la mortalidad, buscando la conexión

entre las características del individuo y el contexto social en el que este se desenvuelve.

Resultados obtenidos mediante la técnica del análisis multinivel han sido importantes

dentro de muchos campos de la investigación, por ejemplo Bryk AS (1992) dando un

aporte a la teoría multinivel, relacionando en un primer momento una variable respuesta

cuantitativa con las características individuales del estudiante y variables asociadas al

ambiente escolar mediante un conjunto de variables exploratorias de uno y otro nivel de

jerarquía. Este modelo lo definió como modelo lineal de coeficientes aleatorios.

Sandoval JJ. (2001), a dado otro aporte a epidemiología, al desarrollar un modelo

multinivel con el objeto de estudiar la sociedad y las diferentes formas de organización

social que afectan la salud de los colectivos humanos y su bienestar. En particular,

estudia la frecuencia, la distribución de los estados de salud en las poblaciones y su

relación con los determinantes sociales, de tal manera que va más allá del análisis de los

factores de riesgo individuales e incluye también estudios en el contexto social de los

individuos en el cual se produce el fenómeno salud-enfermedad. Como lo señala Dodge

KA (2002), algunos estudios epidemiológicos han mostrado principios metodológicos de

cómo estudiar las relaciones que los grupos poblacionales, el ambiente, las comunidades

y la sociedad en general tienen con la agresividad en niños. Es por ello que el estudio

realizado por Sandoval (2001) sobre el comportamiento agresivo y pro-social en niños,

en concordancia con las características individuales y los factores sociales relacionados

con las escuelas. Se estimaron las relaciones de las variables ajustado por los síntomas de

hiperactividad con déficit de atención y la edad del niño. La variable endógena está

conformada por los síntomas de agresividad indirecta, variable cuantitativa con nivel de

medición de intervalo, constituida mediante las puntuaciones factoriales de los resultados

del dominio “síntomas de agresividad indirecta”. El modelo relacionó la variable

respuesta cuantitativa con las características individuales del estudiante y las asociadas al

ambiente escolar mediante un conjunto de variables explorativas de uno y otro nivel de

17

jerarquía. El modelo describió las variables exploratorias en cada nivel, controlando por

los posibles efectos de confusión.

Otros autores como Maas, Cora J.M., and Snijders, Tom A.B., (2003) han dado un mayor

acercamiento al análisis multinievel, especialmente al caso de medidas repetidas para

datos completos e incompletos, donde, comúnmente son analizados a menudo por el

análisis de variación multivariante (MANOVA). Dando así una mayor estimación

mediante el modelo lineal jerárquico (HLM) mediante el uso de los modelos de efectos

aleatorios.

El análisis de datos mediante estos modelos es capaz de apresar dicha estructura, como

menciona Goldstein (1995) cada uno de los niveles de la estructura jerárquica es

representado formalmente con su propio submodelo. Cada submodelo expresa las

relaciones entre variables dentro de un determinado nivel y el conjunto de submodelos

especifica de qué modo variables de un nivel influyen en las relaciones que ocurren a otro

nivel distinto, quedando de este modo formalizada esta estructura anidada de los datos.

Definición de los modelos multinivel.

Los modelos multinivel son básicamente un modelo de regresión de efectos mixtos, en

donde se estudia una relación lineal entre dos o más variables en estudios realizados

mediante un muestro por agrupamiento, es decir, una técnica correlacional adecuada para

analizar variaciones en las características de los sujetos que son miembros de un grupo

que a su vez, hace parte de otra agrupación, o sea, mediciones que forman una estructura

agrupada y jerárquica. El modelo permite la descomposición de la variación de una

variable criterio (como por ejemplo, rendimiento) en sus componentes “dentro del grupo”

(dentro-escuela, dentro-departamentos) y “entre grupo” (entre-escuela, entre-

departamento) y el análisis de la asociación entre variables en esos niveles de agregación.

18

Los modelos multinivel permiten además estimar un conjunto separado de

establecimientos de efectos de coeficientes para cada unidad organizacional, y luego

modelar las variaciones en el conjunto de coeficientes de las organizaciones como

productos multivariados a ser explicados por factores organizacionales (recursos de los

centros educativos). Por ejemplo, a partir del nivel de los estudiantes se estiman puntajes

promedios de logro de los centros, los que en un segundo nivel se correlacionan con

diferentes características de éstos, es decir, los modelos multinivel ofrecen distintas

alternativas que se traducen en ventajas respecto de los modelos tradicionales en una

población cuya naturaleza sea anidada dentro de contexto, dando una versión más realista

ya que modelan cada nivel de jerarquía y no requieren de la independencia entre los

grupos.

El análisis multinivel se ha extendido y generalizado el análisis de varianza introducido

por Fisher (1880-1962), surgiendo en contextos de aplicaciones diversas, ejemplo en

educación un investigador educativo puede, ir a un grupo de escuelas y recoger datos

sobre el nivel socioeconómico de los alumnos y su rendimiento académico, a fin de

contrastar si existe una relación funcional entre ambas variables. Tendríamos así dos

tipos de unidades experimentales: el sujeto y la escuela, correspondiente a lo que la

literatura se denomina también como primer y segundo nivel de análisis. En el caso del

sujeto, la variable de interés es el rendimiento académico. En el caso de las escuelas, las

variables de interés son sus respectivas medias y pendientes de asociación entre el nivel

socioeconómico y rendimiento, expresados mediante los estimadores de sus rectas de

regresión.

Básicamente, como señala Burnstein et, al. (1981), el principal interés consistirá en

modelizar los resultados intra-organización como funciones sistemáticas tanto de

características individuales, como de variaciones entre contexto o entre grupos. Es decir,

constatará si existe variabilidad en las rectas de regresión entre las distintas escuelas. De

esa manera, y mediante una consideración integrada de ambos niveles de análisis, se

pretende cuantificar y contrastar hipótesis estadísticas acerca de la incidencia de los

19

distintos contextos académicos en el rendimiento escolar y en su relación con el nivel

socioeconómico del alumno.

En la investigación multinivel como ya hemos mencionado se ocupa del análisis de datos

donde las observaciones se jerarquizan dentro de grupos. Entonces, las variables se

pueden definir en cualquier unidad de análisis de la jerarquía. Algunas de estas variables

se pueden medir directamente en su nivel natural; por ejemplo, en los resultados

académicos de un estudiante se identifican minimamente dos niveles: nivel 1,

características del estudiante; nivel 2, características de la institución educativa.

Hay dos acercamientos a menudo criticados para analizar las características de los

diversos niveles en un solo nivel. En el primer acercamiento es que todas las

características de un nivel superior se desagregan a un nivel más bajo. Es decir,

asignando a todos los individuos una variable que refleje la denominación de su grupo a

que ellos pertenecen. En este acercamiento, todas las variables desagregadas se asumen

ser independientes. El segundo acercamiento, los datos en el nivel individual se agregan

al nivel más alto. La idea implícita en casi todos los usos del término “datos agregados”

es que la variable agregada es simplemente un índice agregado de propiedades de

unidades de nivel inferior, y no una medida directa de una propiedad del nivel superior.

Pero no siempre es cierto ya que son un tipo de variables grupales que se construye

“agregando” matemáticamente las características de los individuos del grupo. Se han

empleados los términos “variables analíticas” y “variables agregadas” como sinómino de

“variables derivadas”. También se ha recurrido al término “variables contextuales” como

sinómino de “variables derivadas”.

El análisis multinivel puede representarse metafóricamente por la “teoría de la rana en el

charco”, que se refiere a la idea que una rana pequeña de individuos puede estar en un

charco grande o una rana en un charco pequeño. Aplicado al ejemplo del estudiante

indica que un alumno moderadamente inteligente en un contexto sumamente inteligente

puede llegar a desmotivarse y así llegar a no tener éxito. Mientras el mismo alumno en un

contexto considerado menos inteligente puede llegar a tener éxito. Así, el efecto de una

20

inteligencia individual de alumnos depende por término medio de la inteligencia de otro

alumno.

Ahora bien, antes de presentar las definiciones teóricas de los modelos multinivel, se

comenta el tipo de variables que se consideran en los modelos multinivel.

Variables Globales y absolutas: son las que se refieren únicamente al nivel en que

están definidas, sin referencia a ninguna otra unidad o nivel de análisis. Por

ejemplo, la inteligencia podría ser una variable global (se mide a nivel individual).

Variables Relacionales: son las que conforman un nivel simple y describen las

relaciones de una unidad a otra siempre dentro del mismo nivel. Por ejemplo, los

índices de popularidad de un profesor se consideran variables relacionales en el

nivel individual.

Variables Analíticas y estructurales: estas se refieren a variables de niveles

inferiores que se agregan en unidades mayores. Las variables analíticas se refieren a

la agregación de una variable global en un nivel más bajo. Por ejemplo, las

características sociales de los individuos son variables analíticas cuando se agregan

para toda una comunidad.

Variables contextuales: estas definen a las superunidades; todas las unidades en

los niveles más bajos reciben el mismo valor en la variable que se mide en la

superunidad a la cual pertenecen. Por ejemplo, el área geográfica, comunidad, etc.

De las variables descritas anteriormente, se presenta el siguiente esquema, adaptado de

Swanborn (1981).

21

Tabla 2: Esquema adaptado a Swanborn (1981).

Nivel 1 2 3 …

Global Analítica

Relacionales Estructurales

Contextual Global Analítica

Relacionales Estructurales

Contextual Global …

Relacionales …

Tipo de variable

Contextual …

Idealmente, una teoría de multinivel debe especificar cuales variables pertenecen a cada

nivel, es decir, investigar de qué manera las variables grupales (macrovariables), las

individuales (microvariables) y sus interacciones se relacionan con los resultados a nivel

individual. Los efectos entre el individuo y el nivel del contexto requieren la

especificación de algún proceso dentro de los individuos que causa que esos individuos

sean influidos diferencialmente por ciertos aspectos de su contexto.

Tratando el ejemplo que venimos explorando, observamos que se han definido dos

niveles de agregación, el estudiante y la escuela. Y según el esquema dado anteriormente,

podríamos agregar variables derivadas de un nivel superior a un nivel más bajo, tal es el

caso como las características socioeconómicas del estudiante y familia, capital cultural y

social de las familias, áreas urbanas o rurales, el grado de involucramiento de las familias

de los alumnos en actividades escolares, y el apoyo de niveles superiores del sistema

educativo.

Con el fin de profundizar en el concepto de agregado y desagregado, tomaremos siempre

el ejemplo del estudiante. Lo que se pretende es medir la variable endógena (rendimiento

del estudiante), en primera instancia agregamos la variable contextual nivel

socioeconómico del estudiante. Esto lo hacemos para que conozcamos cual será el

impacto real de los diferentes factores sobre el rendimiento de los estudiantes, lo cual

eliminaremos el efecto que el nivel socioeconómico del estudiante y su familia tienen

sobre los resultados académicos. Ahora bien si desagregamos la variable nivel

22

socioeconómico de la escuela, entonces este modelo busca estimar el rendimiento

promedio de los estudiantes en las diferentes pruebas eliminado el efecto que sobre los

puntajes tiene el nivel socioeconómico medio de los alumnos del centro. En otras

palabras, trata de depurar la media general del rendimiento, aislando el efecto que sobre

ella tiene el nivel socioeconómico de cada establecimiento, expresado en términos del

promedio del nivel socioeconómico de sus estudiantes.

Tipos de modelos multinivel.

En los ejemplos citados anteriormente y mediante el esquema de variables adaptado a

Swanborn (1981), un modelo multinivel de dos niveles de jerarquía, pueden ser

expandido a más niveles de jerarquía. Algunos investigadores pueden estar interesados en

describir los cambios de las respuestas de una enfermedad con respecto al tiempo y,

desde esta perspectiva, el análisis multinivel puede ser utilizado para mostrar el efecto

temporal que se tiene sobre los grupos de estudio. Por ejemplo, en un estudio longitudinal

en el nivel 1 se consideraría los individuos. Así, el nivel 2 representaría las mediciones

repetidas en diferentes lugares, y el nivel 3 podrían ser los lugares. Algunos ejemplos de

estructura de encuestas transversales repetidas, se presentan en los estudios

multicéntricos5.

Otro tipo es el de estructura de mediciones repetidas se podría considerar en un nivel 1 la

medición de la ocasión, el nivel 2, el individuo y nivel 3, los lugares del país. Así, el nivel

1 representa la medición repetida del evento en mismo individuo. Tales estructuras

permiten explorar el cambio individual dentro de un grupo.

Los modelos multinivel pueden utilizarse también para representar diferentes variables

respuestas relacionadas de un mismo individuo. En la necesidad de examinar diversas

variables simultáneamente para evaluar, por ejemplo, la salud física de un individuo, las

diferentes mediciones del cuerpo formarían un conjunto de respuestas en el nivel 1, las

cuales estarían anidadas entre individuos (nivel 2), que a su vez estarían anidados en

5 Benavides FG, Benach J, Diez-Roux AV, Roman C. How do types of employement relate to health indicators? Findings from the second European survey on working conditions. J Epidemiol Community Health 2000.

23

diferentes instituciones de salud. Este tipo se conoce como estructura de clasificación

cruzada. Estudios con este enfoque pueden ser ecológicos o espaciales6.

1.4 CONJETURACIONES PREVIAS AL ANÁLISIS MULTINIVEL.

En diversas áreas de investigación se han observado la existencia de estructuras

jerárquicas en los datos, producto de la agrupación de unidades dentro de otras unidades

en diferentes niveles que conforma una jerarquía. Por ejemplo, una muestra de una

población se puede describir como una muestra llamado pasos múltiples: primero

tomamos una muestra de unidades del nivel más alto (por ejemplo, las escuelas), y luego

probamos las sub-unidades de las unidades disponibles (por ejemplo, buscar

características de los estudiantes y de las escuelas). En tales muestras, las observaciones

individuales generalmente no son completamente independientes. Esto es, porque los

estudiantes en la misma escuela tienden a ser semejantes unos de otros, a causa de

procesos de selección (por ejemplo, algunos profesores pueden darle mérito a algunos

estudiantes considerados talentosos, mientras que otros seria lo contrario) y a causa del

historial común que ellos han compartido en la misma escuela. Como resultado de eso, la

correlación mediana (expresado en el llamado intra-correlación de clase) entre variables

medidas en estudiantes de la misma escuela, será más alto que la correlación mediana

entre variables medidos en estudiantes de escuelas diferentes. Las diversas pruebas

estadísticas uniformes se inclinan pesadamente en la suposición de independencia de las

observaciones. Pero si esta suposición se viola, las estimaciones de los errores uniformes

de pruebas estadísticas convencionales serán demasiado pequeñas, y dará resultados

falsamente significativos. A todo esto se le considera un efecto de diseño, y el

procedimiento para la corrección será calcular los errores uniformes por métodos

ordinarios de análisis, es decir, estimar la intra-correlación de clase entre los encuestados

dentro de grupos. Algunos de estos procedimientos de corrección son bastantes poderosos

(Skinner, Holt & Herrero, 1989). De hecho, estos procedimientos de corrección se

podrían aplicar en el análisis multinivel. Sin embargo, en la mayoría de los problemas

multinivel es que no solo tenemos anidados los individuos dentro de grupos, sino que

6 Bramm AW, Van den EP, Prince MJ, Beekman AT, Kivela SL, Lawlor BA et, al. Religión as a crosscultural determinant of depresión in elderly Europeans: results from the EURODEP collaboration. Psychol Med 2001.

24

también tenemos variables medidas en todos los niveles disponibles. Las variables que

combinan los niveles diferentes en un modelo estadístico son un problema diferente que

estimar y corregir el diseño. Es por ello que los modelos multinivel se diseñan para

analizar las variables de niveles diferentes simultáneamente, usando un modelo

estadístico que incluya varias dependencias.

Supongamos por ejemplo, si se quiere estudiar a escala nacional la calidad de vida de los

ancianos que viven en una residencia de forma permanente. En este caso se puede

establecer una estructura jerárquica de 2 niveles, donde los ancianos se sitúan en el nivel

1 y las residencias en el nivel 2. Podemos suponer que dentro de cada residencia los

ancianos tienen a ser más similares en sus comportamientos y características, o más aun,

las residencias presentan características propias, lo que puede afectar a la calidad de vida

de los ancianos. Si la calidad de vida se considera una variable de respuesta de tipo

continua, a la que se le ajusta un modelo de regresión, considerando una característica

(exógeno) de los ancianos, podríamos encontrar como resultado una de estas tres

situaciones7, tal como se observa en la figura 4:

a) Las rectas de regresión para cada residencia son iguales, lo que llevaría a

considerar un único nivel en el análisis de los datos.

b) Las rectas de regresión difieren solo en el intercepto.

c) difieren tanto en el intercepto como en la pendiente, lo que nos lleva a pensar en

construir un modelo que considere los distintos niveles en la jerarquía de los

datos.

7 Catalán- Reyes MJ., et al. Utilización de los modelos multinivel en investigación sanitaria.

25

Figura 4: Ejemplo hipotético de un ajuste de regresión para la calidad de vida de los ancianos en cuatro

residencias.

Para hacer frente a esta problemática, el análisis multinivel es una metodología

fundamental para el análisis de datos que presentan una estructura jerárquica, y

principalmente cuando los datos se han obtenido a través de la técnica de muestro por

conglomerado, es decir, ocurre cuando en una investigación existen además de los

sujetos, otras unidades de análisis tales como escuelas, municipios, empresas, hospitales,

etc. La existencia de estas agrupaciones naturales queda reflejada en la estructura de los

datos, hace que se incumpla el supuesto del muestreo aleatorio simple y que muchas

técnicas estadísticas convencionales, tales como el análisis de varianza (ANOVA) efectos

fijos o la regresión clásica sea inapropiada.

1.5 ENFOQUES MULTINIVEL BASADO POR EL ANÁLISIS DE REGRESIÓN MULTIPLE, ANOVA Y ANCOVA.

Históricamente, los problemas de multinivel han guiado a enfoques de análisis que

basándose por un análisis de regresión múltiple, el análisis de variación, o de algún otro

método uniforme de análisis. Una situación análoga en un contexto de análisis de

regresión diferencia el análisis de covarianza clásico del modelo multinivel. Recordemos

que el análisis de covarianza es una combinación de análisis de varianza y de regresión

clásico. Se haría un análisis de regresión ordinario, por ejemplo, entre el número de horas

de preparación para un examen y rendimiento académico a fin de estudiar la eficacia de

los hábitos de estudio en una población de alumnos. En el análisis de covarianza clásico

se incluiría el estudio de esta relación en un diseño de dos o más grupos, como por

ejemplo, dos tipos de entrenamiento en hábitos de estudio con respecto a un grupo de

26

control. Los sujetos en este caso podrían ser asignados aleatoriamente a uno de los grupos

y se podrían contrastar hipótesis tanto sobre las diferencias entre los métodos de estudio,

como sobre la eficacia del tiempo invertido.

Los efectos de interés en este caso son fijos, puesto que se han elegido premeditadamente

dos programas de entrenamiento de estudios específicos frente a un grupo de control.

Tendríamos análisis de covarianza de efectos mixtos o modelo multinivel si en lugar de

estos programas concretos, el objetivo fuera, por ejemplo, el contrastar la eficacia de las

horas de estudio en una selección de escuelas al azar. En este caso habría dos tipos de

unidades experimentales, la escuela y el alumno, y las medidas de los alumnos dentro de

cada escuela estarían correlacionadas, por lo que el modelo de efectos fijos no sería

apropiado.

En el análisis multinivel, todo el conjunto de problemas es conceptual, es decir, si el

analista no es muy cuidadoso en la interpretación de los resultados, puede cometer la

falacia del nivel injustificadamente, que se compone de analizar los datos en un nivel, y

las conclusiones que dibujan en otro nivel. Una de las falacias mejor conocidas es la

falacia ecológica, que interpreta los datos agregados en el nivel individual, es decir,

inferir conclusiones a escala individual a partir de datos grupales. La otra falacia que

podría surgir es el hacer inferencias en un nivel más alto a partir de un análisis

realizado en un nivel más bajo, se conoce también la falacia atomística, es decir, hacer

inferencias sobre la variabilidad intergrupal (o relación entre variables grupales) a

partir de datos individuales. A este concepto a veces se ha denominado falacia

individualista.

Una manera más general de ver los datos multinivel es investigar las relaciones entre las

variables que se miden en varios niveles jerárquicos diferentes. Por ejemplo, una

pregunta común es cómo varias variables individuales y de grupo influyen una sola

variable individual del resultado. Típicamente, parte de las variables individuales. En el

pasado, tales datos se analizaban cuando generalmente un análisis de regresión múltiple

convencional con una variable dependiente en el nivel más bajo (individuo) y una

27

colección de forma explicativa de variables en todos los niveles disponibles. (Boyd y

Iversen, 1979; Roberts y Burtein, 1980). Desde que este enfoque analiza todos los datos

disponibles en un solo nivel, se sufre el problema conceptual y estadístico como el que

producir sesgos en la estimación del error típico de medida y un aumento en la

probabilidad de cometer el error de rechazar la hipótesis de asociación lineal cuando esta

es cierta.

El análisis multinivel modela explícitamente estas relaciones jerárquicas, eliminando

estos sesgos, proporcionando además estimaciones de interés psicológico sobre la

variabilidad y replicabilidad de los coeficientes de regresión en los distintos contextos

sociales (Robinson, 1950), y sobre la influencia de estos en el comportamiento del

individuo.

En los últimos 50 años se han desarrollado diferentes métodos de estimación tal es el

caso el de componente de varianza, aplicable a datos desequilibrados bajo modelos

mixtos. Es decir, la existencia de correlación entre observaciones hace que el modelo

de regresión por mínimos cuadrados ordinarios produzca sesgos en la estimación del

error cuadrático medio, y por tanto producirá errores de inferencia. El grado de sesgo

depende de la magnitud de la correlación entre los grupos tanto de la variable

endógena como la exógena, así como del número de unidades experimentales.

En diversos estudios como en psicología, es frecuente que un contexto de regresión

implicaría que no solamente el número de unidades de nivel inferior sea el mismo para

cada unidad experimental del nivel superior, sino que también la distribución de los

valores de las variables exógenas sea también la misma para todos los grupos del nivel

superior. Tal como ocurre en el análisis de experimentos en estos casos, es aconsejable

recurrir al procedimiento de Máxima Verosimilitud que es un método clásico de

estimación de parámetros (no necesariamente varianza) asociada a funciones de densidad

o probabilidades de variables aleatorias, con la restricción de que los parámetros han de

estar en el espacio paramétrico. Produciendo estimadores con propiedades deseables con

28

muestras grandes, tales como consistencia y eficacia, es decir, si se recoge gran cantidad

de datos, el estimador será aproximadamente insesgado y con varianza mínima.

1.6 EL ERROR DE MEDIDA.

En muchas áreas de la investigación, los estudios pueden implicar variables que no se

pueden observar directamente. Por ejemplo, la capacidad matemática de una persona no

se puede medir directamente, solamente el funcionamiento en una serie de preguntas en

una prueba de matemática. También, los datos recogidos de encuestadores contienen

error de respuesta (es decir, hay variación de la respuesta en respuestas a la misma

pregunta cuando está administrado en varias ocasiones a la misma persona). El error de

medida puede ocurrir en variables explicativas, dependientes o independientes. La

confiabilidad de variables explicativas es una pregunta metodológica importante. Cuando

se sabe la confiabilidad, las correcciones se pueden hacer (Fuller, 1987), si las medidas

repetidas están disponibles, la confiabilidad se puede incorporar en el modelo y estimar

directamente. El uso de variables explicativas no fiables conduce a la valoración en

polarización negativa de los coeficientes de la regresión y la inferencia estadística que

resulta puede ser muy engañosa a menos que se hagan los ajustes cuidadosos.

Por otro lado, ya en el contexto de modelos de ecuaciones simultaneas o modelos de

ecuaciones estructurales con variables observables, en ocasiones denominados path

análisis, en Gillespie y Fox (1980) se señalan los posibles efectos en modelos recursivos,

modelos en que la causalidad fluye en un único sentido, indicando que se produciría

atenuación en los coeficientes gamma, aquellos que van de variables exógensas a

endógenas, y sin embargo sesgo positivo en los coeficientes beta (aquellos que van de

una variables endógenas a otras). Este último efecto podría llevar a una atenuación de las

varianzas entre errores. Resultados para un modelo no recursivo (Fergusson y Horwood,

1986) mostraron que al aumentar el error de medida aleatorio, aumentaba el valor de los

coeficientes gamma, mientras los coeficientes beta disminuían. Thompson y Getty (1994)

ofrecen otro ejemplo de efectos de la fiabilidad de las medidas en un modelo no

recursivo, modelo en que se plantea doble sentido en la causalidad donde una variable

29

antecedente puede también ser consecuente. Es por ello que una forma alternativa de

tratar el error de medida aleatoria es mediante modelos de ecuaciones estructurales con

variables latentes. Estos permiten efectos, predicciones entre factores, en lugar de solo

plantear relaciones entre variables observables. El concepto y la teoría estadística que

permite las ecuaciones de regresión simultáneas entre factores fueron introducidos por

Jöreskog (1970; 1973), y se basan en una idea simple, incorporar en un mismo modelo el

análisis factorial confirmatorio y el modelo de ecuaciones estructurales con variables

observables.

Aunque el asunto del modelo de error de medida ha recibido hoy en día la verdadera

atención considerable en la literatura multinivel, ésta atención se ha centrado en los

modelos lineales de error de medida, más específicamente, el modelo aditivo clásico del

error de medida (Carroll et al., 1995; Fuller, 1987; Goldstein, 1987; Longford, 1993).

Este modelo se basa en la asunción de la homocedasticidad, que exige la variación igual

de los errores de medida condicionales en diversos niveles de la variable endógena. Es

decir, en la terminología usado cuando se discuten las medidas específicas por estrato son

“homogéneas” cuando son iguales y “heterogéneas” cuando son significativamente

diferentes. Obviamente, una medida resumen es mejor en una situación en que la medida

que esta siendo resumida es homogénea en los estratos. En caso habitual, para una

medida de razón efecto, la homogeneidad entre los estratos es equivalente a tasas o

razones que se adaptan a un modelo multiplicativo de efectos conjuntos (absolutos), la

homogeneidad es equivalente a un modelo aditivo de efectos conjuntos. Modificación de

la medida del efecto significa heterogeneidad para esa medida. Por ejemplo en la

investigación educativa, el gasto del pre-test de los estudiantes, el estado socioeconómico

o la inteligencia se utilizan a menudo como variables explicativas en los resultados del

examen de los estudiantes. Además, los resultados del examen de los estudiantes o las

capacidades se miden conforme a error o no se pueden observar directamente. Los errores

de medida asociados a las variables explicativas o a las variables que no pueden ser

observadas directamente no se toma en consideración.

30

La atención esta también en un modelo no lineal de error de medida y de un modelo

estructural no lineal, esto es debido a que los modelos multinivel fueron desarrollados

originalmente para variables con distribución normal y bajo los supuestos de una

distribución normal de los errores en cada individuo, estos métodos han sido

generalizados para situaciones en los que las variables de respuesta es binomial, nominal

u ordinal y para procesos donde la probabilidad del evento es pequeña y se puede

modelar con una distribución de Poisson. Se llama función vínculo de nivel 1 (link

funtion) a la transformación de la variable dependiente de nivel 1 que se iguala a una

combinación lineal de los coeficientes de las variables explicativas. Esta función puede

ser una función logística binomial, ordinal, multinomial o una transformación de Poisson.

31

CAPÍTULO 2

TEORÍA DE LOS MODELOS MULTINIVEL Introducción. En este capítulo se presenta el fundamento teórico de modelos multinivel, el cual esta

estructurado en los siguientes apartados:

El modelo de dos niveles y su notación, en primer lugar se aborda este contenido a

partir de un ejemplo desarrollado por Golstein en 1999, donde se hacen algunas

conjeturaciones sobre el modelo de regresión clásica. Se define el modelo parcial con

situación multigrupo, estableciendo así los supuestos para un modelo de regresión

simple.

El modelo de dos niveles, se define el modelo lineal mixto y se estudian los supuestos

básicos.

Estimación de los parámetros para el modelo de componentes de varianza, aquí se

estiman los parámetros del modelo multinivel de dos niveles pero considerando el

modelo donde no se incluye ninguna variable aleatoria al modelo (el enfoque

ANOVA).

El modelo de 2 niveles incluyendo coeficientes aleatorios, en este apartado se realiza

la estimación de los parámetros del modelo multinivel de dos niveles, considerando

una variable aleatoria al modelo (el enfoque ANCOVA).

32

Estructura general y estimación para un modelo multinivel de dos niveles, aquí se

estiman los parámetros del modelo multinivel general de dos niveles. Se parte con la

incorporación de dos variables aleatorias al modelo lineal mixto, para poder así

generalizarlo a tantas variables aleatorias que se deseen incorporar al modelo

multinivel de dos niveles.

Estimación de los parámetros del Modelo general de tres niveles. De igual manera

como se desarrolló la estimación de los parámetros tanto fijo como aleatorios de un

modelo multinivel general de dos niveles, se hace para un modelo multinivel general

de tres niveles.

33

2.1 El modelo de 2 niveles y notación básica

Para entrar en materia, se presenta un ejemplo del estudio realizado por Goldstein

(1999) a partir de los resultados obtenidos por alumnos en escuelas primarias (Junior

School Proyect) en Londres, realizado por Mortimore et al (1988). Goldstein, utilizó una

submuestra aleatoria de la data de Mortimore, considerando 728 alumnos en 50 escuelas

y como unidad de medida a los alumnos que están en cuarto año de aprendizaje, en el

cual los alumnos cumplen sus ocho años de vida. Por otra parte, dentro de este estudio se

utilizaron las puntuaciones de la prueba de matemática administrada en dos momentos

junto con la información recogida del contexto social de los alumnos y de su género.

Regresión lineal simple

Para introducirnos a la teoría multinivel se hacen algunas conjeturaciones sobre que tipo

de relación seria de interés conocer a partir de la información de los gráficos.

En la figura 2.1 según el ejemplo tratado se muestra el diagrama de dispersión de las

puntuaciones de la prueba de matemática en alumnos de 11 años de edad sobre las

puntuaciones de la prueba de matemática en alumnos de 8 años de edad. En este

diagrama no se hace ninguna distinción entre las escuelas a las cuales los alumnos

pertenecen. Observamos que existe una dispersión estrecha de las puntuaciones de

alumnos en edad de 11 años con el aumento de las puntuaciones de alumnos en edad de 8

años. Es importante recalcar que al no haber distinción entre escuelas, no podemos ver si

la escuela influye sobre las puntuaciones de los alumnos.

34

11 a

ños M

atem

átic

a

8 años Matemática

Figura 2.1: Diagrama de dispersión de las puntuaciones de la prueba de las matemáticas en alumnos de 11 años de edad sobre las

puntuaciones de la prueba de matemática en alumnos de 8 años de edad.

En figura 2.2 se presenta para un caso particular de dos escuelas que han sido

seleccionadas aleatoriamente, representadas por diversos símbolos. Observamos que

conforme aumentan las puntuaciones de los alumnos de 8 años, las puntuaciones de

alumnos de 11 años están entre 20 y 30 para la escuela 1 (símbolo círculo). Ahora bien,

para esa misma escuela las puntuaciones de mayor edad se sobre pone a las puntuaciones

de alumnos con menor edad. Sin embargo, si trazamos dos líneas de regresión para dichas

escuelas, se tiene que las rectas no son paralelas, indicando que la escuela 2 (símbolo

triángulo) tiene mejores puntuaciones en la prueba que la escuela 1. Además, hay un

punto de intersección en las dos rectas o un balance de las puntuaciones obtenidas en

alumnos de 8 y 11 años. Pero que el cambio surge después de ese punto de intersección,

se observa que no solo la edad o variable explicativa del nivel alumno influye en su

puntuación, sino que podemos pensar que existen otras características de la escuela, de tal

modo que las características de la escuela estarían influyendo en las puntuaciones de los

alumnos.

35

11 a

ños M

atem

átic

a

8 años Matemática

Figura 2.2: Diagrama de dispersión de las puntuaciones de la prueba de matemática para dos escuelas.

De las conjeturaciones hechas anteriormente, se escribe un modelo de regresión simple

para una escuela, relacionando las puntuaciones de la prueba de matemática en alumnos

de 11 años con las puntuaciones de 8 años, de la siguiente manera:

iiy ix eα β= + + (2.1)

Donde es la puntuación del i-ésimo alumno, iy ix la edad del alumno,

( 1 2, ,..., n )β β β β ′= es el efecto que tiene la edad sobre la puntuación del i-ésimo

alumno y ( 1 2, ,..., n)α α α α ′= es el promedio de las puntuaciones eliminando el efecto

de la edad de los alumnos.

Pero en la ecuación 2.1 solamente tenemos una regresión que permite conocer el efecto

de la edad sobre la puntuación del estudiante en una escuela en particular con una

muestra de tamaño estudiantes. Ahora bien, si queremos conocer el efecto de la edad

sobre la puntuación de los estudiantes de más de una escuela, con muestras de tamaño

1k

jk en cada una, entonces tendríamos n modelos de regresión lineal, de tal modo que podamos conocer que tanto influye la edad sobre la puntuación del i-ésimo alumno en la

36

j-ésima escuela. Esto implica el ajuste de n modelos de regresión, mediante una forma

parcial para cada escuela con tamaño jk , tenemos

Para la escuela 1: 1 1 111 ; 1, 2, ...,i ii iy 1x e kβα= + + =

Para la escuela 2: 2 2 222

; 1, 2, ...,i ii

iy 2x e kβα= + + =

Para la escuela n: ; 1, 2, ...,n in innin

iy nx e kβα= + + =

El sistema de ecuaciones de los n modelos anteriores se puede simplificar con el modelo

siguiente:

j ij ijjijy x eβα= + + (2.2) 1, 2, ..., ; 1, 2, ...,ji jk= = n

Donde

ijy es la puntuación del i-ésimo alumno en la j-ésima escuela.

ijx es la edad sobre la puntuación del i-ésimo alumno en la j-ésima escuela.

α representa el promedio de la puntuación muestral.

jβ representa los pesos asociados a la característica en la muestra completa. ijx

ije es una variable aleatoria que representa el error de ajuste del modelo del i-ésimo alumno en la j-ésima escuela.

Los deben cumplir las siguientes hipótesis: ije

a) La perturbación tiene esperanza nula, es decir:

( ) 0ijeE =

37

b) La varianza de la perturbación es siempre constante, y no depende de x ; conocido

como homocedasticidad de la perturbación.

( ) 2var ij eoe σ=

c) La perturbación tiene una distribución normal. Esta hipótesis es consecuencia del

teorema central del límite.

d) Las perturbaciones son independientes entre si.

Estas cuatro condiciones pueden expresarse igualmente respecto a la variable respuesta, o

dependiente, como sigue:

a) La esperanza de la respuesta depende linealmente de x . Tomando esperanzas en

(2.2), se tiene:

( ) ( )j ijj

j ij ijjijy x eE Ex

βαβα +

= + +=

b) La varianza de la distribución de es constante. ijy

( ) 2var eoijy σ=

c) La distribución de para cada y x es normal.

d) Las observaciones son independientes entre sí. ijy

38

Ahora, si utilizamos el modelo de regresión (2.2) se tendrían que estimar α , β y 2eoσ

que representa 2n+1 parámetros, suponiendo que jα , jβ y

2

eoσ es fijo para cada

escuela . 1, 2, ...,j n=

2.2 El modelo de dos niveles.

Con el fin de conocer otras variables aleatorias que no han sido medidas en el alumno se

debe considerar los parámetros como variables aleatorias. Es por ello que para hacer la

ecuación (2.2) más auténtica de dos niveles, dejamos jα y jβ como variables

aleatorias convertidas. Para la consistencia de la notación sustituiremos jα por 0 jβ y

jβ por 0 jβ y asumiremos que

0 10 0 1 1, , 1, 2, ...,j jj j ju u nβ β β β= + = + = (2.3)

Donde

0 jβ es el logro promedio por escuela, está representado como una función de la gran

media 0β o media de todas las escuelas, más una variable aleatoria 0 ju que captura la

variación en la puntuación promedia a través de escuelas. Dicho de otra forma el 0 ju

contiene las variables no observables que hacen que la nota promedio de cada escuela no

sean iguales. Por ejemplo, si todas las escuelas tuviesen media constante, entonces

. 0 0ju =

1 jβ es el efecto de la variable edad, está representado como una función de la estimación

de la media de las pendientes relativas al efecto de la variable edad más una variable

aleatoria 1 ju que captura la variación de los pesos asociados a la característica edad a

través de escuelas. La variable 1 ju recoge todas las variables no observables en la

escuela que influyen en la edad de los estudiantes y hace que el peso de la variable edad

39

difiera entre escuelas. Si el peso de la variable edad de los estudiantes fuese el mismo en

todas las escuelas, entonces . 1 0ju =

Sustituyendo (2.3) en (2.2) tenemos que,

( )0 1 00 1 ij j j ij ijijy x u u x eβ β= + + + + (2.4)

Donde ijy se ha expresado como la suma de una parte fija del modelo 0 1 ijxβ β+ y una

parte aleatoria dentro de las escuelas. Que al final la expresión (2.4)

resulta ser un modelo lineal de efectos mixtos.

0 1j j ij iju u x e+ + 0

=

Para las perturbaciones se establecen los siguientes supuestos:

a) Las variables aleatorias y tiene esperanza nula, es decir: 0 ju 1 ju

( ) ( )0 1 0j jE Eu u= (2.5)

b) La varianza de cada variable aleatoria y es siempre constante, y no depende

de

0 ju 1 jux .

( ) ( ) ( )2 20 0 1 1 0 1 0var , var , cov ,j u j u j j uu u u uσ σ= = = 1σ (2.6)

c) Las perturbaciones son independientes entre si.

Para la variable respuesta o dependiente, se tiene que:

a) La esperanza de la respuesta depe

universidad de el salvadorri.ues.edu.sv/id/eprint/12805/1/19200205.pdf · 2017. 2. 28. ·...

Documents