universidad de el salvadorri.ues.edu.sv/id/eprint/12805/1/19200205.pdf · 2017. 2. 28. ·...

171
UNIVERSIDAD DE EL SALVADOR FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA ESCUELA DE MATEMÁTICA “TEORÍA DE MODELOS MULTINIVEL Y SUS APLICACIONES”. PRESENTADO POR: WELMAN DEL CARMEN ROSA ALVARADO PARA OPTAR AL GRADO DE: LICENCIADO EN ESTADÍSTICA ASESOR: DR. JOSÉ NERYS FUNES TORRES ASESOR ADJUNTO: LIC. RENÉ ARMANDO PEÑA CIUDAD UNIVERSITARIA, SEPTIEMBRE DE 2005

Upload: others

Post on 14-Feb-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

  • UNIVERSIDAD DE EL SALVADOR FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA

    ESCUELA DE MATEMÁTICA

    “TEORÍA DE MODELOS MULTINIVEL Y SUS APLICACIONES”.

    PRESENTADO POR:

    WELMAN DEL CARMEN ROSA ALVARADO

    PARA OPTAR AL GRADO DE:

    LICENCIADO EN ESTADÍSTICA

    ASESOR:

    DR. JOSÉ NERYS FUNES TORRES

    ASESOR ADJUNTO:

    LIC. RENÉ ARMANDO PEÑA

    CIUDAD UNIVERSITARIA, SEPTIEMBRE DE 2005

  • UNIVERSIDAD DE EL SALVADOR RECTORA : Dra. María Isabel Rodríguez SECRETARIA GENERAL : Licda. Alicia Margarita Rivas de Recinos.

    FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA DECANO EN FUNCIONES : M.Sc. José Héctor Elías Díaz SECRETARIO : Lic. Víctor Manuel Durán Belloso

    ESCUELA DE MATEMÁTICA DIRECTOR : Lic. Mauricio Hernán Lovo Córdova

    ii

  • TRABAJO DE GRADUACIÓN APROBADO POR: COORDINADOR :

    Lic. Mauricio Hernán Lovo Córdova ASESOR :

    Dr. José Nerys Funes Torres. ASESOR ADJUNTO :

    Lic. René Armando Peña

    iii

  • DEDICATORIA

    Le agradezco y dedico a Dios, a la Universidad de El Salvador, a mis padres Maria Adela

    Alvarado y Ángel Fabricio Rosa, por darme la oportunidad de finalizar este trabajo de

    graduación. De igual manera deseo expresar mi agradecimiento a mis asesores Dr. José

    Nerys Funes Torres y el Lic. René Armando Peña, quienes por sus enseñanzas

    contribuyeron en gran parte para el desarrollo del presente trabajo de graduación.

    Welman del Carmen Rosa Alvarado

    iv

  • ÍNDICE. Contenido Pág.

    Introducción………….………………………………………………………….......vii Capítulo I: Introducción a la Teoría de Modelos Multinivel…………………..….1

    1.1 Antecedentes de los modelos multinivel…………………………………..…...3 1.2 El modelo de ecuación estructural………………………………….…….…...12 1.3 La naturaleza de los modelos multinivel……………………………………...16 1.4 Conjeturaciones previas al análisis multinivel…………………………….….24 1.5 Enfoques multinivel basado por el análisis de regresión múltiple,

    ANOVA y ANCOVA……………………………………………………..…..26 1.6 El error de Medida………………………………………………………….....29

    Capítulo II: Teoría de Modelos Multinivel…………………………………….…..32

    2.1 El modelo 2 niveles y notación básica……………………………………..…..34 2.2 El modelo de dos niveles…………………………………………………..…..39 2.3 Estimación de los parámetros para el modelo de componentes de varianza….41 2.4 El modelo de 2 niveles incluyendo coeficientes aleatorios……………...…….47 2.5 Estructura general y estimación para un modelo multinivel de dos niveles.......50 2.6 Estimación de los parámetros del Modelo Multinivel general de tres niveles..68 2.7 Residuales……………………………………………………………………...81 2.8 Estadistica inferencial………………………………………………………….84

    2.8.1 Error estándar..........................................................................................84 2.8.2 Contrastes………………………………………………………….…...85

    Capítulo III: Aplicación de Modelos Multinivel………………………………..…..87

    3.1 Objetivos de la aplicación………………………………………………….….90 3.2 Descripción de los datos…………………………………………………….…91

    3.2.1 Descripción de Variables……………………………………………....92

    3.3 Técnica de Análisis……………………………………………………………93 3.3.1 Test Estadístico………………………………………………………..93 3.3.2 Estrategia de Análisis: niveles de agregación………………………....93

    3.4 Análisis multinivel para Lenguaje y Matemática……………………………..94

    v

  • 3.4.1 Las diferencias geográficas y del rendimiento escolar para

    Lenguaje y Matemática………………………………………………95 3.4.2 Modelo Nulo para Lenguaje………………………….……...……….95 3.4.3 Modelo Multinivel geográfico para Lenguaje…………………….….99 3.4.4 Modelo Nulo Matemática………………………………….…..……104 3.4.5 Modelo Multinivel geográfico para Matemática………….………...104

    3.5 La familia y el contexto de la escuela……………………………………….106 3.6 Cultura institucional y práctica en el aula…………………………………...116 3.7 Modelo optimal de factores asociados al rendimiento en Lenguaje

    y Matemática……………………………………………………….…...…...121 3.7.1 Las variables…………………………………………………………122 3.7.2 Modelo óptimo para Lenguaje………………………………………123 3.7.3 Modelo óptimo para Matemática…………………………………….129 3.7.4 La diagnosis del modelo mediante los residuos para el nivel 1……...134 3.7.5 La diagnosis del modelo mediante los residuos para el nivel 2……...136

    Capítulo IV: Conclusiones…………………………………………………………138

    4.1 Conclusiones para Lenguaje…………………………………………………139 4.2 Conclusiones para Matemática………………………………………………141

    REFERENCIAS BIBLIOGRÁFICAS……………………………………………143 ANEXOS……………………………………………………………………………146

    vi

  • INTRODUCCIÓN

    Actualmente es frecuente encontrar en diversas investigaciones de las áreas de la

    educación y de la salud el uso de la Teoría de Modelos Multinivel como alternativa

    metodológica de acercar el contexto del individuo a la explicación de la causalidad. Lo

    que se pretende con esta metodología es representar de una manera precisa aquellos

    fenómenos en los que la recogida de datos presenta una estructura anidada. En ese

    sentido el modelo multinivel tiene en cuenta el agrupamiento de los individuos en otras

    unidades, es decir, donde no solo se han seleccionado una serie de sujetos, sino también

    una serie de unidades contextuales a los que éstos pertenecen, tales como: hospitales,

    clases, escuelas, municipios, empresas u otras instituciones; situaciones en las que se

    tienen estructuras particulares de los datos, las cuales no pueden ser considerados en un

    análisis de regresión clásico; en caso que se utilice este tipo de regresión se llegaría a las

    siguientes consecuencias: la producción de sesgos en los errores típicos de los

    estimadores y el aumento de la probabilidad de rechazar la hipótesis nula de no

    asociación, cuando ésta es cierta.

    Conceptualmente, los modelos multinivel son básicamente un modelo de regresión de

    efectos mixtos, en donde se estudia una relación lineal entre dos o más variables en

    estudios realizados mediante un muestreo por agrupamiento, es decir, una técnica

    correlacional adecuada para analizar variaciones en las características de los sujetos que

    son miembros de un grupo que a su vez, hace parte de otra agrupación, o sea, mediciones

    que forman una estructura agrupada y jerárquica. El modelo permite la descomposición

    de la variación de una variable criterio (como por ejemplo, rendimiento) en sus

    componentes “dentro del grupo” (dentro-escuela, dentro-departamentos) y “entre grupo”

    (entre-escuela, entre-departamento) y el análisis de la asociación entre variables en esos

    niveles de agregación.

    vii

  • Todos estos aspectos serán abordados en el presente trabajo de graduación que está

    estructurado en cuatro capítulos: introducción a la teoría multinivel, teoría de modelos

    multinivel, aplicación y conclusiones. Como énfasis de una comprensión conceptual y

    práctica de cómo utilizar esta técnica estadística cuando se tiene una situación anidada en

    los datos.

    En el primer capítulo se presentan los antecedentes de los modelos multinivel, el modelo

    de ecuación estructural y se define el modelo multinivel como un modelo de regresión de

    efectos mixtos, en donde se estudia una relación lineal entre dos o más variables en

    estudios realizados mediante un muestreo por agrupamiento.

    En el segundo capítulo se estudian los supuestos tanto de un modelo de regresión simple

    como un modelo multinivel de dos y de tres niveles, además se presenta el método de

    estimación de los parámetros para el modelo de componentes de varianza y la estimación

    de los parámetros fijos y aleatorios del modelo multinivel de dos y tres niveles a partir de

    los enfoques ANOVA (Análisis de varianza) y ANCOVA (Análisis de covarianzas).

    En el tercer capítulo se desarrolla una aplicación de los modelos multinivel, disponiendo

    de la base de datos de un estudio realizado en diversos países de Latinoamérica, el cual

    consistió en aplicar un instrumento de recolección de información a: alumnos, profesores,

    padres de familia y escuela. El objetivo de esta aplicación es identificar las condiciones

    en las que los alumnos de tercero y cuarto grados de educación básica, alcanzan los

    aprendizajes en Lenguaje y Matemática, según el resultado registrado en pruebas

    estandarizadas. Esto, para buscar un modelo óptimo de Lenguaje y Matemática, de tal

    manera que se logre encontrar cuales son los factores asociados al rendimiento de los

    estudiantes en la prueba de Lenguaje y Matemática.

    En el cuarto capítulo se concluye a partir de la aplicación realizada con la técnica

    multinivel tanto para Lenguaje y Matemática. Se presenta además, un ejemplo de

    predicción de la puntuación que obtendría un estudiante en Lenguaje y Matemática

    basado en el contexto en el que vive y se desenvuelve académicamente.

    viii

  • Finalmente dentro de este trabajo se presentan los anexos de algunas corridas realizadas

    en el software HLM (Modelos Jerárquicos Lineales) y las referencias bibliográficas que

    se utilizó para el desarrollo de este trabajo de graduación.

    ix

  • CAPÍTULO I INTRODUCCIÓN A LA TEORÍA DE MODELOS MULTINIVEL. Introducción.

    A lo largo de la historia los problemas del mundo real han sido abordados desde

    diferentes perspectivas. Muchas disciplinas han contribuido a su conceptualización, de

    hecho, sus características diferenciadoras en los distintos momentos históricos se han ido

    perfilando desde la filosofía hasta la política, pasando por las aportaciones de la

    psicología, de la economía y de la teoría de la organización. Pero no ha sido hasta el siglo

    XX cuando se ha realizado un intento sistemático en construir un cuerpo de conocimiento

    sobre los problemas y sobre los fenómenos que en el se dan.

    Este capítulo esta estructurado de la siguiente manera:

    Antecedentes de los modelos multinivel: aquí se presentan las metodologías que

    fueron fundamentales para el nacimiento de esta teoría, tales como: el modelo de

    Cronbach, causal y de regresión múltiple.

    El modelo de ecuación estructural: este es un modelo que permite separar las

    relaciones para cada conjunto de variables dependientes. Describiendo además los

    problemas que este modelo permite atacar, como: validez de las relaciones causales,

    interrelaciones y medida.

    1

  • La naturaleza de los modelos multinivel: se define el concepto de lo que es en si la

    teoría multinivel, el cual hace referencia a un modelo de efectos mixtos, donde se

    estudia una relación lineal entre dos o más variables en estudios realizados mediante

    un muestro por agrupamiento, es decir, una técnica correlacional adecuada para

    analizar variaciones en las características de los sujetos que son miembros de un

    grupo que a su vez, hace parte de otra agrupación, o sea, mediciones que forma de

    una estructura agrupada y jerárquica. Mencionando además a diversos autores que

    han aplicado el análisis multinivel en áreas de la educación, salud, epidemiología, etc.

    Todo con el fin de buscar la conexión entre las características del individuo y el

    contexto social en que se desenvuelve.

    Conjeturaciones previas al análisis multinivel: en este apartado se describe a groso

    modo que la teoría multinivel es una metodología fundamentalmente estadística para

    el análisis de datos que presentan una estructura jerárquica, y principalmente cuando

    los datos se han obtenido a través de la técnica de muestro por conglomerado.

    Enfoques multinivel basado por el análisis de regresión múltiple, ANOVA y

    ANCOVA: se estudian los conceptos sobre el análisis de varianza y de covarianza,

    que son fundamentales para estimar los componentes de varianza, para luego estimar

    los parámetros tanto fijo y aleatorios de un modelo multinivel de dos y tres niveles.

    El error de Medida: se menciona lo relacionado al error de medida, además de

    describir algunas metodologías claves para tratar el error de medida en diversos

    estudios de investigación.

    2

  • 1.1 ANTECEDENTES DE LOS MODELOS MULTINIVEL. En la actualidad los investigadores se ven obligados a recoger un gran número de

    medidas para poder captar de forma adecuada la complejidad de los fenómenos del

    mundo real, e indagar o buscar un modelo estadístico. De tal manera, que nos permita

    tomar una connotación específica sobre su estructura, las relaciones entre sus

    componentes, su funcionamiento y los cambios que experimenta el sistema en su

    totalidad o en sus componentes. Los conocimientos generales por una investigación en

    particular, se unen a otros conocimientos ya existentes, acumulados durante mucho

    tiempo por otros investigadores, sea en la forma de aporte original o como confirmatorio

    de hallazgos ya existentes. Cualquiera que sea la situación que se enfrente, la

    investigación es siempre la búsqueda de la solución a algún problema de conocimiento.

    La construcción de modelos estadísticos o modelos matemáticos aplicados se incluye

    dentro de lo que ha venido a denominarse modelación estadística (“statistical

    modelling”). Como señala Lindsey (1993), con el modelo estadístico se pretende

    descubrir la variabilidad en los datos observados mediante procedimientos matemáticos.

    Además, se formula en términos del o los constructos hipotéticos que no se pueden

    observar o medir directamente. Ejemplo de tales contructos son: la confianza,

    autoestima, discriminación, rendimiento, motivación, capacidad, etc. Sin embargo, para

    definir los constructos hipotéticos se debe primero incluir la clasificación de esos

    constructos como dependientes (causado, criterio, endógeno) o independiente (causal,

    explicativo, exógeno). En segundo lugar, para cada constructo dependiente, la teoría

    especifica cuales de los otros constructos se postula para ser dependiente. La

    construcción puede también incluir una declaración sobre la muestra y/o el tamaño

    relativo del efecto directo de un constructo en otra.

    Las dos relaciones claves para la construcción del modelo estadístico son: la primera es

    que las relaciones entre construcciones hipotéticas constituyen la pieza estructural del

    modelo y la segunda es que las relaciones entre indicadores o variables observables y

    constructos teóricos constituyen la pieza fundamental de la medida del modelo.

    3

  • En todo caso la construcción de un modelo estadístico consistirá en una serie de procesos

    encaminados a explicar el comportamiento de una variable respuesta, relacionado con

    indicadores exógenos. Sin embargo, debido a que la explicación de la variable criterio en

    función de las variables exógenas no es perfecta, se incluye un término residual, es decir,

    el término del error que puede estar formado por los efectos de otros indicadores sobre

    las variables endógenas, por errores de medición, etc. Además, la variable o nivel

    independiente del tratamiento se supone que es fijado por el experimentador (valores

    conocidos).

    Desde el punto de vista cualitativo, al explicar el comportamiento de la variable

    respuesta, se pueden tener tres posibles modelos diferentes, a saber:

    a) Que la variabilidad observada en los datos sea totalmente explicada por el

    modelo, lo cual daría lugar a considerarlo como un modelo absolutamente

    determinístico y formal.

    b) Que la variabilidad observada en los datos sea totalmente explicada por factores

    aleatorios, lo cual daría lugar a un modelo aleatorio, la base del cual puede

    encontrarse en la ejecución de errores de muestreo, de medida o debido a las

    características inherentes del sistema observado.

    c) Que la variabilidad observada en los datos necesite de la participación de factores

    sistemáticos y aleatorios, lo que da lugar a los modelos probabilísticos o

    estocásticos.

    La modelación estadística consiste en buscar un modelo que genere los datos con un

    mínimo error posible. Según Arnau, 1981; las etapas de la modelación estadística en

    esencia vienen a englobar los mismos contenidos, pudiéndose resumir como las

    siguientes: identificación, estimación, validación y metadiagnóstico.

    4

  • Una vez entendido el modelo estadístico tradicional, lo que se pretende ahora es poder

    representar de una manera precisa aquellos fenómenos en los que la recogida de datos

    presenta una estructura anidada. En ese sentido el modelo multinivel tiene en cuenta

    el agrupamiento de los individuos en otras unidades, es decir, donde no solo se han

    seleccionado una serie de sujetos, sino también una serie de unidades contextuales a

    los que éstos pertenecen, tales como: hospitales, clases, escuelas, municipios, empresas

    u otras instituciones; situaciones en las que se tienen estructuras particulares de los

    datos, las cuales no pueden ser considerados en un análisis de regresión clásico; en

    caso que se utilice este tipo de regresión se llegaría a las siguientes consecuencias: la

    producción de sesgos en los errores típicos de los estimadores y el aumento de la

    probabilidad de rechazar la hipótesis nula de no asociación, cuando ésta es cierta.

    A continuación se presentan ciertas metodologías que fueron fundamentales para el

    inicio del estudio del análisis multinivel.

    i) Modelo de Cronbach (Cronbach y Webb, 1975):

    Este modelo propone obviar el problema de multicolinealidad en los datos, logrando dar

    una mejor interpretación en los parámetros de dicho modelo. Es un modelo de regresión

    donde las variables individuales están centradas en la media de su grupo y variables

    contextuales centradas en la media global.

    En términos matemáticos este modelo se resume de la siguiente forma:

    ( ) ( ). . . ..1 2i ij j jijy x x x x xα γ ijβ β ε= + + − + − +

    Donde es la variable de i-ésimo individuo en el j-ésimo grupo, es la media del

    grupo j-ésimo y

    ijx . jx

    ..x es la media global.

    5

  • ii) Análisis Causal.

    La filosofía define el término causalidad como una ley en virtud de la cual se producen

    efectos. El principio de causalidad establece la conexión entre causa y efecto, y es uno de

    los fundamentos del conocimiento humano. Por ello la causalidad es considerada como

    una ley natural de absoluta validez.

    La esencia del análisis causal reside en la unificación de los comportamientos de los

    componentes de un sistema para deducir el comportamiento del sistema global. Estos

    comportamientos deben ser comprendidos en el contexto de sistema global, atendiendo a

    las conexiones entre los componentes que constituyen el sistema. Por otra parte el

    comportamiento de cada parte del sistema permite la realización de una función, y

    subfunciones. Tal identificación de los subsistemas con funciones conocidas ayuda al

    análisis causal.

    La utilización del modelo causal tiene cierta tradición en el área de la prevención de

    riesgos laborales de trabajos originales de Meliá (1998). En la construcción de este

    modelo, se parte de la distinción de los modelos causales de los accidentes en dos grandes

    categorías: los modelos secuenciales (que tratan la cadena de eventos que conducen al

    accidente) y los modelos estructurales (que desarrollan la interacción persona-máquina).

    El modelo causal (ver figura 1.1) psicosocial responde a un planteamiento integrador de

    los factores organizacionales y de naturaleza psicosocial. Las variables que incluye son

    las siguientes:

    • Clima de seguridad: variable que el ambiente de seguridad existente en la empresa

    e impulsado por la dirección de la organización.

    • Riesgo basal: concepto asociado a la actividad de la empresa, reflejando los

    riesgos inherentes y específicos a una determinada industria o tipo de tarea.

    6

  • • Respuesta de los superiores: variable que recoge la conducta y actitud de los

    supervisores en materia de seguridad, así como los mecanismos de comunicación

    y de contingencia, en el contexto de la prevención.

    • Respuesta de los compañeros: factor psicosocial que trata de medir la respuesta

    frente a problemas de seguridad por parte de los compañeros, en base al tipo de

    respuesta y su frecuencia.

    • Conducta hacia la seguridad del trabajador: descrita mediante comportamientos

    específicos tales como orden, cumplimiento de las normas, utilización de

    maquinaria defectuosa, etc.

    • Riesgo basal: variable que refleja el riesgo de una determinada tarea en su

    contexto, con independencia de las acciones en materia de prevención del riesgo

    que adopte el trabajador que la realice.

    • Riesgo real: mide la probabilidad de ser víctima de un accidente de trabajo.

    Obsérvese que esta variable recoge los efectos tanto de las conductas como de las

    condiciones de trabajo (riesgo basal).

    • Accidentalidad: variable criterio indicador de la existencia de un accidente.

    Medida mediante el número de accidentes laborales sufridos por el trabajador en

    los últimos cinco años.

    Un análisis causal psicosocial de los accidentes laborales (Meliá, 1998) se aplica a una

    muestra de 316 trabajadores, con contrato mercantil o fijos, representando una variedad

    de sectores industriales, propiedad (públicas y privadas), características organizativas y

    ámbito de actuación (local, regional, nacional y multinacional). El modelo se ajusta

    correctamente, ofreciendo parámetros con el signo acorde con las hipótesis realizadas,

    una mayoría son estadísticamente significativos (sólo dos incumplen esta premisa).

    7

  • Como conclusión, el autor indica que el modelo confirma que la variable clima de

    seguridad (impulsada por la gestión) influye sobre la conducta hacia la seguridad, directa

    e indirectamente a través de la respuesta de superiores y compañeros. De igual forma, el

    modelo muestra relaciones directas consistentes de la conducta y el riesgo basal sobre el

    riesgo real que, a su vez, influye sobre la accidentalidad.

    Figura 1.1: Modelo causal psicosocial de los accidentes laborales.

    Pascual (1993), dio otro gran aporte al análisis causal, al desarrollar en el área de la

    educación, el liderazgo transformacional de Bass (1985), sosteniendo así tres premisas

    claves de por qué el liderazgo es un indicador fundamental en la mejora de la eficacia de

    los centros educativos, distinguiendo teóricamente dos grandes estilos de liderazgo, lo

    que se denomina liderazgo transformacional y liderazgo transaccional, así mismo habla

    de un tercer comportamiento directivo al que da el nombre de no liderazgo. Así, define el

    liderazgo transformacional como aquel formado por carisma, consideración individual,

    estimulación intelectual, inspiración y en el caso de la organización escolar agrega un

    factor denominado tolerancia psicológica.

    Según el modelo causal de liderazgo planteado por Pascual, a groso modo se clasifican

    tres niveles. Por un lado variables relativas al nivel de colaboradores (ejemplo: la

    satisfacción de los colaboradores con el líder, la disposición de realizar un mayor

    esfuerzo por incrementar la calidad de trabajo, etc.). En el segundo nivel, variables

    8

  • relativas a los efectos directos en la organización como puede ser la eficacia organizativa

    del centro, la capacidad de cambio en el centro, etc. Por último los efectos que puede

    tener el liderazgo en las actitudes de los alumnos. De modo que este modelo causal

    considera como unidad de análisis el centro educativo, pretendiendo así, saber cuales eran

    las variables relevantes a nivel de organización que aglutinan una serie de otras variables

    más específicas y que pudieran ser efectos directos relacionados con el ejercicio de un

    liderazgo transformacional.

    Teniendo presente, por un lado el enfoque teórico de Bass, y por otro aquellas variables

    más relevantes que se asocian con el liderazgo en los centros educativos como variables

    mediadoras la participaron y la satisfacción con el trabajo docente en el centro, variables

    de control a nivel de centros (tamaño del centro, tipo del centro). Lo que se trata es

    establecer un modelo causal que sea una explicación plausible de los efectos del

    liderazgo sobre la eficacia escolar.

    A continuación se presenta la especificación inicial del modelo relacional de liderazgo y eficacia escolar que pretendemos validar.

    Tabla 1.1: Constructos y dimensiones del modelo de liderazgo transformacional de Bass.

    Carisma personalizante

    Consideración Individual

    Estimulación Intelectual Inspiración

    Tolerancia Psicológica

    Entusiasmo Trato personal Animación al cambio Implicación Humor

    Credibilidad Apoyo Potenciación de un mayor esfuerzo Identidad

    El principio de validez del modelo causal es a través del sistema de ecuaciones

    estructurales. Donde las variables que conforman un constructo complejo, como es el

    liderazgo, y que en nuestra propuesta se estructura como una variable independiente, se

    denomina variable latente exógena. Mientras que aquellas variables que aparezcan

    asociadas, tanto directa como indirectamente a los efectos de un liderazgo

    transformacional, y cuyas varianzas intentamos explicar, recibe el nombre de variables

    latentes endógenas.

    9

  • Sin embargo, los estudios realizados mediante un análisis causal no son sencillos, el rigor

    científico requiere, entre otros, la realización de “experimentos”. Estos experimentos

    precisan la formación de dos o varios grupos (de tratamiento y de control) por asignación

    aleatoria.

    Por tanto, para la realización de un modelo causal donde los diseños sean

    cuasiexperimentales y no experimentales 1, se necesita el uso de modelos causales no-

    experimentales (modelos de estructuras de covarianzas o de ecuaciones estructurales) ya

    que en su planteamiento tradicional, adolecen de ciertos problemas a la hora de asegurar

    la validez de la relación causal, interrelación integra efectos interrelacionados y tratar con

    los problemas de medida. Esto se tratará a profundidad en el siguiente apartado de este

    capítulo.

    Murillo (1990) hace sus consideraciones sobre la utilización del analisis causal,

    destacando dos graves inconvenientes, uno de carácter práctico, que tiene gran dificultad

    para que se ajusten los datos a un modelo, y otro de carácter Técnico, que no tiene en

    cuenta la situación jerárquica de los datos. De hecho, es una alternativa muy poco

    utilizada en la investigación sobre organizaciones y más en el campo psicológico.

    iii) Modelo de regresión múltiple.

    La regresión múltiple es el método de análisis apropiado cuando el problema del

    investigador incluye una única variable métrica dependiente que se supone está

    relacionada con una o más variables métricas independientes. El objetivo del análisis de

    la regresión múltiple es predecir los cambios en la variable dependiente en respuesta a

    cambios en varias de las variables independientes. Este objetivo se consigue muy a

    menudo a través de la regla estadística de los mínimos cuadrados.

    1 Meliá JL. Un modelo causal psicosocial de los accidentes laborales. Anuario de Psicología 1998; 29(3): 25-43.

    10

  • Aunque el uso de esta técnica ha sido común desde los inicios de la investigación sobre

    eficacia, con el tiempo ha experimentado algunos cambios en su aplicación. Como es, el

    utilizar estas técnicas a partir de distintos predictores, introduciendo la aplicación al

    cálculo de los residuales de regresión, tomando como base características individuales de

    los sujetos o medias ponderadas de las escuelas.

    Por ejemplo, en estudios del área de la educación, el uso de las puntuaciones residuales se

    realiza como medida de la eficacia de la escuela a través de la diferencia entre las

    puntuaciones predicha a partir de las características individuales del sujeto (nivel

    socioeconómico, nivel cultural de los padres, rendimiento previo, etc.) y la puntuación

    obtenida realmente por el mismo. Tiene la ventaja de que evita los sesgos que se

    producen en la estimación de los efectos de los tratamientos cuado los grupos no son

    equivalentes, aunque es evidente que no se realiza un ajuste total para todas las

    diferencias entre las escuelas. Para Castejon (1994), la técnica de residuales más

    adecuado para la identificación de escuelas eficaces, estableciendo cuatro formas de

    llevar a cabo los análisis de datos y de regresión (modelo dentro de la escuela); por otra,

    el análisis puede ser "ponderado" o "no ponderado" según el número de sujetos

    pertenecientes a cada escuela. En el análisis empírico que realiza para comparar cada uno

    de los cuatro índices de eficacia, cada uno de ellos a partir de: a) puntuaciones residuales

    a partir de la ecuación de regresión múltiple con datos de los centros; b) puntuaciones

    residuales a partir de la ecuación de regresión múltiple con datos de los centros obtenidos

    a partir de la media ponderada de los sujetos; c) medias de las puntuaciones residuales

    para cada alumno a partir de la ecuación de regresión; d) igual que el anterior, con la

    media residual estandarizada para cada alumno a partir de la ecuación de regresión.

    Examinado además la consistencia entre dichos índices, concluye poniendo de manifiesto

    la existencia de centros cuyo rendimiento supera el predicho y, por tanto, muestran un

    efecto significativo, aunque moderado, de la escuela, coincidiendo con los resultados

    obtenidos por otros autores, y, por otra parte, el alto nivel de consistencia y concordancia

    entre los índices resultantes. Sin embargo, los cuatro índices comparados tienen serios

    problemas debido a la utilización del análisis de regresión, donde los datos presentan una

    estructura anidad. Llegando así, a poder concluir de forma errónea.

    11

  • 1.2 EL MODELO DE ECUACIÓN ESTRUTURAL.

    El modelo de ecuaciones estructurales se podría definir como un modelo causal no-

    experimental que permite separar las relaciones para cada conjunto de variables

    dependientes. En su aceptación más simple, el modelo de ecuaciones estructurales

    proporciona la técnica de estimación más adecuada y eficiente para series de estimación

    de ecuaciones simultáneas mediante regresiones múltiples.

    El uso de este tipo de modelos causales permite atacar los problemas de interrelación, de

    medida y validez de la relación causal.

    Validez de las relaciones causales: el interés y la peculiaridad de las relaciones

    causales radican en el elemento de “producción” o “fuerza” que la causa tiene

    sobre el efecto. En el estudio de este tipo de relaciones suelen considerarse como

    necesarias las tres condiciones de John Stuart Mill2.

    • Covariación entre las presuntas causa y efecto.

    • Precedencia temporal de la causa.

    • Ausencia de explicaciones alternativas para la relación.

    El cumplimiento de estas condiciones, y principalmente la tercera de las mismas, es el

    que lleva a la necesidad de realizar diseños experimentales, diseños en los que se aíslan

    las unidades a estudiar (ausencia de alternativas) y se realiza una prueba controlada

    (precedencia) para, posteriormente, examinar el efecto (covariación).

    Sin embargo existe un enfoque alternativo al análisis experimental, que consiste en

    formular la teoría incluyendo todas las variables que son importantes a juicio del

    investigador. La formulación así realizada determina la estructura de la matriz de

    covarianzas de todas las variables, estructura que es contrastable.

    2 Cook TD, Campbell DT. Quasi-experimentation. Design and Analysis Issues for Field Settings. Rand McNally College Publishing: Chicago, 1979.

    12

  • De esta forma, se dispone de un instrumento que permite rechazar la teoría si los datos no

    soportan las conclusiones deducidas. Dicho de otra manera, se tiene un método de

    refutación en investigación no experimental.

    Interrelaciones: El problema de las interrelaciones resulta de menor importancia

    que los otros dos. Una vez que se ha especificado cuidadosamente la teoría, la

    técnica del análisis de la covarianza permite resolver el problema.

    La especificación de la teoría requiere incluir todas las variables importantes, el problema

    es ¿dónde parar?. Un posible procedimiento consiste en ir incluyendo las variables que

    son causa común de cada par de variables causa-efecto, siempre que al menos una de las

    dos esté incluida en la hipótesis original.

    Figura 1.2: Derivación de las teorías causales.

    La figura 1.2 ilustra este procedimiento. La hipótesis inicial se muestra en la fig. 2.a. A

    partir de dicha hipótesis, se buscan otras variables que sean causa común de cada par de

    variables causa-efecto. En la ilustración aparecen dos nuevas variables (u, v), que

    aparecen como causa común de las variables originales (x,y), fig. 2.b. Como ambas

    13

  • variables x e y están representadas en la hipótesis original, las nuevas variables deben

    explicitarse en el modelo. A continuación volvemos a examinar cada par de variables

    causa-efecto; en este examen aparecen dos nuevas variables (w,z), fig. 2.c. La variable w

    es causa común de las variables x,u; como x está incluida en la hipótesis original,

    explicitamos w en el modelo. Sin embargo, la variable z es causa común de las variables

    u,v; como ninguna de estas variables aparece en la hipótesis inicial, el procedimiento

    indica que esta variable no es necesario explicitarla. Por último, fig. 2.d, todas las

    variables que no son efecto de ninguna otra (w,v), variables predeterminadas o exógenas,

    se unen con un arco con flechas en los dos extremos, indicando que pueden existir otros

    efectos, más lejanos, no explicitados en el modelo. Evidentemente, la explicación de la

    variable u será incompleta (no hemos incluido a z en el modelo), algo que resulta

    secundario para validar la hipótesis inicial (Fig. 2.a).

    Problemas de medición: según el modelo causal sobre la prevención de riesgos

    laborales3. Los problemas de medida en este tipo de modelos tienen dos orígenes:

    por un lado, la información sobre prevención de riesgos laborales puede ser

    interpretada de distinta manera por diferentes sujetos y, por lo tanto, estar sujeta a

    error; por otro lado, los conceptos organizacionales (tales como clima de

    seguridad, motivación, comportamiento, etc.) son difíciles de evaluar con una

    única variable. Una de las características de la metodología que se propone es que

    permite tratar fácilmente ambos problemas.

    Para terminar de entender mejor la metodología, los modelos de ecuaciones estructurales

    utilizan una representación simbólica: los diagramas de trayectoria (path diagrams),

    gráficos en los que causa y efecto se unen mediante flechas dirigidas, a continuación

    presentamos como ejemplo un digrama path extraido de un estudio de factores asociados

    al rendimiento de los estudiantes que se sometieron a la PAES 20004.

    3 Dalrymple H, Redinger C y otros. Occupational Health and Safety Management Systems: Review and Analysis of International, National, and Regional Systems and Proposals for a New International Document. Informe preparado por The International Occupational Hygiene Association para la OIT: Ginebra, 1998. 4 Carlos Roberto Briones et al., Factores asociados al rendimiento de los estudiantes que se sometieron a la PAES 2000. Pág. 84-85. Ministerio de Educación, Dirección Nacional de Monitoreo y Evaluación. El Salvador.

    14

  • En el diagrama de la figura 1.3, se consideran tres aspectos importantes que tienen

    relación con los factores demográficos: “edad”, en términos de si se está o no en el tramo

    “normal” para el momento de someterse a la prueba, o bien si hay atraso en el

    bachillerato o adelanto; “relación de masculinidad”, que da la proporción hombre/mujer

    en el conjunto de alumnos”, qué alumnos trabajan y estudian o solamente estudian. En

    dicho diagrama se observa que la edad aparece como el factor demográfico más

    importante (beta=-0.252): a mayor edad, menor resultado en la prueba, e indica la

    importancia de que no se produzcan retrasos en cursar el bachillerato y que se logre

    retener al alumnado.

    En su conjunto, los factores demográficos considerados permiten explicar un 8%

    (smc=0.08) de las variaciones de los resultados globales de la PAES.

    Figura 1.3: Diagrama Path de factores demográficos.

    Edad

    El modelo de ecuación estructural se caracteriza por dos componentes básicos: el modelo

    estructural y el modelo de medida. El modelo de medida permite al investigador usar

    varias variables (indicadores), para una única variable dependiente o independiente. Por

    ejemplo, la variable dependiente puede ser un concepto representado por una escala

    aditiva, tal como el amor propio.

    En el modelo de medida el investigador puede evaluar la contribución de cada ítem de la

    escala así como incorporar como la escala mide el concepto (fiabilidad) en la estimación

    Masculinidad

    Labor

    Factores demográficos

    Error-0.252

    0.10

    0.0

    Smc: 0.08 -0.11

    15

  • de las variables dependientes e independientes. Este procedimiento es similar al

    desarrollo del análisis factorial de los ítems de la escala y utiliza las cargas factoriales en

    la regresión.

    En tal caso, el modelo estructural es el modelo “guía”, que relaciona variables

    independientes y dependientes. En tales situaciones, la teoría, antes que la experiencia u

    otras directrices, permitiera al investigador distinguir qué variables independientes

    predicen cada variable dependiente. Los modelos previamente discutidos que incluyen

    múltiples variables dependientes (análisis multivariante de la varianza y correlación

    canónica) no son apropiados en esta situación. Dado que permiten sólo una única relación

    entre variables dependientes e independientes.

    1.3 LA NATURALEZA DE LOS MODELOS MULTINIVEL.

    Actualmente es frecuente encontrar en los estudios más importantes del mundo científico

    y, en general, en los del área de la salud y educación. El uso de los modelos multinivel

    como alternativa metodológica de acercar el contexto del individuo a la explicación de la

    causalidad. Las causas que se asocian a la ocurrencia de un evento en salud,

    frecuentemente se estudian de manera estática en el sentido de que no se tiene en cuenta

    el análisis prospectivo o retrospectivo del ambiente social o cultural que rodea al

    individuo, debido a definiciones importantes, tales como ausencia de variables,

    imposibilidad de relacionar el contexto o el ambiente o dificultades en la aplicación

    metodológica, entre otras.

    Esto ha implicado que el investigador llegue a sentirse potencialmente incapaz de

    explicar metodológicamente las causas de uno o varios eventos, puesto que

    frecuentemente se omiten características importantes que pertenecen a la dinámica

    ecológica donde interactúa el individuo, como el ambiente del trabajo, la comunidad, la

    familia y los aspectos culturales y sociales, entre otros.

    16

  • Recientemente, las ciencias sociales y la epidemiología han intentado suplir la necesidad

    de una explicación más global de la morbilidad o la mortalidad, buscando la conexión

    entre las características del individuo y el contexto social en el que este se desenvuelve.

    Resultados obtenidos mediante la técnica del análisis multinivel han sido importantes

    dentro de muchos campos de la investigación, por ejemplo Bryk AS (1992) dando un

    aporte a la teoría multinivel, relacionando en un primer momento una variable respuesta

    cuantitativa con las características individuales del estudiante y variables asociadas al

    ambiente escolar mediante un conjunto de variables exploratorias de uno y otro nivel de

    jerarquía. Este modelo lo definió como modelo lineal de coeficientes aleatorios.

    Sandoval JJ. (2001), a dado otro aporte a epidemiología, al desarrollar un modelo

    multinivel con el objeto de estudiar la sociedad y las diferentes formas de organización

    social que afectan la salud de los colectivos humanos y su bienestar. En particular,

    estudia la frecuencia, la distribución de los estados de salud en las poblaciones y su

    relación con los determinantes sociales, de tal manera que va más allá del análisis de los

    factores de riesgo individuales e incluye también estudios en el contexto social de los

    individuos en el cual se produce el fenómeno salud-enfermedad. Como lo señala Dodge

    KA (2002), algunos estudios epidemiológicos han mostrado principios metodológicos de

    cómo estudiar las relaciones que los grupos poblacionales, el ambiente, las comunidades

    y la sociedad en general tienen con la agresividad en niños. Es por ello que el estudio

    realizado por Sandoval (2001) sobre el comportamiento agresivo y pro-social en niños,

    en concordancia con las características individuales y los factores sociales relacionados

    con las escuelas. Se estimaron las relaciones de las variables ajustado por los síntomas de

    hiperactividad con déficit de atención y la edad del niño. La variable endógena está

    conformada por los síntomas de agresividad indirecta, variable cuantitativa con nivel de

    medición de intervalo, constituida mediante las puntuaciones factoriales de los resultados

    del dominio “síntomas de agresividad indirecta”. El modelo relacionó la variable

    respuesta cuantitativa con las características individuales del estudiante y las asociadas al

    ambiente escolar mediante un conjunto de variables explorativas de uno y otro nivel de

    17

  • jerarquía. El modelo describió las variables exploratorias en cada nivel, controlando por

    los posibles efectos de confusión.

    Otros autores como Maas, Cora J.M., and Snijders, Tom A.B., (2003) han dado un mayor

    acercamiento al análisis multinievel, especialmente al caso de medidas repetidas para

    datos completos e incompletos, donde, comúnmente son analizados a menudo por el

    análisis de variación multivariante (MANOVA). Dando así una mayor estimación

    mediante el modelo lineal jerárquico (HLM) mediante el uso de los modelos de efectos

    aleatorios.

    El análisis de datos mediante estos modelos es capaz de apresar dicha estructura, como

    menciona Goldstein (1995) cada uno de los niveles de la estructura jerárquica es

    representado formalmente con su propio submodelo. Cada submodelo expresa las

    relaciones entre variables dentro de un determinado nivel y el conjunto de submodelos

    especifica de qué modo variables de un nivel influyen en las relaciones que ocurren a otro

    nivel distinto, quedando de este modo formalizada esta estructura anidada de los datos.

    Definición de los modelos multinivel.

    Los modelos multinivel son básicamente un modelo de regresión de efectos mixtos, en

    donde se estudia una relación lineal entre dos o más variables en estudios realizados

    mediante un muestro por agrupamiento, es decir, una técnica correlacional adecuada para

    analizar variaciones en las características de los sujetos que son miembros de un grupo

    que a su vez, hace parte de otra agrupación, o sea, mediciones que forman una estructura

    agrupada y jerárquica. El modelo permite la descomposición de la variación de una

    variable criterio (como por ejemplo, rendimiento) en sus componentes “dentro del grupo”

    (dentro-escuela, dentro-departamentos) y “entre grupo” (entre-escuela, entre-

    departamento) y el análisis de la asociación entre variables en esos niveles de agregación.

    18

  • Los modelos multinivel permiten además estimar un conjunto separado de

    establecimientos de efectos de coeficientes para cada unidad organizacional, y luego

    modelar las variaciones en el conjunto de coeficientes de las organizaciones como

    productos multivariados a ser explicados por factores organizacionales (recursos de los

    centros educativos). Por ejemplo, a partir del nivel de los estudiantes se estiman puntajes

    promedios de logro de los centros, los que en un segundo nivel se correlacionan con

    diferentes características de éstos, es decir, los modelos multinivel ofrecen distintas

    alternativas que se traducen en ventajas respecto de los modelos tradicionales en una

    población cuya naturaleza sea anidada dentro de contexto, dando una versión más realista

    ya que modelan cada nivel de jerarquía y no requieren de la independencia entre los

    grupos.

    El análisis multinivel se ha extendido y generalizado el análisis de varianza introducido

    por Fisher (1880-1962), surgiendo en contextos de aplicaciones diversas, ejemplo en

    educación un investigador educativo puede, ir a un grupo de escuelas y recoger datos

    sobre el nivel socioeconómico de los alumnos y su rendimiento académico, a fin de

    contrastar si existe una relación funcional entre ambas variables. Tendríamos así dos

    tipos de unidades experimentales: el sujeto y la escuela, correspondiente a lo que la

    literatura se denomina también como primer y segundo nivel de análisis. En el caso del

    sujeto, la variable de interés es el rendimiento académico. En el caso de las escuelas, las

    variables de interés son sus respectivas medias y pendientes de asociación entre el nivel

    socioeconómico y rendimiento, expresados mediante los estimadores de sus rectas de

    regresión.

    Básicamente, como señala Burnstein et, al. (1981), el principal interés consistirá en

    modelizar los resultados intra-organización como funciones sistemáticas tanto de

    características individuales, como de variaciones entre contexto o entre grupos. Es decir,

    constatará si existe variabilidad en las rectas de regresión entre las distintas escuelas. De

    esa manera, y mediante una consideración integrada de ambos niveles de análisis, se

    pretende cuantificar y contrastar hipótesis estadísticas acerca de la incidencia de los

    19

  • distintos contextos académicos en el rendimiento escolar y en su relación con el nivel

    socioeconómico del alumno.

    En la investigación multinivel como ya hemos mencionado se ocupa del análisis de datos

    donde las observaciones se jerarquizan dentro de grupos. Entonces, las variables se

    pueden definir en cualquier unidad de análisis de la jerarquía. Algunas de estas variables

    se pueden medir directamente en su nivel natural; por ejemplo, en los resultados

    académicos de un estudiante se identifican minimamente dos niveles: nivel 1,

    características del estudiante; nivel 2, características de la institución educativa.

    Hay dos acercamientos a menudo criticados para analizar las características de los

    diversos niveles en un solo nivel. En el primer acercamiento es que todas las

    características de un nivel superior se desagregan a un nivel más bajo. Es decir,

    asignando a todos los individuos una variable que refleje la denominación de su grupo a

    que ellos pertenecen. En este acercamiento, todas las variables desagregadas se asumen

    ser independientes. El segundo acercamiento, los datos en el nivel individual se agregan

    al nivel más alto. La idea implícita en casi todos los usos del término “datos agregados”

    es que la variable agregada es simplemente un índice agregado de propiedades de

    unidades de nivel inferior, y no una medida directa de una propiedad del nivel superior.

    Pero no siempre es cierto ya que son un tipo de variables grupales que se construye

    “agregando” matemáticamente las características de los individuos del grupo. Se han

    empleados los términos “variables analíticas” y “variables agregadas” como sinómino de

    “variables derivadas”. También se ha recurrido al término “variables contextuales” como

    sinómino de “variables derivadas”.

    El análisis multinivel puede representarse metafóricamente por la “teoría de la rana en el

    charco”, que se refiere a la idea que una rana pequeña de individuos puede estar en un

    charco grande o una rana en un charco pequeño. Aplicado al ejemplo del estudiante

    indica que un alumno moderadamente inteligente en un contexto sumamente inteligente

    puede llegar a desmotivarse y así llegar a no tener éxito. Mientras el mismo alumno en un

    contexto considerado menos inteligente puede llegar a tener éxito. Así, el efecto de una

    20

  • inteligencia individual de alumnos depende por término medio de la inteligencia de otro

    alumno.

    Ahora bien, antes de presentar las definiciones teóricas de los modelos multinivel, se

    comenta el tipo de variables que se consideran en los modelos multinivel.

    Variables Globales y absolutas: son las que se refieren únicamente al nivel en que

    están definidas, sin referencia a ninguna otra unidad o nivel de análisis. Por

    ejemplo, la inteligencia podría ser una variable global (se mide a nivel individual).

    Variables Relacionales: son las que conforman un nivel simple y describen las

    relaciones de una unidad a otra siempre dentro del mismo nivel. Por ejemplo, los

    índices de popularidad de un profesor se consideran variables relacionales en el

    nivel individual.

    Variables Analíticas y estructurales: estas se refieren a variables de niveles

    inferiores que se agregan en unidades mayores. Las variables analíticas se refieren a

    la agregación de una variable global en un nivel más bajo. Por ejemplo, las

    características sociales de los individuos son variables analíticas cuando se agregan

    para toda una comunidad.

    Variables contextuales: estas definen a las superunidades; todas las unidades en

    los niveles más bajos reciben el mismo valor en la variable que se mide en la

    superunidad a la cual pertenecen. Por ejemplo, el área geográfica, comunidad, etc.

    De las variables descritas anteriormente, se presenta el siguiente esquema, adaptado de

    Swanborn (1981).

    21

  • Tabla 2: Esquema adaptado a Swanborn (1981).

    Nivel 1 2 3 …

    Global Analítica

    Relacionales Estructurales

    Contextual Global Analítica

    Relacionales Estructurales

    Contextual Global …

    Relacionales …

    Tipo de variable

    Contextual …

    Idealmente, una teoría de multinivel debe especificar cuales variables pertenecen a cada

    nivel, es decir, investigar de qué manera las variables grupales (macrovariables), las

    individuales (microvariables) y sus interacciones se relacionan con los resultados a nivel

    individual. Los efectos entre el individuo y el nivel del contexto requieren la

    especificación de algún proceso dentro de los individuos que causa que esos individuos

    sean influidos diferencialmente por ciertos aspectos de su contexto.

    Tratando el ejemplo que venimos explorando, observamos que se han definido dos

    niveles de agregación, el estudiante y la escuela. Y según el esquema dado anteriormente,

    podríamos agregar variables derivadas de un nivel superior a un nivel más bajo, tal es el

    caso como las características socioeconómicas del estudiante y familia, capital cultural y

    social de las familias, áreas urbanas o rurales, el grado de involucramiento de las familias

    de los alumnos en actividades escolares, y el apoyo de niveles superiores del sistema

    educativo.

    Con el fin de profundizar en el concepto de agregado y desagregado, tomaremos siempre

    el ejemplo del estudiante. Lo que se pretende es medir la variable endógena (rendimiento

    del estudiante), en primera instancia agregamos la variable contextual nivel

    socioeconómico del estudiante. Esto lo hacemos para que conozcamos cual será el

    impacto real de los diferentes factores sobre el rendimiento de los estudiantes, lo cual

    eliminaremos el efecto que el nivel socioeconómico del estudiante y su familia tienen

    sobre los resultados académicos. Ahora bien si desagregamos la variable nivel

    22

  • socioeconómico de la escuela, entonces este modelo busca estimar el rendimiento

    promedio de los estudiantes en las diferentes pruebas eliminado el efecto que sobre los

    puntajes tiene el nivel socioeconómico medio de los alumnos del centro. En otras

    palabras, trata de depurar la media general del rendimiento, aislando el efecto que sobre

    ella tiene el nivel socioeconómico de cada establecimiento, expresado en términos del

    promedio del nivel socioeconómico de sus estudiantes.

    Tipos de modelos multinivel.

    En los ejemplos citados anteriormente y mediante el esquema de variables adaptado a

    Swanborn (1981), un modelo multinivel de dos niveles de jerarquía, pueden ser

    expandido a más niveles de jerarquía. Algunos investigadores pueden estar interesados en

    describir los cambios de las respuestas de una enfermedad con respecto al tiempo y,

    desde esta perspectiva, el análisis multinivel puede ser utilizado para mostrar el efecto

    temporal que se tiene sobre los grupos de estudio. Por ejemplo, en un estudio longitudinal

    en el nivel 1 se consideraría los individuos. Así, el nivel 2 representaría las mediciones

    repetidas en diferentes lugares, y el nivel 3 podrían ser los lugares. Algunos ejemplos de

    estructura de encuestas transversales repetidas, se presentan en los estudios

    multicéntricos5.

    Otro tipo es el de estructura de mediciones repetidas se podría considerar en un nivel 1 la

    medición de la ocasión, el nivel 2, el individuo y nivel 3, los lugares del país. Así, el nivel

    1 representa la medición repetida del evento en mismo individuo. Tales estructuras

    permiten explorar el cambio individual dentro de un grupo.

    Los modelos multinivel pueden utilizarse también para representar diferentes variables

    respuestas relacionadas de un mismo individuo. En la necesidad de examinar diversas

    variables simultáneamente para evaluar, por ejemplo, la salud física de un individuo, las

    diferentes mediciones del cuerpo formarían un conjunto de respuestas en el nivel 1, las

    cuales estarían anidadas entre individuos (nivel 2), que a su vez estarían anidados en

    5 Benavides FG, Benach J, Diez-Roux AV, Roman C. How do types of employement relate to health indicators? Findings from the second European survey on working conditions. J Epidemiol Community Health 2000.

    23

  • diferentes instituciones de salud. Este tipo se conoce como estructura de clasificación

    cruzada. Estudios con este enfoque pueden ser ecológicos o espaciales6.

    1.4 CONJETURACIONES PREVIAS AL ANÁLISIS MULTINIVEL.

    En diversas áreas de investigación se han observado la existencia de estructuras

    jerárquicas en los datos, producto de la agrupación de unidades dentro de otras unidades

    en diferentes niveles que conforma una jerarquía. Por ejemplo, una muestra de una

    población se puede describir como una muestra llamado pasos múltiples: primero

    tomamos una muestra de unidades del nivel más alto (por ejemplo, las escuelas), y luego

    probamos las sub-unidades de las unidades disponibles (por ejemplo, buscar

    características de los estudiantes y de las escuelas). En tales muestras, las observaciones

    individuales generalmente no son completamente independientes. Esto es, porque los

    estudiantes en la misma escuela tienden a ser semejantes unos de otros, a causa de

    procesos de selección (por ejemplo, algunos profesores pueden darle mérito a algunos

    estudiantes considerados talentosos, mientras que otros seria lo contrario) y a causa del

    historial común que ellos han compartido en la misma escuela. Como resultado de eso, la

    correlación mediana (expresado en el llamado intra-correlación de clase) entre variables

    medidas en estudiantes de la misma escuela, será más alto que la correlación mediana

    entre variables medidos en estudiantes de escuelas diferentes. Las diversas pruebas

    estadísticas uniformes se inclinan pesadamente en la suposición de independencia de las

    observaciones. Pero si esta suposición se viola, las estimaciones de los errores uniformes

    de pruebas estadísticas convencionales serán demasiado pequeñas, y dará resultados

    falsamente significativos. A todo esto se le considera un efecto de diseño, y el

    procedimiento para la corrección será calcular los errores uniformes por métodos

    ordinarios de análisis, es decir, estimar la intra-correlación de clase entre los encuestados

    dentro de grupos. Algunos de estos procedimientos de corrección son bastantes poderosos

    (Skinner, Holt & Herrero, 1989). De hecho, estos procedimientos de corrección se

    podrían aplicar en el análisis multinivel. Sin embargo, en la mayoría de los problemas

    multinivel es que no solo tenemos anidados los individuos dentro de grupos, sino que

    6 Bramm AW, Van den EP, Prince MJ, Beekman AT, Kivela SL, Lawlor BA et, al. Religión as a crosscultural determinant of depresión in elderly Europeans: results from the EURODEP collaboration. Psychol Med 2001.

    24

  • también tenemos variables medidas en todos los niveles disponibles. Las variables que

    combinan los niveles diferentes en un modelo estadístico son un problema diferente que

    estimar y corregir el diseño. Es por ello que los modelos multinivel se diseñan para

    analizar las variables de niveles diferentes simultáneamente, usando un modelo

    estadístico que incluya varias dependencias.

    Supongamos por ejemplo, si se quiere estudiar a escala nacional la calidad de vida de los

    ancianos que viven en una residencia de forma permanente. En este caso se puede

    establecer una estructura jerárquica de 2 niveles, donde los ancianos se sitúan en el nivel

    1 y las residencias en el nivel 2. Podemos suponer que dentro de cada residencia los

    ancianos tienen a ser más similares en sus comportamientos y características, o más aun,

    las residencias presentan características propias, lo que puede afectar a la calidad de vida

    de los ancianos. Si la calidad de vida se considera una variable de respuesta de tipo

    continua, a la que se le ajusta un modelo de regresión, considerando una característica

    (exógeno) de los ancianos, podríamos encontrar como resultado una de estas tres

    situaciones7, tal como se observa en la figura 4:

    a) Las rectas de regresión para cada residencia son iguales, lo que llevaría a

    considerar un único nivel en el análisis de los datos.

    b) Las rectas de regresión difieren solo en el intercepto.

    c) difieren tanto en el intercepto como en la pendiente, lo que nos lleva a pensar en

    construir un modelo que considere los distintos niveles en la jerarquía de los

    datos.

    7 Catalán- Reyes MJ., et al. Utilización de los modelos multinivel en investigación sanitaria.

    25

  • Figura 4: Ejemplo hipotético de un ajuste de regresión para la calidad de vida de los ancianos en cuatro

    residencias.

    Para hacer frente a esta problemática, el análisis multinivel es una metodología

    fundamental para el análisis de datos que presentan una estructura jerárquica, y

    principalmente cuando los datos se han obtenido a través de la técnica de muestro por

    conglomerado, es decir, ocurre cuando en una investigación existen además de los

    sujetos, otras unidades de análisis tales como escuelas, municipios, empresas, hospitales,

    etc. La existencia de estas agrupaciones naturales queda reflejada en la estructura de los

    datos, hace que se incumpla el supuesto del muestreo aleatorio simple y que muchas

    técnicas estadísticas convencionales, tales como el análisis de varianza (ANOVA) efectos

    fijos o la regresión clásica sea inapropiada.

    1.5 ENFOQUES MULTINIVEL BASADO POR EL ANÁLISIS DE REGRESIÓN MULTIPLE, ANOVA Y ANCOVA.

    Históricamente, los problemas de multinivel han guiado a enfoques de análisis que

    basándose por un análisis de regresión múltiple, el análisis de variación, o de algún otro

    método uniforme de análisis. Una situación análoga en un contexto de análisis de

    regresión diferencia el análisis de covarianza clásico del modelo multinivel. Recordemos

    que el análisis de covarianza es una combinación de análisis de varianza y de regresión

    clásico. Se haría un análisis de regresión ordinario, por ejemplo, entre el número de horas

    de preparación para un examen y rendimiento académico a fin de estudiar la eficacia de

    los hábitos de estudio en una población de alumnos. En el análisis de covarianza clásico

    se incluiría el estudio de esta relación en un diseño de dos o más grupos, como por

    ejemplo, dos tipos de entrenamiento en hábitos de estudio con respecto a un grupo de

    26

  • control. Los sujetos en este caso podrían ser asignados aleatoriamente a uno de los grupos

    y se podrían contrastar hipótesis tanto sobre las diferencias entre los métodos de estudio,

    como sobre la eficacia del tiempo invertido.

    Los efectos de interés en este caso son fijos, puesto que se han elegido premeditadamente

    dos programas de entrenamiento de estudios específicos frente a un grupo de control.

    Tendríamos análisis de covarianza de efectos mixtos o modelo multinivel si en lugar de

    estos programas concretos, el objetivo fuera, por ejemplo, el contrastar la eficacia de las

    horas de estudio en una selección de escuelas al azar. En este caso habría dos tipos de

    unidades experimentales, la escuela y el alumno, y las medidas de los alumnos dentro de

    cada escuela estarían correlacionadas, por lo que el modelo de efectos fijos no sería

    apropiado.

    En el análisis multinivel, todo el conjunto de problemas es conceptual, es decir, si el

    analista no es muy cuidadoso en la interpretación de los resultados, puede cometer la

    falacia del nivel injustificadamente, que se compone de analizar los datos en un nivel, y

    las conclusiones que dibujan en otro nivel. Una de las falacias mejor conocidas es la

    falacia ecológica, que interpreta los datos agregados en el nivel individual, es decir,

    inferir conclusiones a escala individual a partir de datos grupales. La otra falacia que

    podría surgir es el hacer inferencias en un nivel más alto a partir de un análisis

    realizado en un nivel más bajo, se conoce también la falacia atomística, es decir, hacer

    inferencias sobre la variabilidad intergrupal (o relación entre variables grupales) a

    partir de datos individuales. A este concepto a veces se ha denominado falacia

    individualista.

    Una manera más general de ver los datos multinivel es investigar las relaciones entre las

    variables que se miden en varios niveles jerárquicos diferentes. Por ejemplo, una

    pregunta común es cómo varias variables individuales y de grupo influyen una sola

    variable individual del resultado. Típicamente, parte de las variables individuales. En el

    pasado, tales datos se analizaban cuando generalmente un análisis de regresión múltiple

    convencional con una variable dependiente en el nivel más bajo (individuo) y una

    27

  • colección de forma explicativa de variables en todos los niveles disponibles. (Boyd y

    Iversen, 1979; Roberts y Burtein, 1980). Desde que este enfoque analiza todos los datos

    disponibles en un solo nivel, se sufre el problema conceptual y estadístico como el que

    producir sesgos en la estimación del error típico de medida y un aumento en la

    probabilidad de cometer el error de rechazar la hipótesis de asociación lineal cuando esta

    es cierta.

    El análisis multinivel modela explícitamente estas relaciones jerárquicas, eliminando

    estos sesgos, proporcionando además estimaciones de interés psicológico sobre la

    variabilidad y replicabilidad de los coeficientes de regresión en los distintos contextos

    sociales (Robinson, 1950), y sobre la influencia de estos en el comportamiento del

    individuo.

    En los últimos 50 años se han desarrollado diferentes métodos de estimación tal es el

    caso el de componente de varianza, aplicable a datos desequilibrados bajo modelos

    mixtos. Es decir, la existencia de correlación entre observaciones hace que el modelo

    de regresión por mínimos cuadrados ordinarios produzca sesgos en la estimación del

    error cuadrático medio, y por tanto producirá errores de inferencia. El grado de sesgo

    depende de la magnitud de la correlación entre los grupos tanto de la variable

    endógena como la exógena, así como del número de unidades experimentales.

    En diversos estudios como en psicología, es frecuente que un contexto de regresión

    implicaría que no solamente el número de unidades de nivel inferior sea el mismo para

    cada unidad experimental del nivel superior, sino que también la distribución de los

    valores de las variables exógenas sea también la misma para todos los grupos del nivel

    superior. Tal como ocurre en el análisis de experimentos en estos casos, es aconsejable

    recurrir al procedimiento de Máxima Verosimilitud que es un método clásico de

    estimación de parámetros (no necesariamente varianza) asociada a funciones de densidad

    o probabilidades de variables aleatorias, con la restricción de que los parámetros han de

    estar en el espacio paramétrico. Produciendo estimadores con propiedades deseables con

    28

  • muestras grandes, tales como consistencia y eficacia, es decir, si se recoge gran cantidad

    de datos, el estimador será aproximadamente insesgado y con varianza mínima.

    1.6 EL ERROR DE MEDIDA.

    En muchas áreas de la investigación, los estudios pueden implicar variables que no se

    pueden observar directamente. Por ejemplo, la capacidad matemática de una persona no

    se puede medir directamente, solamente el funcionamiento en una serie de preguntas en

    una prueba de matemática. También, los datos recogidos de encuestadores contienen

    error de respuesta (es decir, hay variación de la respuesta en respuestas a la misma

    pregunta cuando está administrado en varias ocasiones a la misma persona). El error de

    medida puede ocurrir en variables explicativas, dependientes o independientes. La

    confiabilidad de variables explicativas es una pregunta metodológica importante. Cuando

    se sabe la confiabilidad, las correcciones se pueden hacer (Fuller, 1987), si las medidas

    repetidas están disponibles, la confiabilidad se puede incorporar en el modelo y estimar

    directamente. El uso de variables explicativas no fiables conduce a la valoración en

    polarización negativa de los coeficientes de la regresión y la inferencia estadística que

    resulta puede ser muy engañosa a menos que se hagan los ajustes cuidadosos.

    Por otro lado, ya en el contexto de modelos de ecuaciones simultaneas o modelos de

    ecuaciones estructurales con variables observables, en ocasiones denominados path

    análisis, en Gillespie y Fox (1980) se señalan los posibles efectos en modelos recursivos,

    modelos en que la causalidad fluye en un único sentido, indicando que se produciría

    atenuación en los coeficientes gamma, aquellos que van de variables exógensas a

    endógenas, y sin embargo sesgo positivo en los coeficientes beta (aquellos que van de

    una variables endógenas a otras). Este último efecto podría llevar a una atenuación de las

    varianzas entre errores. Resultados para un modelo no recursivo (Fergusson y Horwood,

    1986) mostraron que al aumentar el error de medida aleatorio, aumentaba el valor de los

    coeficientes gamma, mientras los coeficientes beta disminuían. Thompson y Getty (1994)

    ofrecen otro ejemplo de efectos de la fiabilidad de las medidas en un modelo no

    recursivo, modelo en que se plantea doble sentido en la causalidad donde una variable

    29

  • antecedente puede también ser consecuente. Es por ello que una forma alternativa de

    tratar el error de medida aleatoria es mediante modelos de ecuaciones estructurales con

    variables latentes. Estos permiten efectos, predicciones entre factores, en lugar de solo

    plantear relaciones entre variables observables. El concepto y la teoría estadística que

    permite las ecuaciones de regresión simultáneas entre factores fueron introducidos por

    Jöreskog (1970; 1973), y se basan en una idea simple, incorporar en un mismo modelo el

    análisis factorial confirmatorio y el modelo de ecuaciones estructurales con variables

    observables.

    Aunque el asunto del modelo de error de medida ha recibido hoy en día la verdadera

    atención considerable en la literatura multinivel, ésta atención se ha centrado en los

    modelos lineales de error de medida, más específicamente, el modelo aditivo clásico del

    error de medida (Carroll et al., 1995; Fuller, 1987; Goldstein, 1987; Longford, 1993).

    Este modelo se basa en la asunción de la homocedasticidad, que exige la variación igual

    de los errores de medida condicionales en diversos niveles de la variable endógena. Es

    decir, en la terminología usado cuando se discuten las medidas específicas por estrato son

    “homogéneas” cuando son iguales y “heterogéneas” cuando son significativamente

    diferentes. Obviamente, una medida resumen es mejor en una situación en que la medida

    que esta siendo resumida es homogénea en los estratos. En caso habitual, para una

    medida de razón efecto, la homogeneidad entre los estratos es equivalente a tasas o

    razones que se adaptan a un modelo multiplicativo de efectos conjuntos (absolutos), la

    homogeneidad es equivalente a un modelo aditivo de efectos conjuntos. Modificación de

    la medida del efecto significa heterogeneidad para esa medida. Por ejemplo en la

    investigación educativa, el gasto del pre-test de los estudiantes, el estado socioeconómico

    o la inteligencia se utilizan a menudo como variables explicativas en los resultados del

    examen de los estudiantes. Además, los resultados del examen de los estudiantes o las

    capacidades se miden conforme a error o no se pueden observar directamente. Los errores

    de medida asociados a las variables explicativas o a las variables que no pueden ser

    observadas directamente no se toma en consideración.

    30

  • La atención esta también en un modelo no lineal de error de medida y de un modelo

    estructural no lineal, esto es debido a que los modelos multinivel fueron desarrollados

    originalmente para variables con distribución normal y bajo los supuestos de una

    distribución normal de los errores en cada individuo, estos métodos han sido

    generalizados para situaciones en los que las variables de respuesta es binomial, nominal

    u ordinal y para procesos donde la probabilidad del evento es pequeña y se puede

    modelar con una distribución de Poisson. Se llama función vínculo de nivel 1 (link

    funtion) a la transformación de la variable dependiente de nivel 1 que se iguala a una

    combinación lineal de los coeficientes de las variables explicativas. Esta función puede

    ser una función logística binomial, ordinal, multinomial o una transformación de Poisson.

    31

  • CAPÍTULO 2

    TEORÍA DE LOS MODELOS MULTINIVEL Introducción. En este capítulo se presenta el fundamento teórico de modelos multinivel, el cual esta

    estructurado en los siguientes apartados:

    El modelo de dos niveles y su notación, en primer lugar se aborda este contenido a

    partir de un ejemplo desarrollado por Golstein en 1999, donde se hacen algunas

    conjeturaciones sobre el modelo de regresión clásica. Se define el modelo parcial con

    situación multigrupo, estableciendo así los supuestos para un modelo de regresión

    simple.

    El modelo de dos niveles, se define el modelo lineal mixto y se estudian los supuestos

    básicos.

    Estimación de los parámetros para el modelo de componentes de varianza, aquí se

    estiman los parámetros del modelo multinivel de dos niveles pero considerando el

    modelo donde no se incluye ninguna variable aleatoria al modelo (el enfoque

    ANOVA).

    El modelo de 2 niveles incluyendo coeficientes aleatorios, en este apartado se realiza

    la estimación de los parámetros del modelo multinivel de dos niveles, considerando

    una variable aleatoria al modelo (el enfoque ANCOVA).

    32

  • Estructura general y estimación para un modelo multinivel de dos niveles, aquí se

    estiman los parámetros del modelo multinivel general de dos niveles. Se parte con la

    incorporación de dos variables aleatorias al modelo lineal mixto, para poder así

    generalizarlo a tantas variables aleatorias que se deseen incorporar al modelo

    multinivel de dos niveles.

    Estimación de los parámetros del Modelo general de tres niveles. De igual manera

    como se desarrolló la estimación de los parámetros tanto fijo como aleatorios de un

    modelo multinivel general de dos niveles, se hace para un modelo multinivel general

    de tres niveles.

    33

  • 2.1 El modelo de 2 niveles y notación básica

    Para entrar en materia, se presenta un ejemplo del estudio realizado por Goldstein

    (1999) a partir de los resultados obtenidos por alumnos en escuelas primarias (Junior

    School Proyect) en Londres, realizado por Mortimore et al (1988). Goldstein, utilizó una

    submuestra aleatoria de la data de Mortimore, considerando 728 alumnos en 50 escuelas

    y como unidad de medida a los alumnos que están en cuarto año de aprendizaje, en el

    cual los alumnos cumplen sus ocho años de vida. Por otra parte, dentro de este estudio se

    utilizaron las puntuaciones de la prueba de matemática administrada en dos momentos

    junto con la información recogida del contexto social de los alumnos y de su género.

    Regresión lineal simple

    Para introducirnos a la teoría multinivel se hacen algunas conjeturaciones sobre que tipo

    de relación seria de interés conocer a partir de la información de los gráficos.

    En la figura 2.1 según el ejemplo tratado se muestra el diagrama de dispersión de las

    puntuaciones de la prueba de matemática en alumnos de 11 años de edad sobre las

    puntuaciones de la prueba de matemática en alumnos de 8 años de edad. En este

    diagrama no se hace ninguna distinción entre las escuelas a las cuales los alumnos

    pertenecen. Observamos que existe una dispersión estrecha de las puntuaciones de

    alumnos en edad de 11 años con el aumento de las puntuaciones de alumnos en edad de 8

    años. Es importante recalcar que al no haber distinción entre escuelas, no podemos ver si

    la escuela influye sobre las puntuaciones de los alumnos.

    34

  • 11 a

    ños M

    atem

    átic

    a

    8 años Matemática

    Figura 2.1: Diagrama de dispersión de las puntuaciones de la prueba de las matemáticas en alumnos de 11 años de edad sobre las

    puntuaciones de la prueba de matemática en alumnos de 8 años de edad.

    En figura 2.2 se presenta para un caso particular de dos escuelas que han sido

    seleccionadas aleatoriamente, representadas por diversos símbolos. Observamos que

    conforme aumentan las puntuaciones de los alumnos de 8 años, las puntuaciones de

    alumnos de 11 años están entre 20 y 30 para la escuela 1 (símbolo círculo). Ahora bien,

    para esa misma escuela las puntuaciones de mayor edad se sobre pone a las puntuaciones

    de alumnos con menor edad. Sin embargo, si trazamos dos líneas de regresión para dichas

    escuelas, se tiene que las rectas no son paralelas, indicando que la escuela 2 (símbolo

    triángulo) tiene mejores puntuaciones en la prueba que la escuela 1. Además, hay un

    punto de intersección en las dos rectas o un balance de las puntuaciones obtenidas en

    alumnos de 8 y 11 años. Pero que el cambio surge después de ese punto de intersección,

    se observa que no solo la edad o variable explicativa del nivel alumno influye en su

    puntuación, sino que podemos pensar que existen otras características de la escuela, de tal

    modo que las características de la escuela estarían influyendo en las puntuaciones de los

    alumnos.

    35

  • 11 a

    ños M

    atem

    átic

    a

    8 años Matemática

    Figura 2.2: Diagrama de dispersión de las puntuaciones de la prueba de matemática para dos escuelas.

    De las conjeturaciones hechas anteriormente, se escribe un modelo de regresión simple

    para una escuela, relacionando las puntuaciones de la prueba de matemática en alumnos

    de 11 años con las puntuaciones de 8 años, de la siguiente manera:

    iiy ix eα β= + + (2.1)

    Donde es la puntuación del i-ésimo alumno, iy ix la edad del alumno,

    ( 1 2, ,..., n )β β β β ′= es el efecto que tiene la edad sobre la puntuación del i-ésimo

    alumno y ( 1 2, ,..., n)α α α α ′= es el promedio de las puntuaciones eliminando el efecto

    de la edad de los alumnos.

    Pero en la ecuación 2.1 solamente tenemos una regresión que permite conocer el efecto

    de la edad sobre la puntuación del estudiante en una escuela en particular con una

    muestra de tamaño estudiantes. Ahora bien, si queremos conocer el efecto de la edad

    sobre la puntuación de los estudiantes de más de una escuela, con muestras de tamaño

    1k

    jk en cada una, entonces tendríamos n modelos de regresión lineal, de tal modo que podamos conocer que tanto influye la edad sobre la puntuación del i-ésimo alumno en la

    36

  • j-ésima escuela. Esto implica el ajuste de n modelos de regresión, mediante una forma

    parcial para cada escuela con tamaño jk , tenemos

    Para la escuela 1: 1 1 111 ; 1, 2, ...,i ii iy 1x e kβα= + + =

    Para la escuela 2: 2 2 222

    ; 1, 2, ...,i ii

    iy 2x e kβα= + + =

    Para la escuela n: ; 1, 2, ...,n in innin

    iy nx e kβα= + + =

    El sistema de ecuaciones de los n modelos anteriores se puede simplificar con el modelo

    siguiente:

    j ij ijjijy x eβα= + + (2.2) 1, 2, ..., ; 1, 2, ...,ji jk= = n

    Donde

    ijy es la puntuación del i-ésimo alumno en la j-ésima escuela.

    ijx es la edad sobre la puntuación del i-ésimo alumno en la j-ésima escuela.

    α representa el promedio de la puntuación muestral.

    jβ representa los pesos asociados a la característica en la muestra completa. ijx

    ije es una variable aleatoria que representa el error de ajuste del modelo del i-ésimo alumno en la j-ésima escuela.

    Los deben cumplir las siguientes hipótesis: ije

    a) La perturbación tiene esperanza nula, es decir:

    ( ) 0ijeE =

    37

  • b) La varianza de la perturbación es siempre constante, y no depende de x ; conocido

    como homocedasticidad de la perturbación.

    ( ) 2var ij eoe σ=

    c) La perturbación tiene una distribución normal. Esta hipótesis es consecuencia del

    teorema central del límite.

    d) Las perturbaciones son independientes entre si.

    Estas cuatro condiciones pueden expresarse igualmente respecto a la variable respuesta, o

    dependiente, como sigue:

    a) La esperanza de la respuesta depende linealmente de x . Tomando esperanzas en

    (2.2), se tiene:

    ( ) ( )j ijj

    j ij ijjijy x eE Ex

    βαβα +

    = + +=

    b) La varianza de la distribución de es constante. ijy

    ( ) 2var eoijy σ=

    c) La distribución de para cada y x es normal.

    d) Las observaciones son independientes entre sí. ijy

    38

  • Ahora, si utilizamos el modelo de regresión (2.2) se tendrían que estimar α , β y 2eoσ

    que representa 2n+1 parámetros, suponiendo que jα , jβ y

    2

    eoσ es fijo para cada

    escuela . 1, 2, ...,j n=

    2.2 El modelo de dos niveles.

    Con el fin de conocer otras variables aleatorias que no han sido medidas en el alumno se

    debe considerar los parámetros como variables aleatorias. Es por ello que para hacer la

    ecuación (2.2) más auténtica de dos niveles, dejamos jα y jβ como variables

    aleatorias convertidas. Para la consistencia de la notación sustituiremos jα por 0 jβ y

    jβ por 0 jβ y asumiremos que

    0 10 0 1 1, , 1, 2, ...,j jj j ju u nβ β β β= + = + = (2.3)

    Donde

    0 jβ es el logro promedio por escuela, está representado como una función de la gran

    media 0β o media de todas las escuelas, más una variable aleatoria 0 ju que captura la

    variación en la puntuación promedia a través de escuelas. Dicho de otra forma el 0 ju

    contiene las variables no observables que hacen que la nota promedio de cada escuela no

    sean iguales. Por ejemplo, si todas las escuelas tuviesen media constante, entonces

    . 0 0ju =

    1 jβ es el efecto de la variable edad, está representado como una función de la estimación

    de la media de las pendientes relativas al efecto de la variable edad más una variable

    aleatoria 1 ju que captura la variación de los pesos asociados a la característica edad a

    través de escuelas. La variable 1 ju recoge todas las variables no observables en la

    escuela que influyen en la edad de los estudiantes y hace que el peso de la variable edad

    39

  • difiera entre escuelas. Si el peso de la variable edad de los estudiantes fuese el mismo en

    todas las escuelas, entonces . 1 0ju =

    Sustituyendo (2.3) en (2.2) tenemos que,

    ( )0 1 00 1 ij j j ij ijijy x u u x eβ β= + + + + (2.4)

    Donde ijy se ha expresado como la suma de una parte fija del modelo 0 1 ijxβ β+ y una

    parte aleatoria dentro de las escuelas. Que al final la expresión (2.4)

    resulta ser un modelo lineal de efectos mixtos.

    0 1j j ij iju u x e+ + 0

    =

    Para las perturbaciones se establecen los siguientes supuestos:

    a) Las variables aleatorias y tiene esperanza nula, es decir: 0 ju 1 ju

    ( ) ( )0 1 0j jE Eu u= (2.5)

    b) La varianza de cada variable aleatoria y es siempre constante, y no depende

    de

    0 ju 1 jux .

    ( ) ( ) ( )2 20 0 1 1 0 1 0var , var , cov ,j u j u j j uu u u uσ σ= = = 1σ (2.6)

    c) Las perturbaciones son independientes entre si.

    Para la variable respuesta o dependiente, se tiene que:

    a) La esperanza de la respuesta depe