regresión lineal. definición del problema evaluar la capacidad explicativa de un conjunto de...

Post on 28-Jan-2016

217 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Regresión lineal

Definición del problema Evaluar la capacidad explicativa de un

conjunto de características socio demográficas que inciden en los ingresos laborales de los jóvenes.

Evaluar el peso de factores tales como la edad, el sexo, el nivel de instrucción y la categoría ocupacional.

Y (Nivel de Ingresos) =Y (Nivel de Ingresos) =

b0 + b1.X1 (nivel educativo)+ b2.X2

(categoría ocupacional) + b3.x3 (sexo) +

b4.x4 (edad) + u

cuadro resumen variables del modelo

variable Categorías tipo tratamiento

variable dependiente

Nivel de ingresos (p21) métrica logarítmica

variables explicativas

categorías originales

Nivel educativo alcanzado 1 Sin Instrucción

2 Primaria completa

3 Secundaria completa

4 Terciario Univ. Comp.

ordinal

Transformación en variables

dummy (categoría de comparación secundario completo)

1- sin instrucción Dummy 1 sin instrucción

0-resto categórica

1- primaria completa Dummy 2 Primaria completa

0-resto categórica

1- universitario completa Dummy 3 Universitario completo

0-resto categórica

categorías originales

1-patrón o empleador

2-trabajador por cuenta propia

3-obrero o empleado

categoría ocupacional

4-trabajador familiar sin salario

categórica

Transformación en variables

dummy (compara

asalariados contra el resto)

1- asalariado Dummy_as

0-resto categórica

sexo 1- varón

0-mujer categórica

edad métrica

1 varon asalariado interacción entre sexo y categoría ocupacional 0 varon no asalariado y mujeres

categórica

Gráficos de dispersión

Matriz de correlaciones (supuesto de multicolinealidad)

MULTICOLINEALIDADMULTICOLINEALIDAD

Incorporar Incorporar Interacción Interacción entre nivel entre nivel educativo y educativo y

edadedad

Transformación de las variables independientes

NIVEL_ED NIVEL(1) NIVEL(2) NIVEL(3)

1 - Sin Instrucción 1 0 0

2 - Primaria Completa 0 1 0

3 - Secundaria Completa 0 0 0

4 - Universitario Completo y más 0 0 1

Lista de variables y Lista de variables y propiedadespropiedades

Quiero establecer como categoría de Quiero establecer como categoría de comparación el nivel secundario comparación el nivel secundario completo para medir el efecto que completo para medir el efecto que produce tener menores o mayores produce tener menores o mayores credenciales a estascredenciales a estas

Variable de Variable de origenorigen

Variable de Variable de resultadoresultado

NIVEL_ED NIVEL(1) NIVEL(2) NIVEL(3)

1 - Sin Instrucción 1 0 0

2 - Primaria Completa 0 1 0

3 - Secundaria Completa 0 0 0

4 - Universitario Completo y más 0 0 1

NIVEL_ED NIVEL(1) NIVEL(2) NIVEL(3)

1 - Sin Instrucción 1 0 0

2 - Primaria Completa 0 1 0

3 - Secundaria Completa 0 0 0

4 - Universitario Completo y más 0 0 1

Crea variable de Crea variable de interacción interacción edad*nivel educativoedad*nivel educativo

Aplicación del modelo

trabajamos sólo con los trabajamos sólo con los ocupados de entre 15 y 29 ocupados de entre 15 y 29 años que tienen ingresosaños que tienen ingresos

El método más usual es El método más usual es introducir:introducir: incluye todas incluye todas las variables las variables dependientes al mismo dependientes al mismo tiempotiempo

Prueba para Prueba para correlación de correlación de errores entre sí errores entre sí (varía entre 0y4. 2 (varía entre 0y4. 2 es no correlación) es no correlación)

Pruebas correlación Pruebas correlación de errores con la de errores con la

variable Y variable Y (heterocedasticidad)(heterocedasticidad)

Pruebas de Pruebas de normalidad de normalidad de residuosresiduos

Guarda los residuos Guarda los residuos tipificados en tipificados en valores z como valores z como variable. Puede variable. Puede utilizarse como utilizarse como variable filtro de variable filtro de casos raroscasos raros

Pruebas de Pruebas de normalidad de normalidad de residuosresiduos

Pruebas de Pruebas de normalidad de normalidad de residuosresiduos

Pruebas correlación Pruebas correlación de errores con la de errores con la

variable Y variable Y (heterocedasticidad)(heterocedasticidad)

Ajustes del modelo

Transformación de la variable dependiente

Eliminación de casos raros

Transformar Transformar ingresos en variable ingresos en variable logarítmicalogarítmica

Nombre de la nueva Nombre de la nueva variablevariable

Logaritmo de la variable Logaritmo de la variable que se asigne entre que se asigne entre paréntesisparéntesis

Eliminación de casos Eliminación de casos rarosraros

top related