mÉtodos de imputaciÓn y consistencia en el censo 2001 instituto nacional de estadistica republica...
TRANSCRIPT
MMÉÉTODOS DE IMPUTACIÓN Y CONSISTENCIA EN TODOS DE IMPUTACIÓN Y CONSISTENCIA EN EL CENSO 2001EL CENSO 2001
INSTITUTO NACIONAL DE ESTADISTICAINSTITUTO NACIONAL DE ESTADISTICAREPUBLICA BOLIVARIANA DE VENEZUELAREPUBLICA BOLIVARIANA DE VENEZUELA
OBJETIVOSOBJETIVOS
El proceso de imputación y consistencia de datos tiene como objetivo corregir los errores por la mala declaración de respuestas y asignar algún valor válido en aquellas variables que fueron omitidas.
ETAPASETAPAS
Primera etapa: Pre-validación de los datos, que consiste, en asegurar la consistencia de cada uno de los registros de la base de datos; es decir que cada hogar estuviera asignado a una vivienda familiar, y que cada persona estuviera asignado a un hogar censal o a una colectividad. Adicionalmente, se examinó la validez de algunas variables que por su importancia, no se permitía ausencia de información
Segunda etapa: Correspondió a la validación del resto de las variables correspondientes a los registros de vivienda, de hogares y de personas.
MMÉÉ TODOS UTILIZADOS TODOS UTILIZADOS
Deductiva Estática: La mayor parte de los algoritmos de asignación se realizaron utilizando este método. Consiste en deducir los valores perdidos de combinaciones de variables no perdidas del mismo caso. Ejemplo: Si no existe información en sexo, pero existe respuesta en “total de hijos e hijas” igual a (00-99) o “ninguno”, asignar “mujer” (2) en sexo. Otro ejemplo, es el siguiente: Si el número de “hijos e hijas nacidos vivos” es menor o igual a edad de la madre menos 11 y menor o igual a 25 aceptar esta información.
´MMÉÉ TODOS UTILIZADOS TODOS UTILIZADOS
Imputación Deductiva Dinámica: De acuerdo a los valores de una o más variables se fija un valor que se obtiene de otras variables en el mismo Censo que se actualizan constantemente. Este método también es conocido en la literatura especializada como Hot Desk o Matrices Dinámicas y puede presentar diversas modalidades que varían de acuerdo en la forma en que se ordenan y seleccionan los registros donantes. Ejemplo: “Si es mujer con parentesco código 3 a 9 y tiene declaración de hijos nacidos vivos, asigne por hot deck la edad según la edad de la mujer anterior con igual parentesco e igual número de hijos nacidos vivos”
´ALGUNOS RESULTADOSALGUNOS RESULTADOS
% DE CASOS IMPUTADO VARIABLE SEXO 3.68VARIABLE EDAE 0.56
´PROPUESTA PARA LA CONSISTENCIA E PROPUESTA PARA LA CONSISTENCIA E
IMPUTACIIMPUTACIÓÓN DEL CENSO 2010N DEL CENSO 2010
La importancia de la consistencia e imputación de datos para poder difundir una información censal coherente y consistente; pero sin estar sobrefijada, obliga a que deba revisarse con antelación la metodología empleada para este proceso
´REVISIÒN DE LA IMPUTACIREVISIÒN DE LA IMPUTACIÓÓN 2001N 2001
Etapa 1: Revisión de las reglas empleadas
en la imputación deductiva estática aplicada en el Censo 2001. Revisión de su validez y pertinencia
REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓ N 2001 N 2001
Total de hijosnacidos Vivos 12 13 14 15 16 17 18 19
0 230.181 215.174 215.656 216.055 199.119 185.756 171.361 142.9801 480 756 2.090 6.701 14.794 25.829 38.012 44.7462 - 97 306 559 1.682 4.625 10.287 15.7243 - - 73 153 209 533 1.548 3.2474 - - - 64 117 102 263 5595 - - - - 35 65 79 996 - - - - - 29 46 317 - - - - - - 137 182
Número total de hijos nacidos vivos en mújeres entre 12 y 19 añosEdad en años
Fuente: INE. Procesamiento especial de la base de datos censales
REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001
´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001
Etapa 2: Revisión de la imputación
deductiva y estática aplicada en el Censo 2001 . Revisión de % de aciertos en la imputación
´PROPUESTA PARA SELECCIONAR MPROPUESTA PARA SELECCIONAR MÉÉTODOS Y TODOS Y
VARIABLESVARIABLES
a) Obtener una muestra de la base de datos censales, en la que no exista omisión
´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001
b) Simular sobre esta muestra, el patrón de
datos perdidos de la base original.
´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001
c) Imputar aplicando diferentes técnicas y
distintas variables
´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001
Métodos deductivosMedia / ModaHot Deck secuencialAleatoriaRegresiónVecino más cercanoModelos de series de tiempo
´REVISIREVISIÓÓN DE LA IMPUTACIN DE LA IMPUTACIÓÓN 2001N 2001
d) Evaluar los resultadas y seleccionar las
variables y técnicas de imputación a utilizar.