procesamiento de datos y análisis univariado

Upload: usmp-fn-archivos

Post on 15-Oct-2015

326 views

Category:

Documents


0 download

TRANSCRIPT

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    1/27

    PROCESAMIENTO DE DATOS Y

    ANLISIS UNIVARIADO.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    2/27

    Iniciado con el planteamiento de un problema de investigacin que implica

    responder a interrogantes situados en la frontera de los conocimientos

    existentes.

    Dos niveles diferentes: el terico y el emprico.

    Nivel terico: Construccin del marco terico, el que operacionalizado, nos

    indicar en definitiva que datos es preciso obtener para satisfacer las

    interrogantes iniciales.

    Nivel emprico: Concretada en un tipo de diseo, implementado a travs delas tcnicas de recoleccin, que nos permitir obtener los datos requeridos

    El instrumento de recoleccin de datos sintetizar ambos planos y ser la

    herramienta concreta que nos proporcione la informacin que necesitamos.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    3/27

    RECOLECCIN DE DATOS

    Mayor o menor complejidad y duracin.

    En ella se aplicarn los instrumentos a los objetos de estudio, lo que nos proporcionar

    las informaciones que necesitamos.

    Se completarn las lecturas.

    Se proceder a realizar efectivamente los experimentos, encuestas o estudios que sea

    menester

    Finalizadas las tareas de recoleccin el investigador quedar en posesin de un cierto

    nmero de datos.

    A partir de los DATOS ser posible sacar las conclusiones generales que apunten aesclarecer el problema formulado en los inicios del trabajo.

    Pero los DATOS obtenidos debern ser organizados.

    Estas acciones son las que integran el llamado procesamiento de los datos.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    4/27

    1. El conjunto de los datos obtenidos debemos dividirlos de acuerdo a un

    criterio bien elemental: de un lado la informacin que es de tipo

    numrica, de la informacin que se expresa verbalmente o mediante

    palabras.

    2. Los datos numricos quedarn como tales, cualquiera sea su naturaleza,

    y se procesarn luego para exponerlos en forma clara y fcilmente

    asimilable.3. El objetivo final: construir cuadros estadsticos, promedios generales y

    grficos ilustrativos, sintetizar sus valores y extraer, a partir de su anlisis,

    enunciados tericos de alcance ms general.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    5/27

    4. Los datos verbales podrn sufrir dos destinos diferentes: se convertirn

    en datos numricos o quedarn como informacin no cuantificada,

    cualitativa.

    5. Si se ha realizado una serie de entrevistas profundizadas, de tipo no

    estructurado, pueden cuantificarse algunos de los datos obtenidos delnmero de entrevistados por sexo y edad, la respuesta a alguna

    pregunta especfica en tanto que otras informaciones se mantendrn en

    su forma verbal, como paradigmas o ejemplos de las opiniones de la

    muestra frente a ciertos problemas de inters.

    6. El criterio a adoptar depender de circunstancias concretas: de los

    objetivos del trabajo, de la posibilidad de cuantificar cada variable, del

    tamao del universo o muestra considerados y de varios otros criterios

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    6/27

    TAREAS BSICAS DEL PROCESAMIENTO

    En primer lugar ser preciso hacer una revisin detallada de todos losdatos obtenidos, atendiendo en especial a su coherencia.

    Si se trata de cuestionarios o de pautas de observacin, de registros detests, sociogramas, o de cualquier otro instrumento de recoleccin, habrque examinar cada uno de ellos para analizarlos internamente, buscandosus posibles incongruencias, omisiones o errores, y enmendndolos sicabe hacerlo.

    Es decir, se revisar sistemticamente toda la informacin disponible,juzgando su calidad y el grado de confianza que merece, para determinarqu parte puede incluirse en el informe de investigacin, cual debecorregirse o modificarse en algo (acudiendo, llegado el caso, a una nuevarecoleccin de datos) y cual, por sus graves deficiencias, deber serexcluidas sin ms.

    Por cada tipo de datos se proceder entonces como

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    7/27

    Los datos numricos se procesarn agrupndolos en intervalos y setabularn.

    Luego se construirn con ellos cuadros estadsticos, calculndose ademslas medidas de tendencia central, de dispersin o de correlacin queresulten necesarias.

    Los datos verbales que se desea presentar como numricos sufrirn unaprimera operacin que se denomina codificacin.

    De all en adelante se trabajarn al igual que los otros datos numricos,mediante la tabulacin y el procesamiento en cuadros estadsticos.

    Los datos verbales que habrn de manejarse en forma puramenteconceptual y no matemtica seguirn el proceso que indicaremos cuandotratemos el pargrafo relativo a datos secundarios (ver 10.5).

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    8/27

    LA CODIFICACIN

    Es un procedimiento que tiene por objeto agrupar numricamente los datos

    que se expresen en forma verbal para poder luego operar con ellos como si

    se tratara de datos cuantitativos.

    Para lograrlo se habr de partir de un cmulo de informaciones que tengan

    una mnima homogeneidad, condicin necesaria para poder integrarlas.

    Pueden tratarse de cientos de respuestas a una misma pregunta o de una

    variedad de posibles situaciones observadas mediante un mismo tem de

    una pauta de observacin: en ambos casos existir una determinada

    variedad de declaraciones o de observaciones que presenten las respuestas

    o los comportamientos de los objetos de estudio.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    9/27

    El primer paso a dar frente a todos estos datos es realizar una revisin

    atenta de un subgrupo reducido de ellos con el objeto de encontrar una

    tipologa de respuestas posibles, en concordancia, por otra parte, con las

    formulaciones tericas que guan la investigacin y con los criterios

    adoptados en la etapa de operacionalizacin.

    A cada categora de respuestas habremos de darle un cdigo particular, un

    nmero o letra diferente, que servir para agrupar tras de s a todas lasrespuestas u observaciones que sean idnticas o que, al menos, aparezcan

    como equivalentes.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    10/27

    LA TABULACIN

    La palabra tabulacin deriva etimolgicamente del latn tabula, y significahacer tablas, listados de datos que los muestren agrupados ycontabilizados.

    Para ello es preciso contar cada una de las respuestas que aparecen,distribuyndolas de acuerdo a las categoras o cdigos previamentedefinidos.

    Cada una de las preguntas de un cuestionario o de una hoja deobservacin tendr que ser tabulada independientemente, por lo que espreciso hacer previamente un plan de tabulacin que prepareadecuadamente la tarea a realizar.

    Las tablas que resultan de la tabulacin deben considerarse, por lo tanto,como un material de trabajo, como un producto preliminar todava nocompletamente terminado.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    11/27

    TABULACIN DE DOS VARIABLES

    Casi siempre resulta necesario presentar simultneamente las mediciones

    correspondientes a dos o ms variables, en especial para tratar de percibir

    si se presenta algn tipo de correlacin o asociacin entre ellas.

    Para alcanzar este objetivo se emplea una tabulacin llamada cruzada, o

    de doble entrada, que consiste en la contabilizacin de las respuestas a

    una pregunta discriminndolas de acuerdo a las de otras variable diferente

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    12/27

    CUADROS ESTADSTICOS

    Luego de terminar con la tabulacin de toda la informacin contenida en

    nuestros instrumentos de recoleccin es preciso presentar los resultados

    de modo tal que estos se hiciesen fcilmente inteligibles aun para los

    lectores no especializados.

    Este criterio se manifiesta, en primer lugar, en el correcto titulado de cada

    cuadro.

    Ello significa que el ttulo debe contener todas las caractersticas de lainformacin que se presenta, en forma concreta, especfica y no difusa.

    Cuando en un cuadro aparecen dos variables deber mencionarse primero

    aquella que suponemos dependiente y luego la independiente

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    13/27

    La tarea siguiente es convertir en porcentajes las cifras reales (llamadas

    absolutas) que hemos obtenido de la tabulacin.

    Ello permite, por una parte, tener una mejor idea de lo que puede

    representar una parte frente al todo.

    La prctica de la porcentuacin permite, percibir diferencias y similitudes,

    apreciar variaciones y tendencias y hacer comparaciones con otras

    investigaciones.

    El valor en funcin del cual se hace el clculo de los porcentajes, se llama

    base del porcentaje

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    14/27

    GRAFICACIN

    La graficacin es una actividad derivada de la anterior que consiste enexpresar visualmente los valores numricos que aparecen en los cuadros.

    Su objeto es permitir una comprensin global, rpida y directa, de lainformacin que aparece en cifras.

    Es sumamente til, especialmente cuando nos dirigimos a lectores conpoca preparacin matemtica, aunque siempre es recomendable por elvalor de sntesis que posee.

    Raramente se grafica toda la informacin que se presenta en unainvestigacin pues ello ocupara un espacio desmesurado en el informe de

    investigacin, lo que podra ms bien a confundir al lector. Lo corriente y ms aconsejable es graficar las informaciones ms

    importantes y generales que se presten a una expresin grfica

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    15/27

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    16/27

    PROCEDIMIENTOUNIVARIADO

    CUAL ES ELNIVEL DE LA

    ESCALA DE LAVARIABLE

    NOMINALDE INTERVALO

    ORDINAL

    a. MEDIA

    b. DESVIACIN STANDART

    a. MEDIANA

    b. RANGO INTERCUART

    a. MODA

    b. FREQ RELATIVAS FREQ

    ABSOLUTAS

    1. DESCRIPTIVAa. TENDENCIA

    CENTRALb. DISPERSIN

    2. INFERENCIALPRUEBA Z

    PRUEBA T

    PRUEBA DE

    KOLMOGOROV-

    SMINOV

    PRUEBA DE CHI

    CUADRADO

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    17/27

    ES EL ANALISIS BASICO PRIMARIO

    SE PRESENTA LAS CARACTERISTICAS DE LAS PERSONAS O COSAS MEDIDAS

    UNA A UNA, DE MODO UNIVARIADO.

    LOS ESTADISTICOS COMO LA MEDIANA, LA MODA, LA MEDIA, LA

    VARIANZA, LOS PORCENTAJES, MIDEN UNA VARIABLE.

    CUANDO EL ANALISIS SE PRESENTA CARACTERISTICA POR CARACTERISTICA

    ESTAMOS ANTE UN ANALISI UNIVARIADO

    EJ EL PESO DE UNA PERSONA 65K, EL 23% SON DE SEXO MASCULINO.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    18/27

    EN UN ESTUDIO UNIVARIADO SE EXAMINAN LOS EFECTOS DE LA VARIABLE

    INDEPENDIENTE, SOBRE UNA VARIABLE DEPENDIENTE UNICA.

    Ej: ESTUDIO EXPERIMENTAL: UN GRUPO CONTROL Y UN GRUPO EXPERIMENTAL

    MIDE LA MISMA VARIABLE DEPENDIENTE PARA CADA SUJETO EN CADA GRUPO.

    CON LA ESTAD.UNIVARIANTE, SE PRETENDE ESTABLECER UNA RELACIN CAUSAL

    ENTRE LA VAR. INDEPENDIENTE Y LA VAR. DEPENDIENTE (PUEDE HABER MAS DE UNA VAR

    INDEPENDIENTE, PERO SOLO HABRA UNA VAR.DEPENDIENTE)

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    19/27

    ANALISIS PARA VARIABLES

    CLASIFICACIN DE LAS VARIABLES: POR SU NATURALEZA

    VARIABLES CUALITATIVAS

    O CATEGRICAS

    VARIABLES

    CUANTITATIVAS

    NMERICAS

    NOMINAL

    ORDINAL

    INTERVALO

    DE RAZN

    DICOTOMICASPOLITOMICAS

    DISCRETASCONTINUAS

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    20/27

    ESTADISTICA DESCRIPTIVA SEGN VARIABLES

    VARIABLESCUALITATIVAS

    VARIABLESCUANTITATIVAS

    MEDIDAS DE RESUMEN

    1. FRECUENCIAS

    2. PORCENTAJES PROPORCIONES

    3. PORCENTAJES ACUMULADOS

    TABLAS CUADROS GRAFICOS

    TABLAS DE DISTRIBUCINDE FREQ

    1. GRAFICOS DE BARRAS2. GRAFICOS DE

    SECTORES

    1. MEDIDAS DE TENDENCIA

    CENTRAL

    2. MEDIDAS DE DISPERSIN

    3. MEDIDAS DE FORMA

    TABLAS DE MEDIDAS DETENDENCIA CENTRAL Y

    DISPERSIN

    1. HISTOGRAMA2. GRAFICOS DE TALLO Y

    HOJAS3. DIAGRAMA DE CAJAS

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    21/27

    ANALISIS PARA VARIABLES CUALITATIVAS

    MEDIDAS DE RESUMEN Son procedimientos de clculos numricos que producen cifras que

    resumen una cantidad de informacin

    Frecuencias

    Frecuencias acumuladas

    Porcentajes

    Porcentajes acumulados

    FRECUENCIA (FREQ)

    Es el nmero de veces que se repite un determinado valor categora dela variable

    FRECUENCIAS ACUMULADAS

    Es la suma de las frecuencias de las categoras menores iguales a unacierta categora de la variable

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    22/27

    PORCENTAJE

    Es el cociente entre la frecuencia y el total de la muestra por cadacategora que toma la variable.

    PORCENTAJES ACUMULADOS

    Es el cociente entre las frecuencias acumuladas de un determinado valor categora y el nmero total de la muestra

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    23/27

    ANALISIS PARA VARIABLES CUALITATIVAS

    DISTRIBUCIN DE FRECUENCIAS

    Tabla construida en orden por categoras indicando para cada una de ellasla: frecuencia, frecuencia acumulada, porcentaje y porcentaje acumulado.

    Lo ms comn es que se presenten las frecuencias y los porcentajes

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    24/27

    ANALISIS PARA VARIABLES CUANTITATIVAS

    MEDIDAS DE TENENCIA CENTRAL

    Medidas empleadas para describir el valor medio de un conjunto de datos

    Las ms usadas son : La media, la mediana y la moda

    MEDIDAS DE DISPERSIN Mide la dispersin de los datos con respecto al promedio

    Medidas de dispersin: Rango, percentiles, rango intercuartilico, varianza,desviacin estndar.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    25/27

    ESTADISTICA INFERENCIAL

    PRUEBA DE HIPOTESIS

    Enunciado acerca de una poblacin para ponerlo a prueba

    PASOS PARA UNA PRUEBA DE HIPOTESIS

    1. FORMULAR UNA HIPOTESIS NULA A SER PROBADA (Ho) Y UNA ALTERNA

    (H1)2. SELECCIONAR EL TIPO DE PRUEBA ESTADISTICA APROPIADA PARA AL TIPO DE

    DATOS REQUERIDOS

    3. ELEGIR EL NIVEL DE SIGNIFICANCIA (Probabilidad de rechazar Ho cuando esverdadera: ( 0,01 a 0,05)

    4. BUSCAR EL ESTADISTICO DE PRUEBA PARA EL (Tabla)5. CALCULAR EL VALOR ESTADISTICO (Z= (X-/ /n)

    6. COMPROBAR ESTE VALOR CON EL DE LA TABLA. SI ES MAYOR SE RECHAZA Ho

    7. OBTENER LA CONCLUSIN SOBRE LA POBLACIN.

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    26/27

    PRUEBA Z

    Compara la media de la muestra con una media hipotticamente existe enuna poblacin y tomar as una decisin.

    Se aplica

    Donde el tamao de muestra es de cualquier orden y se conoce ladesviacin estndar de la poblacin.

    El tamao de la muestra es mayor de 30 y no se conoceDS

    PRUEBA t

    Utilizada en la prueba de hiptesis de las medias cuando se desconoce DSy n es menor de 30

    Se utiliza s como una desviacin de DS

  • 5/26/2018 Procesamiento de Datos y Anlisis Univariado

    27/27

    PRUEBA DE KOLMOGOROV-SMIRNOV

    Usa una comparacin de frecuencias observadas y esperadas paradeterminar si los resultados observados guardan correspondencia con unahiptesis nula especifica para datos ordinales

    JI CUADRADO Se compara una distribucin hipottica de la poblacin con una

    distribucin generada por una muestra con

    X2= (OiEi)2/ Ei

    Oi > # observado de encuestados en categora i

    Ei > # hipottico de encuestados en categora i