Dr. Moataza Mahmoud Abdel WahabConferencista en Bioestadìstica
Instituto Superior de Salud PúblicaUniversidad de Alejandría
Términos estadísticos Términos estadísticos importantesimportantes
Población:Población: Un grupo que incluye todas las Un grupo que incluye todas las mediciones de interés para el investigadormediciones de interés para el investigador(La colección de (La colección de todastodas las respuestas, mediciones las respuestas, mediciones o conteos que son de interés)o conteos que son de interés)
Muestra:Muestra:Un subgrupo de la poblaciónUn subgrupo de la población
¿¿Por qué muestrearPor qué muestrear??
Tener información de grandes poblacionesTener información de grandes poblaciones
Menor costo
Menos tiempo en el campo
Mayor seguridad en la colección de datos
Cuando es imposible estudiar a toda la
población
Población objetivo:Población objetivo: La población a ser estudiada/a la cual el La población a ser estudiada/a la cual el
investigador quiere generalizar los resultadosinvestigador quiere generalizar los resultadosUnidad de muestreo:Unidad de muestreo:La unidad más pequeña de la cual la muestra La unidad más pequeña de la cual la muestra
puede ser seleccionadapuede ser seleccionadaEsquema de muestreoEsquema de muestreo Lista de todas las unidades de muestreo de la Lista de todas las unidades de muestreo de la
cual se extrae la muestracual se extrae la muestraFormas de muestreoFormas de muestreoMétodo de seleccionar las unidades de muestreo Método de seleccionar las unidades de muestreo
del esquema de muestreodel esquema de muestreo
Tipos de muestreoTipos de muestreo
Muestras no probabilísticas
Muestras probabilísticas
Muestras no probabilísticasMuestras no probabilísticas
Muestras por conveniencia (fácil acceso)Muestras por conveniencia (fácil acceso)
La muestra es seleccionada de elementos de la población que son fácilmente accesibles
Muestreo bola de nieve (amigos de Muestreo bola de nieve (amigos de amigos….etc.)amigos….etc.)
Muestreo propositivo (juicio)Muestreo propositivo (juicio)Usted elige quien piensa que debe estar
en el estudio Muestra contingenteMuestra contingente
Muestras no probabilísticasMuestras no probabilísticas
La probabilidad de ser elegido se desconoceMenos costos – pero no es de utilidad para generalizar resultados por potenciales sesgos.
Muestras probabilísticasMuestras probabilísticas
Muestreo aleatorio Cada sujeto tiene una probabilidad
conocida de ser seleccionado Permite la aplicación de la teoría de
estadística a los resultados para: Generalizar Probar hipótesis
ConclusionesConclusiones
Muestras probabilísticas son las mejores
Asegura Representatividad Precisión
Métodos usados en muestras Métodos usados en muestras probabilísticasprobabilísticas
Muestreo aleatorio simpleMuestreo aleatorio simple Muestreo sistemáticoMuestreo sistemático Muestreo estratificadoMuestreo estratificado Muestreo de múltiples pasos Muestreo de múltiples pasos Muestreo por conglomerados (cluster)Muestreo por conglomerados (cluster)
Muestreo simple aleatorio
Tabla de números aleatoriosTabla de números aleatorios
6 8 4 2 5 7 9 5 4 1 2 5 6 3 2 1 4 06 8 4 2 5 7 9 5 4 1 2 5 6 3 2 1 4 0
5 8 2 0 3 2 1 5 4 7 8 5 9 6 2 0 2 4 5 8 2 0 3 2 1 5 4 7 8 5 9 6 2 0 2 4
3 6 2 3 3 3 2 5 4 7 8 9 1 2 0 3 2 53 6 2 3 3 3 2 5 4 7 8 9 1 2 0 3 2 5
9 8 5 2 6 3 0 1 7 4 2 4 5 0 3 6 8 69 8 5 2 6 3 0 1 7 4 2 4 5 0 3 6 8 6
Fracción de muestreoFracción de muestreo
Razón entre el tamaño de muestra y el Razón entre el tamaño de muestra y el tamaño de la poblacióntamaño de la población
Muestreo sistemático
Muestreo sistemático
Muestreo por conglomerado Muestreo por conglomerado (clúster)(clúster)
Clúster: un grupo de unidades de muestreo cercanas entre ellas, por ejemplo, viviendo en la misma área o vecindario.
Muestreo por clústerMuestreo por clúster
Sección 4
Sección 5
Sección 3
Sección 2Sección 1
Muestreo estratificadoMuestreo estratificado Muestreo de múltiples pasosMuestreo de múltiples pasos
Error sistemático (o sesgo) Respuesta inapropiada (sesgo de información)
Sesgo de selección
Error de muestreo (error aleatorio)
Errores en muestras
Error tipo 2Error tipo 2
La probabilidad de encontrar una La probabilidad de encontrar una diferencia con nuestra muestra diferencia con nuestra muestra comparada con la población, y no hay una comparada con la población, y no hay una diferencia en realidad….diferencia en realidad….
Conocido como el α (o “error tipo 1”)Conocido como el α (o “error tipo 1”)
Usualmente situado al 5% (o 0.05)Usualmente situado al 5% (o 0.05)
Error tipo 2Error tipo 2
La probabilidad de no encontrar una diferencia La probabilidad de no encontrar una diferencia que actualmente existe entre nuestra muestra que actualmente existe entre nuestra muestra comparada con la población…comparada con la población…
Conocido como β (o “error tipo 2”)Conocido como β (o “error tipo 2”)
Poder es (1- β) y es comúnmente del 80%Poder es (1- β) y es comúnmente del 80%
Tamaño de muestra
Cuantitativa Cualitativa
2D
2σ2Zn
2
22
21
D
)xFσ(σn
2
2
D
π)π(1Zn
2D
F )P-(1 P 2n
Problema 1Problema 1
Un estudio a realizarse para determinar un Un estudio a realizarse para determinar un cierto parámetro en un a comunidad. De cierto parámetro en un a comunidad. De un estudio previo se obtuvo una un estudio previo se obtuvo una desviación estándar de 46.desviación estándar de 46.
Si un error de muestreo de hasta 4 es Si un error de muestreo de hasta 4 es aceptable, ¿cuantos sujetos deberán ser aceptable, ¿cuantos sujetos deberán ser incluidos en este estudio con un nivel de incluidos en este estudio con un nivel de confianza del 99%?confianza del 99%?
RespuestaRespuesta
881~3.88024
246 x 22.58n
2D
2σ2Zn
Problema 2Problema 2 Un estudio será realizado para determinar el Un estudio será realizado para determinar el
efecto de dos medicamentos (A y B) sobre el efecto de dos medicamentos (A y B) sobre el nivel de glicemia. De estudios previos usando nivel de glicemia. De estudios previos usando esos medicamentos, la desviación estándar del esos medicamentos, la desviación estándar del nivel de glicemia fueron de 8 y 12 g/dl, nivel de glicemia fueron de 8 y 12 g/dl, respectivamente.respectivamente.
Un nivel de significancia del 95% y un poder del Un nivel de significancia del 95% y un poder del 90% se requiere para detectar una diferencia de 90% se requiere para detectar una diferencia de medias de 3 gr/dl entre los dos grupos. medias de 3 gr/dl entre los dos grupos. ¿Cuantos sujetos deberán ser incluidos en cada ¿Cuantos sujetos deberán ser incluidos en cada grupo?grupo?
RespuestaRespuesta
groupeachin
243~6.2423
)x10.512(8n
2
22
2
22
21
D
)xFσ(σn
En cada grupo
Problema 3Problema 3Se busca estimar la proporción de niños Se busca estimar la proporción de niños
anémicos en una escuela preparatoria. En anémicos en una escuela preparatoria. En un estudio similar en otra escuela se un estudio similar en otra escuela se detectó una proporción del 30%.detectó una proporción del 30%.
Calcule el tamaño de muestra requerido a Calcule el tamaño de muestra requerido a un límite de confianza del 95% y un límite de confianza del 95% y aceptando una diferencia de hasta 4% en aceptando una diferencia de hasta 4% en la población.la población.
RespuestaRespuesta
505~21.504(0.04)
0.3)0.3(1 x 1.96n
2
2
2
2
D
π)π(1Zn
Problema 4Problema 4En estudios previos, el porcentaje de En estudios previos, el porcentaje de
hipertensos entre diabéticos fue de 70% y hipertensos entre diabéticos fue de 70% y entre no diabéticos fue de 40% en una entre no diabéticos fue de 40% en una cierta comunidad. cierta comunidad.
Un investigador quiere realizar un estudio Un investigador quiere realizar un estudio comparativo para hipertensos entre comparativo para hipertensos entre diabéticos y no diabéticos e un intervalo diabéticos y no diabéticos e un intervalo de confianza del 95% y poder del 80%. de confianza del 95% y poder del 80%. ¿Cual es el tamaño mínimo de muestra a ¿Cual es el tamaño mínimo de muestra a ser tomada de cada grupo con 4% de ser tomada de cada grupo con 4% de diferencia del verdadero valor?diferencia del verdadero valor?
RespuestaRespuesta
2.24130.04
x7.80.55) -(1 0.55 x 2n
2
2D
F )P-(1 P 2n
PrecisiónCosto