1. muestreo aleatorio simple€¦ · un procedimiento de extraer una muestra aleatoria de una...
TRANSCRIPT
10/02/2015 1
UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERIA INDUSTRIAL
Estadística III-Material 2-2012 Revisión y Cambios y Ampliación: Ing. José Alejandro Marín Fuente Primaria: Ing. César Augusto Zapata Urquijo
1. Muestreo Aleatorio Simple
Muestro aleatorio simple es cuando una muestra es formulada de tal
manera que cada elemento en la población tiene la misma oportunidad de ser incluido.
Una forma podría ser escribir en papelitos los nombres de los elementos
de la población y depositarlos en una caja, si la muestra fuera de diez elementos, entonces sacamos diez papelitos.
Otra forma es usar un número de identificación para cada uno de los
integrantes de la población y seleccionar la muestra mediante una tabla de números aleatorios. Como su nombre lo indican estos números han
sido generados mediante un proceso aleatorio en una computadora. Para cada dígito de un número la probabilidad es la misma. Entonces la
probabilidad de que el elemento 22 sea seleccionado es igual a la del elemento 382.
1. Método de selección:
Un procedimiento de extraer una muestra aleatoria de una población
finita es el de enumerar todos los elementos que conforman la
población, escribir esos números en bolas o papelitos echarlos en una bolsa, mezclarlos bien removiéndolos y sacar uno a uno tantos como lo
indique el tamaño de la muestra. En este caso los elementos de la muestra lo constituirán los elementos de la población cuyos números
coincidan con los extraídos de la bolsa.
Otro procedimiento para obtener una muestra de una población ya sea el muestreo con reemplazo o sin reemplazo es mediante la utilización de
la tabla de números aleatorios pero solamente para poblaciones finitas, la utilización de estas tablas puede realizarse de diferentes modos pero
solo expondremos el que consideramos más eficiente ya que no se
10/02/2015 2
necesita de la búsqueda de una gran cantidad innecesaria de números
aleatorios en la tabla, el cual será ejemplificado.
Veamos cómo se procede para la utilización de la tabla. Consideremos
que se desea extraer de una población de tamaño N una muestra de tamaño n. Se selecciona el bloque, la fila y la columna de la tabla que se
va a comenzar, a partir de esta selección se toman tantas columnas como dígitos tiene N. Comenzando por el primer número de las
columnas seleccionadas se irán incluyendo en la muestra aquellos individuos que en la lista de la población (ya sea de forma horizontal o
vertical) ocupa la posición de los n números de las columnas seleccionadas que resultan menores que N, en los casos que al
seleccionar un número en la tabla de números aleatorios sea mayor que N, puede continuarse con el siguiente numero aleatorio.
Ejemplo 1
En una compañía con 750 trabajadores se quiere obtener una muestra
aleatoria de 15 elementos para un chequeo médico. Los trabajadores
fueron numerados del 1 al 750 y mediante una tabla de números aleatorios se procedió a seleccionarlos. El punto de arranque en la tabla
se fijó mediante la hora en ese momento, 3:04, por lo tanto se inició en la columna 3, renglón 4. Como los números de los trabajadores van
desde 1 hasta 750 solo se toman en cuenta las primeras 3 cifras de cada número que se encuentren en ese rango. En seguida se muestra
una parte de la tabla, con el primer y segundo seleccionado:
Tabla de números aleatorios
18893 07211 23634 75296 86155 65832 27568 31727 90756 14268 65051 52438
69553 48743 06254 73002 34432 55737 88808 11755 42537 02294 68261 73891
74762 13168 32235 57554 35551 98909 65424 11892 20410 16332 82346 30389
86729 67167 24091 67155 17880 31659 02868 62563 53144 17494 79513 55413
43788 87547 16648 88536 77678 37739 95434 15078 80473 71844 02765 93879
83382 59617 20074 22002 35536 98298 63522 31818 84784 39280 64191 39429
De tal forma fueron seleccionados que la muestra quedó integrada por los trabajadores con los números:
240 671 178 316 28
625 531 174 554 437
166 377 150 718 27
10/02/2015 3
Este muestreo se puede realizar utilizando Microsoft Excel siguiendo los
pasos siguiente:
a) Se instala la opción de análisis de datos para ello se va a
herramienta luego a complemento y se activa en la ventana complemento la opción herramienta para análisis.
b) Se abre una hoja Excel y se introducen los datos de la población en columna.
c) Se va a herramienta y se elige análisis de datos y en esta ventana se selecciona la opción muestra.
d) En la ventana muestra se introduce el rango de entrada que sería seleccionar todos los valores de la población, si al suministrar en
la hoja Excel los datos de la población al inicio se le designan a estos alguna variable o comentario debe activarse la opción rótulo
de lo contrario no debe ser activada, se activa la casilla de muestreo aleatorio y se introduce el tamaño de muestra deseado.
e) Se selecciona el rango de salida que consiste en seleccionar una celda en la hoja Excel que no esté afectada por ninguna
información ni hacia abajo ni a la derecha de la misma.
f) Se selecciona aceptar en esta ventana y saldrá el resultado deseado que sería las muestras elegidas por el programa en la
población.
10/02/2015 4
Ejemplo 2
Dada la siguiente población formada por la edad de padres de familia de
200 núcleos familiares de una cierta región de la ciudad.
Seleccione una muestra aleatoria de tamaño 10 (use la tabla de
números aleatorios), numere la población horizontalmente.
48 49 50 51 50 46 47 56 47 38
53 50 47 46 48 47 48 46 46 50
42 51 51 49 47 51 48 47 42 49
46 48 50 47 48 47 51 56 45 49
45 54 61 46 48 46 46 47 50 34
46 46 51 39 53 55 52 49 47 46
33 40 52 46 44 52 44 54 41 33
48 49 52 42 42 49 47 47 38 48
44 43 44 40 44 45 49 44 43 42
49 49 48 41 51 51 52 42 40 47
37 48 45 46 50 45 47 53 43 47
44 40 46 46 45 48 47 42 47 46
52 53 47 49 46 47 49 42 43 42
43 38 52 50 44 52 44 53 43 45
41 57 47 48 52 53 40 49 40 50
45 42 44 53 57 46 62 47 50 47
45 51 43 45 39 39 41 44 35 41
54 48 51 53 54 42 48 51 37 38
42 37 52 50 45 55 51 46 38 43
53 43 42 39 46 52 53 39 51 40
Para extraer la muestra lo primero que hacemos es disponer dos
columnas en las cuales la primera se ubicaran los números aleatorios, es decir los números extraídos de la tabla de números aleatorios; y en la
segunda columna se encontrara los valores de la muestra.
Número aleatorio ix Muestra
10/02/2015 5
FORMULAS DE TRABAJO MUESTREO ALEATORIO
Después de desarrollado el proceso de selección de la muestra, se
procede a realizar las estimaciones necesarias para estimar los
parámetros poblaciones y determinar un limite para el error.
1. MEDIA POBLACIONAL
Estimador de la media poblacional μ:
�̂� = �̅� =∑ 𝑦𝑖
𝑛
Varianza Estimada de �̅�:
�̂�(�̅�) = 𝑠2
𝑛(
𝑁 − 𝑛
𝑁)
donde:
𝑠2 =∑(𝑦𝑖 − �̅�)2
𝑛 − 1=
∑ 𝑦𝑖2 −
(∑ 𝑦𝑖)2
𝑛𝑛 − 1
Limite para el Error de estimación:
2√�̂�(�̅�) = 2√𝑠2
𝑛(𝑁 − 𝑛
𝑁)
10/02/2015 6
Ejemplo:
Una muestra irrestricta aleatoria de n=9 registros de un hospital es seleccionada para estimar la cantidad promedio de la deuda sobre
N=484 cuentas abiertas. Los valores de la muestra par estos nueve registros están listados en la tabla siguiente. Estime μ, la cantidad promedio de la deuda, y establezca un limite para el error de estimacion.
Registro
No.
Cantidad de
dinero Adeudada
y1 33.5
y2 32.0
y3 52.0
y4 43.0
y5 40.0
y6 41.0
y7 45.0
y8 42.5
y9 39.0
Al sumar las cantidades en la columna y, obtenemos:
∑ 𝑦𝑖 = 368.0 y ∑ 𝑦𝑖
2 = 15332.5
Yi Yi2
33.5 1122.25
32 1024.00
52 2704.00
43 1849.00
40 1600.00
41 1681.00
45 2025.00
42.5 1806.25
39 1521.00
Suma 368 15332.50
Se necesitan estas dos cantidades para calcular �̅� y s2. La estimación de
μ es:
�̂� =∑ 𝑦𝑖
𝑛=
368.0
9= $40.89
10/02/2015 7
Para calcular el limite para el error de estimación, se debe calcular:
𝑠2 =∑ 𝑦𝑖
2 −(∑ 𝑦𝑖)𝟐
𝑛𝑛 − 1
=15332.5 −
(368.0)2
98 − 1
= 35.67
Utilizando las ecuaciones anteriores, se obtiene el limite para el error de
estimación,
2√�̂�(�̅�) = 2√𝑠2
𝑛(
𝑁 − 𝑛
𝑁) = 2√
35.67
9(
484 − 9
484) = 2√3.89 = 3.944 = $3.94
En resumen, la estimación de la cantidad media de dinero adeudada por
cuenta, μ, es de �̅�=$40.89. Aunque no se puede estar seguro que tan
cerca esta �̅� de μ, se puede decir que hay suficiente confianza en que el
error de estimación es menor que $3.94.
10/02/2015 8
2. TOTAL POBLACIONAL
Muchas encuestas son desarrolladas para obtener información acercas
de un total poblacional. Un auditor de las cuentas del hospital del
ejemplo anterior probablemente podría estar interesado en verificar la cifra calculada para el total de cuentas por cobrar para el total de
cuentas abiertas del hospital.
El total poblacional, es decir, la suma de todas las observaciones de la población, se denota por el símbolo 𝜏. Por lo tanto,
𝑁𝜇 = 𝜏
Estimador del Total Poblacional 𝝉:
�̂� = 𝑁�̅� =𝑁 ∑ 𝑦𝑖
𝑛
Varianza Estimada de �̂�:
�̂�(τ̂) = �̂�(𝑁�̅�) = 𝑁2 (𝑠2
𝑛) (
𝑁 − 𝑛
𝑁)
donde:
𝑠2 =∑(𝑦𝑖 − �̅�)2
𝑛 − 1=
∑ 𝑦𝑖2 −
(∑ 𝑦𝑖)2
𝑛𝑛 − 1
Limite para el Error de estimación:
2√�̂�(𝑁�̅�) = 2√𝑁2
(𝑠2
𝑛) (
𝑁 − 𝑛𝑁
)
10/02/2015 9
EJEMPLO:
Una empresa esta interesada en el tiempo por semana que los científicos emplean en ciertas tareas. Las hojas de control de tiempo de
una muestra de n=50 empleados muestran que la cantidad promedio de
tiempo empleado en esas tareas es de 10.31 horas, con una varianza muestral de s2=2.25. La compañía emplea N=750 científicos. Estime el
numero total de horas-hombre que se pierden por semana en las tareas y establezca un limite para el error de estimación.
Solución:
N=750 �̅�=10.31
N=50 s2=2.25
�̂� = 𝑁�̅� = 750 ∗ 10.31 = 7732.5 ℎ𝑜𝑟𝑎𝑠
Limite para el error:
2√𝑁2 (𝑠2
𝑛) (
𝑁 − 𝑛
𝑁) = 2√7502 (
2.25
50) (
750 − 50
750) = 307.4 ℎ𝑜𝑟𝑎𝑠
Por lo tanto la estimación del tiempo total perdido es de �̂� =7732.5 ℎ𝑜𝑟𝑎𝑠. Además se puede afirmar con un alto nivel de confianza
que el error de estimación es menor que 307.4 horas.
10/02/2015 10
3. SELECCIÓN DEL TAMAÑO DE MUESTRA
El numero de observaciones necesarias para estimar una media y/o total
poblacional con un limite para el error de estimación de magnitud B se
desarrollan a continuación:
Tamaño de muestra requerido para estimar 𝝁 con un limite de
para el error de estimación B:
𝑛 =𝑁𝜎2
(𝑁 − 1)𝐷 + 𝜎2
donde 𝐷 =𝐵2
4
Ejemplo:
La cantidad promedio de cuentas por cobrar de un hospital debe ser estimada, aunque no se cuenta con mucha información, se sabe que las
cuentas tienen una varianza de 𝜎2 = 625. Existen N=1000 cuentas
abiertas, encuentre el tamaño de muestra necesario para estimar 𝜇 con
un limite de para el error de estimación de B=$3.
Se calcula entonces D:
𝐷 =𝐵2
4=
32
4= 2.25
Reemplazando tenemos:
𝑛 =𝑁𝜎2
(𝑁 − 1)𝐷 + 𝜎2=
1000 ∗ 625
(1000 − 1)2.25 + 625= 217.56
Esto es, se necesita aproximadamente 218 observaciones para estimar 𝜇, la media de las cuentas por cobrar, con un limite para el error de
estimación de B=$3.
10/02/2015 11
Tamaño de muestra requerido para estimar 𝝉 con un limite de
para el error de estimación B:
𝑛 =𝑁𝜎2
(𝑁 − 1)𝐷 + 𝜎2
donde 𝐷 =𝐵2
4𝑁2
Ejemplo:
Un investigador esta interesado en estimar la ganancia en peso total en un periodo de 4 semanas de N=1000 pollitos alimentados con cierto
alimento. Obviamente, pesar cada uno de los pollitos seria una tarea tediosa y demorada. Se debe determinar el numero de pollitos que
serán seleccionados para estimar 𝝉 con un limite para el error de
estimación igual a 1000 gramos. Estudios previos dicen que la varianza
poblacional 𝜎2 es de aproximadamente 36 gramos. Determine el tamaño
de muestra requerido.
𝐷 =𝐵2
4𝑁2=
10002
4 ∗ 10002= 0.25
𝑛 =𝑁𝜎2
(𝑁 − 1)𝐷 + 𝜎2=
1000 ∗ 36
(1000 − 1)0.25 + 36= 125.98
Por lo tanto, el investigador necesita pesar n=126 pollitos para estimar el total poblacional 𝝉, la ganancia en peso total en las 4 semanas de
N=1000 pollitos, con un limite para el error de estimación igual a 1000
gramos.
10/02/2015 12
4. PROPORCIÓN POBLACIONAL
En varios casos, el investigador esta interesado en estimar la proporción
(porcentaje) de la población que posee una característica especifica.
Esto se deduce del un experimento binomial en el cual, una observación pertenece o no a la categoría estudiada.
Se definen entonces:
p = Proporción poblacional
�̂� = Estimador de la proporción poblacional
Sea
𝑌𝑖 = 0 No posee la característica
𝑌𝑖 = 1 Si posee la característica
∑ 𝑦𝑖 = 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑞𝑢𝑒 𝑝𝑜𝑠𝑒𝑒𝑛 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎
𝑛
𝑖=1
Estimador de la proporción poblacional �̂�:
�̂� =∑ 𝑦𝑖
𝑛= �̅�
Varianza Estimada de �̂�:
�̂�(�̂�) = 𝑝�̂�
𝑛−1(
𝑁−𝑛
𝑁) donde �̂� = 1 − �̂�
Limite para el Error de estimación:
2√�̂�(�̂�) = 2√�̂��̂�
𝑛 − 1(
𝑁 − 𝑛
𝑁)
10/02/2015 13
Ejemplo
De una muestra irrestricta aleatoria de n=100 estudiantes de ultimo año en una colegio se quiere estimar la fracción (proporción) de
estudiantes que asistirán a la universidad de un total de N=300 estudiantes. Sea entonces yi=0 si el estudiante no planea ir a la
universidad y yi=1 si el estudiante planea ir a la universidad. Usando los datos de la muestra se obtiene que:
∑ 𝑦𝑖 = 15100
𝑖=1 estudiantes respondieron afirmativamente en su intención de
ir a la universidad.
La proporción muestral esta dada por:
�̂� =∑ 𝑦𝑖
𝑛=
15
100= 0.15
El limite para el error de estimación se calcula con:
2√�̂�(�̂�) = 2√�̂��̂�
𝑛(
𝑁 − 𝑛
𝑁) = 2√
(0.15)(0.85)
(100 − 1)(
300 − 100
300) = 0.059
donde �̂� = 1 − �̂� = 1.0.15 = 0.85
Por lo tanto, se estima que 0.15 (15%) de los estudiantes de ultimo año planea ir a la universidad, con un limite para el error de estimación igual
a 0.059 (5.9%).
10/02/2015 14
Tamaño de muestra requerido para estimar �̂� con un limite de
para el error de estimación B:
𝑛 =𝑁𝑝𝑞
(𝑁 − 1)𝐷 + 𝑝𝑞
donde 𝑞 = 1 − 𝑝 𝑦 𝐷 =𝐵2
4
Si p y q son desconocidas, entonces se pueden aproximar a 0.5.
Ejemplo
En el mismo colegio, se quiere realizar una encuesta para determinar la proporción de estudiantes que están a favor de una propuesta. Se debe
determinar el tamaño de muestra (numero de estudiantes a entrevistar) para estimar p con un limite para el error de estimación de magnitud
B=0.05. Existen N=2000 estudiantes en el colegio y no se cuenta con información disponible para estimar p.
Cuando no se cuenta con información previa, se puede aproximar el tamaño de muestra estableciendo p=0.5, se tiene que:
𝑞 = 1 − 𝑝 = 1 − 0.5 = 0.5
𝐷 =𝐵2
4=
0.052
4= 0.000625
𝑛 =𝑁𝑝𝑞
(𝑁 − 1)𝐷 + 𝑝𝑞=
2000(0.5)(0.5)
(2000 − 1)(0.000625) + 0.5)(0.5)= 333.56 ≈ 334
Esto es, 334 estudiantes deberán ser entrevistados para estimar la proporción de estudiantes que están a favor de la propuesta, con un
limite para el error de estimación de magnitud B=0.05.