presentación de powerpoint - talleres · si el muestreo se hace en una población normal con...

26
Distribuciones de muestreo fundamentales y descripciones de datos Muestreo aleatorio En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. El muestreo es por lo tanto una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de hacer inferencias sobre dicha población. Poblaciones y muestras Una población consta de la totalidad de las observaciones en las que estamos interesados. Una muestra es un subconjunto de una población.

Upload: lytruc

Post on 20-Sep-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Distribuciones de muestreo fundamentales y descripciones de datosMuestreo aleatorio

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos deuna población), se selecciona una muestra, entendiendo por tal una parte representativa de lapoblación. El muestreo es por lo tanto una herramienta de la investigación científica, cuya funciónbásica es determinar que parte de una población debe examinarse, con la finalidad de hacerinferencias sobre dicha población.

Poblaciones y muestras

Una población consta de la totalidad de las observaciones en las que estamosinteresados.

Una muestra es un subconjunto de una población.

Page 2: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Algunos estadísticos importantes

Cualquier función de las variables aleatorias que forman una muestra aleatoria se llama estadístico.

Medidas de localización de una muestra: la media, la mediana y la modamuestrales

a) Media muestral:

Medidas de localización de una muestra: la media, la mediana y la modamuestrales

b) Mediana muestral:

Page 3: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

c) La moda muestral es el valor que ocurre con mayor frecuencia en la muestra.

Ejercicio capítulo 8

8.3 Los tiempos que los 9 individuos de una muestra aleatoria tardan en reaccionarante un estimulante se registraron como 2.5, 3.6, 3.1, 4.3, 2.9, 2.3, 2.6, 4.1 y 3.4segundos. Calculea) la media;b) la mediana.

Solución

a) 𝑿 =𝟐.𝟓+𝟑.𝟔+⋯+𝟑.𝟒

𝟗=

𝟐𝟖,𝟖

𝟗= 𝟑, 𝟐

b) Ordenamos los datos de menor a mayor

2,3 2,5 2,6 2,9 3,1 3,4 3,6 4,1 4,3

Page 4: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Las medidas de variabilidad de una muestra: la varianza, la desviación estándar y el rango de la muestra

a) La varianza muestral:

Page 5: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Ejercicio capítulo 8 8.12 El contenido de alquitrán de 8 marcas de cigarrillos que se seleccionan al azar de lalista mas reciente publicada por la Comisión Federal de Comercio es el siguiente: 7.3, 8.6,10.4, 16.1, 12.2, 15.1, 14.5 y 9.3 miligramos. Calculea) la media;b) la varianza.

Solución

a) 𝑿 =𝟕.𝟑+𝟖.𝟔+⋯+𝟗.𝟑

𝟖=

𝟗𝟑,𝟓

𝟖= 𝟏𝟏,6875

Page 6: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Ejercicio capítulo 8 8.12 El contenido de alquitrán de 8 marcas de cigarrillos que se seleccionan al azar de lalista mas reciente publicada por la Comisión Federal de Comercio es el siguiente: 7.3, 8.6,10.4, 16.1, 12.2, 15.1, 14.5 y 9.3 miligramos. Calculea) la media;b) la varianza.

Solución

b) 𝑺𝟐 =𝟕,𝟑−𝟏𝟏,𝟔𝟖𝟕𝟓 𝟐+⋯+ 𝟗,𝟑−𝟏𝟏,𝟔𝟖𝟕𝟓 𝟐

𝟖−𝟏= 𝟏𝟎, 𝟕𝟕

Page 7: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Distribuciones muestrales

El campo de la inferencia estadística trata básicamente con generalizaciones y predicciones.

Definición: La distribución de probabilidad de un estadístico se denomina distribución muestral.

La distribución muestral de un estadístico depende de la distribución de la población, del tamaño de lasmuestras y del método de selección de las muestras.

Distribución muestral de medias y el teorema del límite centralLa primera distribución muestral importante a considerar es la de la media 𝑋. Suponga que de una poblaciónnormal con media μ y varianza σ2 se toma una muestra aleatoria de n observaciones.

Page 8: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Teorema del límite central: Si 𝑋 es la media de una muestra aleatoria de tamaño n, tomada de una poblacióncon media μ y varianza finita σ2 entonces la forma límite de la distribución de

𝑍 = 𝑋 − 𝜇

𝜎/ 𝑛

a medida que n →∞, es la distribución normal estándar n(z; 0, 1).

Distribución muestral de la diferencia entre dos medias

Page 9: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Ejercicio capítulo 8

825.La vida media de una máquina para hacer pan es de siete años, con

una desviación estándar de un año. Suponga que las vidas de estas

máquinas siguen aproximadamente una distribución normal y calcule:

a) la probabilidad de que la vida media de una muestra aleatoria de nueve

de estas máquinas caiga entre 6.4 y 7.2 años;b) el valor de x a la derecha del cual caería 15% delas medias calculadas de

muestras aleatorias de tamaño 9.

Page 10: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

8.26 La cantidad de tiempo que le toma al cajero de un banco con servicio en elautomóvil atender a un cliente es una variable aleatoria con una media μ = 3.2 minutosy una desviación estándar σ = 1.6 minutos. Si se observa una muestra aleatoria de 64clientes, calcule la probabilidad de que el tiempo medio que el cliente pasa en laventanilla del cajero sea

a) a lo sumo 2.7 minutos;b) mas de 3.5 minutos;c) al menos 3.2 minutos pero menos de 3.4 minutos.

Page 11: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

828. Se toma una muestra aleatoria de tamaño 25 de una población normal que tieneuna media de 80 y una desviación estándar de 5. Una segunda muestra aleatoriade tamaño 36 se toma de una población normal diferente que tiene una media de75 y una desviación estándar de 3. Calcule la probabilidad de que la mediamuestral calculada de las 25 mediciones exceda la media muestral calculada de las36 mediciones por lo menos 3.4 pero menos de 5.9. Suponga que las diferencias delas medias se miden al décimo más cercano.

Page 12: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

829.La distribución de alturas de cierta raza de perros terrier tiene una media de 72centímetros y una desviación estándar de 10 centímetros; en tanto que ladistribución de alturas de cierta raza de poodles tiene una media de 28centímetros con una desviación estándar de 5 centímetros. Suponga que lasmedias muestrales se pueden medir con cualquier grado de precisión y calcule laprobabilidad de que la media muestral de una muestra aleatoria de alturas de 64terriers exceda la media muestral para una muestra aleatoria de alturas de 100poodles a lo sumo 44.2 centímetros.

Page 13: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Distribución muestral de la media muestral para muestras pequeñas

Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son detamaño n < 30, entonces, la distribución muestral de la media muestral X es la t de Student con n − 1 grados delibertad.

Este teorema implica que la variable aleatoria 𝑡 = 𝑋−𝜇 𝑋

𝜎 𝑋tiene distribución t con n − 1 grados de libertad.

Donde 𝜇 𝑋 es la media de la población y 𝜎 𝑋 =𝑠

𝑛

1. Suponga que de una población normal con media 20 se toma una muestra de tamaño 16. Si la desviaciónestándar muestral es 4, encuentre la probabilidad de que la media muestral sea estrictamente mayor que 21,753.

2. Una muestra aleatoria de seis autos de un determinado modelo consumen las siguientes cantidades enkilómetros por litro:

18, 6 18, 4 19, 2 20, 8 19, 4 20, 5.Determine la probabilidad de que el consumo de gasolina medio muestral de los automóviles de este modelo seamenor que 17,6 kilómetros por litro, suponiendo que la distribución de la población es normal con media 17.

Ejemplos

Page 14: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Distribución muestral de una proporción muestral

Sea X el número de éxitos en una muestra binomial de n observaciones, donde la probabilidad de éxito es p. Entonces, la

proporción de éxitos en la muestra 𝑝 =𝑋

𝑛recibe el nombre de PROPORCIÓN MUESTRAL.

En la mayoría de las aplicaciones, el parámetro p será la proporción de individuos de una gran población que posean lacaracterística de interés.

Teorema Sea p la proporción de éxitos en una muestra aleatoria de n observaciones. Sea p la proporción de éxitos en la

población. Entonces, la distribución muestral de la proporción muestral 𝑝 tiene media 𝜇 𝑝 = 𝑝 y varianza 𝜎 𝑝2dada por

Page 15: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

(Teorema de De Moivre-Laplace) Sea 𝑝 la proporción de éxitos en una muestra aleatoria de n

observaciones. Si se cumple alguna de las dos condiciones siguientes:

• n ≥ 30 o

• np ≥ 5 y n(1 − p) ≥ 5,

entonces, la distribución muestral de la proporción muestral p se puede aproximar con una distribución normal.

Este teorema implica que la variable aleatoria 𝑍 = 𝑝−𝜇 𝑝

𝜎 𝑝tiene distribución normal. Aquí, 𝜇 𝑝 y varianza 𝜎 𝑝 se calculan

de acuerdo al teorema anterior.

1. Se toma una muestra de 250 casas de una población de edificios antiguos para estimar la proporción de casas deeste tipo cuya instalación eléctrica resulta insegura. Supongamos que, de hecho, el 30% de todos los edificios deesta población tienen una instalación insegura. Hallar la probabilidad de que la proporción de edificios de lamuestra con instalación insegura esté entre 0,25 y 0,35.

2. Hallar la probabilidad de que en 200 lanzamientos de una moneda no falsa, el número de caras estécomprendido en el 40% y el 60%.

Ejemplos

Page 16: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Distribución muestral de diferencia de dos proporciones muestrales

Page 17: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

1. Los hombres y mujeres adultos radicados en una ciudad grande del norte de cierto país difieren en susopiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se creeque el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo el 10% de lasmujeres adultas lo están. Si se pregunta a dos muestras aleatorias, una de 150 hombres y otra de 100mujeres, su opinión sobre la promulgación de la pena de muerte para personas culpables de asesinato,determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el demujeres.

2. Se cree que 0,16 de las industrias de un ´área metropolitana I son textiles. Se cree además que en unárea metropolitana II esta proporción es de 0,11. Si estas cifras son exactas, ¿cuál es la probabilidad deque una muestra aleatoria simple de 200 industrias del ´área I y una muestra aleatoria simpleindependiente de 225 industrias del área II arrojen una diferencia entre las proporciones muestralesmayor o igual que 0,10?

Ejemplos

Page 18: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Distribución muestral de diferencia de medias

Primer caso: varianzas poblacionales conocidas o desconocidas y muestras grandes

1

Page 19: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Segundo caso: varianzas poblacionales desconocidas, iguales y muestras pequeñas.

2

Page 20: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Tercer caso: varianzas poblacionales desconocidas, diferentes y muestras pequeñas.

3

Page 21: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

1. La distribución de pesos de los animales de cierto pueblo asiático tiene un peso medio de 72 kilogramos y unadesviación estándar de 10 kilogramos, mientras que la distribución de pesos de los animales de cierto puebloafricano tiene un peso medio de 28 kilogramos con una desviación estándar de 5 kilogramos. Suponga que lasmedias muestrales se pueden medir con cualquier grado de precisión. Encuentre la probabilidad de que la mediamuestral para una muestra aleatoria de pesos de 64 animales del pueblo asiático exceda la media muestral parauna muestra aleatoria de alturas de 100 animales del pueblo africano por cuando mucho 44,2 kilogramos.

2. Suponga que dos drogas A y B, de las que se dice que reducen el tiempo de respuesta de las ratas a determinadoestímulo, se están comparando en un experimento de laboratorio. El experimentador supone que las respectivaspoblaciones de los tiempos de respuesta al estímulo están distribuidos normalmente y que sus varianzaspoblacionales son iguales y desconocidas. Se administra la droga A a 12 ratas y la droga B a 13. Cuando se lleva acabo el experimento, la reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que estánrecibiendo la droga A es 30,45 milisegundos con una desviación típica de 5 milisegundos. Los datoscorrespondientes a la droga B son 24,9 y 6 milisegundos. ¿Cuál es la probabilidad de que la diferencia entre lareducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga A yla reducción promedio de tiempo de respuesta al estímulo por parte de las ratas que están recibiendo la droga Bsea menor o igual a la que se observó en el experimento? Suponga que no hay diferencia alguna entre las dosdrogas con respecto a la reducción promedio en tiempos de respuestas y que las drogas son igualmente efectivas.

Page 22: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Distribución muestral de S2

Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población normal que tiene la varianza σ2,entonces el estadístico

tiene una distribución chi cuadrada con v = n – 1 grados de libertad.

Los valores de la variable aleatoria 2 se calculan de cada muestra mediante la fórmula

La probabilidad de que una muestra aleatoria produzca un valor χ2 mayor que algún valor específico es igual al área bajo la curva a la derecha de este valor. El valor χ2 por arriba del cual se encuentra un área de α por lo general se representa con χ2

α. Esto se ilustra mediante la región sombreada de la figura

Page 23: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

1. Cuando un proceso de producción está funcionando correctamente, la resistencia en ohmios de loscomponentes que produce sigue una distribución normal con desviación típica 3,6. Se toma una muestraaleatoria de cuatro componentes. ¿Cuál es la probabilidad de que la varianza muestral sea mayor a 27?

2. Un fabricante de latas de guisantes está interesado en que el peso medio de su producto esté próximo al pesoanunciado. Además, desea que no haya mucha variabilidad en los pesos de las latas de guisantes, ya que de locontrario, una gran proporción de latas diferiría sensiblemente del peso anunciado. Asumamos que ladistribución poblacional de los pesos es normal. Se toma una muestra aleatoria de veinte latas. Hallar el valor

de k que verifica la relación 𝑃𝑠2

𝜎2= 0,05

Entonces, 𝑃 𝜒2 19 > 19𝑘 = 0,95. Por tanto, de la tabla, encontramos que 19k = 10,12. De donde k = 0, 533.La conclusión es que la probabilidad de que la varianza muestral sea menor que un 53% de la varianzapoblacional es 0,05.

Page 24: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,

Distribución muestral de la razón de dos varianzas

En una prueba sobre la efectividad de dos tipos de píldoras para dormir, A y B, se utilizarán dos gruposindependientes de personas con insomnio. A un grupo de tamaño 61 se le administrará la píldora A y al otro grupo,de tamaño 41, se le administrará la B, registrándose el número de horas de sueño de cada individuo participante enel estudio. Suponiendo que el número de hora de sueño de quienes usan cada tipo de píldora se distribuyenormalmente y que s2A = s2B, calcule la probabilidad de que la razón de las varianzas muestrales de A y B sea mayorque 1,64.

Page 25: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,
Page 26: Presentación de PowerPoint - Talleres · Si el muestreo se hace en una población normal con varianza desconocida y si las muestras seleccionadas son de tamaño n < 30, entonces,