estadística inferencial -...
TRANSCRIPT
ESTADÍSTICA INFERENCIAL
1
Sesión No. 4
Nombre: Distribuciones de probabilidad para variables. Parte II. Objetivos: Al finalizar la sesión, el estudiante conocerá y calculará las
probabilidades de una distribución de Poisson. Así mismo aplicará con una
herramienta computacional las distribuciones: binomial, hipergeométrica y de
Poisson.
Contextualización
Para analizar problemas de líneas de espera, confiabilidad y control de calidad
como el número de personas que llegan a un lugar determinado en un tiempo
definido, existe una distribución de probabilidades llamada distribución de
Poisson que es utilizada en estos casos. Esta distribución, al igual que la
binomial y la hipergeométrica es una distribución para variables aleatorias
discretas que te será de gran utilidad en el campo laboral.
En la actualidad, el software estadístico ha hecho posible aplicar la estadística
sin tener necesidad de realizar laboriosos cálculos, requiriendo sólo segundos de
procesamiento computacional. Además, existe una gran cantidad de personas
que emplean los métodos de la estadística en casi todas las áreas del
conocimiento y las profesiones.
ESTADÍSTICA INFERENCIAL
2
Introducción al Tema
¿Cómo describir el número de veces que un evento ocurre en un espacio finito de observaciones?
Imagen recuperada de: lowres.cartoonstock.com
En esta sesión conocerás las características básicas de la distribución de
Poisson, desarrollada por Siméon-Denis Poisson (1781-1840). Esta distribución
de probabilidad es un buen modelo para datos que representa el número de
sucesos de un evento determinado en una unidad definida de tiempo o espacio.
Por otro lado, dentro del subtema aplicaciones de cómputo se incluye el uso de
la hoja electrónica Excel 2016, que te permitirá obtener resultados de manera
rápida y certera de problemas relacionados con las distribuciones de
probabilidad de variables discretas, logrando un gran beneficio que se refleja en
una toma de decisiones más adecuada.
ESTADÍSTICA INFERENCIAL
3
Explicación
2.4 Distribución de Poisson
¿Qué es la distribución de Poisson y en qué situaciones se emplea?
La distribución de probabilidad de Poisson describe el número de veces que se
presenta un evento durante un intervalo específico. El intervalo puede ser de
tiempo, distancia, área o volumen (Lind, Marchal, & Wathen, 2012). Esta
distribución nos permite analizar problemas como el número de personas que
llegan a un lugar determinado en un tiempo definido, el número de bacterias en
un cultivo, la cantidad de vehículos que transitan por una autopista, el número de
bloqueos viales por manifestaciones al día en la ciudad de México, el número de
solicitudes de pacientes que requieren atención médica en un hospital, etc.
La distribución de Poisson es aplicable si se cumplen los siguientes supuestos:
Generalmente, la letra 𝑋 representa a esta variable aleatoria discreta y puede
tomar valores enteros (0, 1, 2, 3,…). Se utiliza la letra minúscula 𝑥 para señalar
un valor específico que dicha variable puede tomar. La probabilidad de tener
exactamente 𝑥 ocurrencias en una distribución de Poisson matemáticamente se
describe así:
𝑷(𝑿 = 𝒙) =𝝀𝒙𝒆−𝝀
𝒙!
1. La variable aleatoria es el número de veces que ocurre un evento durante
un intervalo definido.
2. La probabilidad de que ocurra un evento es proporcional al tamaño del
intervalo.
3. Los eventos ocurren al azar y son independientes unos de otros.
ESTADÍSTICA INFERENCIAL
4
Donde:
𝝀: 𝑒𝑒 𝑙𝑙 𝑚𝑒𝑚𝑚𝑙 𝑚𝑒 𝑙𝑙 𝑐𝑙𝑐𝑐𝑚𝑚𝑙𝑚 𝑚𝑒 𝑣𝑒𝑐𝑒𝑒 (é𝑥𝑚𝑐𝑥𝑒)𝑞𝑞𝑒 𝑒𝑒 𝑝𝑝𝑒𝑒𝑒𝑐𝑐𝑙 𝑞𝑐 𝑒𝑣𝑒𝑐𝑐𝑥 𝑒𝑐 𝑞𝑐 𝑚𝑐𝑐𝑒𝑝𝑣𝑙𝑙𝑥
𝑝𝑙𝑝𝑐𝑚𝑐𝑞𝑙𝑙𝑝
𝒆: 𝑒𝑒 𝑙𝑙 𝑐𝑥𝑐𝑒𝑐𝑙𝑐𝑐𝑒 2.71828 (𝑏𝑙𝑒𝑒 𝑚𝑒𝑙 𝑒𝑚𝑒𝑐𝑒𝑚𝑙 𝑚𝑒 𝑙𝑥𝑙𝑙𝑝𝑚𝑐𝑚𝑥𝑒 𝑐𝑒𝑝𝑒𝑝𝑚𝑙𝑐𝑥𝑒)
𝒙: 𝑒𝑒 𝑒𝑙 𝑐ú𝑚𝑒𝑝𝑥 𝑚𝑒 𝑣𝑒𝑐𝑒𝑒 𝑞𝑞𝑒 𝑒𝑒 𝑝𝑝𝑒𝑒𝑒𝑐𝑐𝑙 𝑞𝑐 𝑒𝑣𝑒𝑐𝑐𝑥
𝑷(𝑿): 𝑒𝑒 𝑙𝑙 𝑝𝑝𝑥𝑏𝑙𝑏𝑚𝑙𝑚𝑚𝑙𝑚 𝑚𝑒 𝑞𝑐 𝑣𝑙𝑙𝑥𝑝 𝑒𝑒𝑝𝑒𝑐í𝑓𝑚𝑐𝑥 𝑚𝑒 𝑥
La media y la varianza de la distribución de Poisson son iguales y se calculan
simplemente como:
𝑽𝑽𝑽𝑽𝑽 𝒆𝒆𝒆𝒆𝑽𝑽𝒆𝑽 = 𝝀 𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽 = 𝝀
Ahora veamos un ejemplo. Se sabe que en
promedio se reciben 2 clientes en un centro
comercial durante un minuto cualquiera. Si
se supone una distribución de Poisson.
Calcular la probabilidad de que en un minuto
dado:
a. Ningún cliente ingrese al centro comercial.
b. Se reciban más de dos clientes.
Solución:
Sea 𝑋 el número de clientes por minuto, y suponiendo que 𝑋 tiene distribución
de Poisson con 𝜆 = 2.
Para el inciso a) se tiene que
𝑃(𝑋 = 0) =20𝑒−2
0!= 0.1353
Fuente: america-retail.com
ESTADÍSTICA INFERENCIAL
5
La probabilidad de que ningún cliente ingrese al centro comercial en un minuto
dado es de 13.5%.
Para el inciso b)
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)]
𝑃(𝑋 > 2) = 1 − �20𝑒−2
0!+
21𝑒−2
1!+
22𝑒−2
2!� = 1 − 𝑒−2 �
20
0!+
21
1!+
22
2!� = 0.3233
En este caso la probabilidad de que ingresen al centro comercial más de 2
clientes por minuto es de 32.3%.
Alternativamente, se pueden usar las tablas acumulativas de Poisson. Todo lo
que necesitas saber son los valores de 𝑥 y de 𝜆 en este ejemplo para el inciso a)
𝑥 = 0 y 𝜆 = 2 se tiene el valor de 𝑃(𝑋 = 0) en la intersección, el cual es 𝑃(𝑋 =
0) = 0.1353.
ESTADÍSTICA INFERENCIAL
6
Para el inciso b)
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)]
De la tabla se obtiene
𝑃(𝑋 = 0) = 0.1353
𝑃(𝑋 = 1) = 0.2707
𝑃(𝑋 = 2) = 0.2070
Entonces
𝑃(𝑋 > 2) = 1 − (0.1353 + 0.2707 + 0.2707) = 0.3233
2.5 Aplicaciones de cómputo
¿Qué herramientas de cómputo conoces para calcular probabilidades de las distribuciones binomial, hipergeométrica y de Poisson?
Imagen recuperada de: negociosyemprendimiento.org
En la actualidad existen muchos y variados paquetes estadísticos en el mercado
como SPSS, Minitab, Statgraphics y Excel, entre otros. Ya que Excel es un
software al que pueden acceder todos y se presta a múltiples aplicaciones
estadísticas, vamos a ver cómo calcular las probabilidades de las distribuciones
binomial, hipergeométrica y de Poisson con esta hoja de cálculo.
ESTADÍSTICA INFERENCIAL
7
La función de Excel para calcular probabilidades binomiales es DISTR.BINOM.N.
Esta función tiene cuatro argumentos:
1. Núm_éxito: Número de éxitos en los ensayos (𝒙)
2. Ensayos: Número de ensayos independientes (𝑽)
3. Prob_éxito: Probabilidad de éxito en cada ensayo (𝒆)
4. Acumulado: Valor lógico que determina la forma de la función. Se
emplea FALSO si se quiere la probabilidad de 𝑥 éxitos y VERDADERO si
se desea la probabilidad acumulada de 𝑥 o menos éxitos.
A continuación, se muestra cómo calcular la probabilidad de que 6 elementos
defectuosos se encuentren en una muestra de 10 elementos si la probabilidad
de un elemento defectuoso es 0.5.
Se puede observar que el número de elementos defectuosos (𝑥 ) sigue una
distribución binomial con 𝑐 = 10 y 𝑝 = 0.5.
En la siguiente imagen se observa como seleccionar en la hoja de cálculo la
función de Excel para calcular probabilidades binomiales DISTR.BINOM.N.
Puedes identificar previamente si lo deseas en las celdas A1, A2 y A3 a los
elementos de la función ( 𝑥, 𝑐,𝑝) y en las celdas B1, B2 y B3 sus respectivos
valores. En la celda A4 identificas la probabilidad deseada y seleccionas la celda
B4.
ESTADÍSTICA INFERENCIAL
8
Posteriormente ingresamos en el cuadro de dialogo los valores de cada
argumento, en este caso el acumulado será FALSO, y en automático obtienes
en la parte inferior de los argumentos el resultado: 0.255078125.
Al dar Aceptar se registra en la celda B4 seleccionada, que corresponde a la
probabilidad de que exactamente 6 elementos se encuentren defectuosos de 10
ensayos correctos.
Si quisiéramos calcular la probabilidad de que 6 o menos elementos defectuosos
(𝑥 ≤ 6) se encuentren en una muestra de 10 elementos, si la probabilidad de un
elemento defectuoso es 0.5. De igual forma ingresamos en el cuadro de dialogo
los valores de cada argumento, en este caso el acumulado será VERDADERO, y
se obtendrá el valor de 𝑃(𝑥 ≤ 6) = 0.828125, como se muestra en la imagen.
ESTADÍSTICA INFERENCIAL
9
Para el caso de la distribución hipergeométrica se procede de manera similar.
La función de Excel para calcular la probabilidad hipergeométrica es la
DISTR.HIPERGEOM.N. La cual tiene los siguientes argumentos:
1. Muestra_éxito: Número de éxitos en los ensayos (𝒙)
2. Núm_de_muestra: Número de ensayos (𝑽)
3. Población_éxito: Número de éxitos en la población (𝑽)
4. Núm_de_población: Número de elementos de la población (𝑵)
5. Acumulado. Un valor lógico que determina la forma de la función. Se
emplea FALSO si se quiere la probabilidad de 𝑥 éxitos y VERDADERO si
se desea la probabilidad acumulada de 𝑥 o menos éxitos.
Retomando el ejemplo de la sesión anterior se ilustra el cálculo con Excel de
esta distribución. De 50 carteles para un congreso, 12 no cumplen con los
requisitos establecidos. Si se seleccionan aleatoriamente diez carteles para
ESTADÍSTICA INFERENCIAL
10
revisarlos, ¿cuál es la probabilidad de que exactamente tres de los diez no
cumpla los requisitos?
Tenemos que:
𝑥 = 3 𝑐 = 10 𝑝 = 12 𝑁 = 50
Ingresamos en el cuadro de dialogo los valores de cada argumento, en este
caso el acumulado será FALSO, y en automático obtienes el valor de la
probabilidad de que exactamente tres de los diez no cumpla los requisitos es de
0.270286325.
Ahora vamos a ver que la función de Excel para calcular la probabilidad de
Poisson es POISSON.DIST. La cual tiene los siguientes argumentos:
1. X: El número de eventos (𝒙)
ESTADÍSTICA INFERENCIAL
11
2. Media: Número promedio de veces que ocurre un evento en cierto tiempo
o espacio (𝝀)
3. Acumulado: Un valor lógico que determina la forma de la función. Se
emplea FALSO si se quiere la probabilidad de 𝑥 éxitos y VERDADERO si
se desea la probabilidad acumulada de 𝑥 comprendido entre 0 y 𝑥 ambos
incluidos.
Por ejemplo, la cantidad de llamadas telefónicas que se reciben en una cierta
oficina en una hora es 5 en promedio. Suponiendo que es una variable con
distribución de Poisson, determina la probabilidad de que en cualquier hora se
reciban no más de 3 llamadas.
Después de introducir los argumentos en el cuadro de diálogo se obtiene la
probabilidad 𝑃(𝑥 ≤ 3) = 0.265025915.
¿Cómo calcularías la probabilidad de que en dos horas cualesquiera se recibieran no más de 2 llamadas telefónicas?
ESTADÍSTICA INFERENCIAL
12
Conclusión
En esta sesión pudiste ver que la distribución de Poisson, llamada así en honor a
Simeón-Denis Poisson, es una distribución de probabilidad discreta que expresa
a partir de una tasa de ocurrencia media, la probabilidad de que ocurra un
determinado número de eventos durante un intervalo de tiempo o de espacio.
Existen diferentes paquetes de software para estadística que evitan tediosos
cálculos y permiten concentrarse en el análisis de datos. En este caso hemos
visto que la hoja de cálculo de Excel nos permite calcular las probabilidades de
las distribuciones binomial, hipergeométrica y de Poisson de manera sencilla y
certera.
¿Cómo se calculan las distribuciones de probabilidad de las variables continuas?
ESTADÍSTICA INFERENCIAL
13
Para aprender más
Cuando cae un avión, ¿a los pocos días cae otro?
¿No tiene usted la sensación de que cuando ocurre un accidente de avión, a los pocos días hay otro? En
julio del año pasado tres aviones de pasajeros cayeron en ochos días. En total murieron 462 personas.
Harro Ranter, director de la Red de Seguridad en Aviación -que cataloga los accidentes aéreos-, dijo al
diario El Mundo que no es raro que se den estas seguidillas de siniestros. Analizó los accidentes desde
1990 en aviones con capacidad para más de 14 pasajeros.
El experto encontró 45 fechas en las que hubo dos o más accidentes (salvo colisiones). Y en 105 casos
hubo siniestros en días consecutivos. Uno hoy y otro mañana. Ciento cincuenta veces se dio eso en los
últimos 25 años.
Ranter dijo que "es más común que ocurra un accidente un día después de otro que dos, tres o más días
más tarde".
Arnold Barnett, profesor de Estadística en el Instituto de Tecnología de Massachusetts dijo a la BBC que
esto es "una coincidencia, excepto por la tecnicalidad de que las condiciones meteorológicas adversas que
involucran tormentas y huracanes son más comunes en unas estaciones que en otras".
El número máximo más probable de accidentes de aviones comerciales con más de 18 pasajeros en un
período de ocho días en 10 años es de 3, dijo Barnett aunque basándose en la teoría de la distribución del
matemático y físico Poisson, no descarta que sea más probable que haya intervalos cortos entre los
accidentes que largos.
"Si ocurriera un (accidente) el 1º de agosto, la probabilidad de que el próximo suceda un día después -el 2
de agosto- es 1/365. Pero el chance de que haya un accidente aéreo el 3 de agosto es (364/365) x (1/365),
pues el próximo accidente ocurrirá el 3 de agosto sólo si no hay uno el 2 de agosto", añadió.
El académico calculó que en los países desarrollados la posibilidad de morir en un accidente aéreo es
alrededor de una en 25 millones por vuelo. "Un niño en un aeropuerto británico tiene más probabilidad de
llegar a ser primer ministro, ganar una medalla de oro olímpica o recibir el premio Nobel de física que de
morirse en el avión en el que se va a montar".
Hasta en los países menos desarrollados, la probabilidad de morir en un vuelo es alrededor de una en
750.000, dijo la nota de El Mundo.
Fuente: Cuando cae un avión, ¿a los pocos días cae otro? (24 de marzo de 2015). El Observador.
Obtenido de http://www.elobservador.com.uy/cuando-cae-un-avion-a-los-pocos-dias-cae-otro-n301131
ESTADÍSTICA INFERENCIAL
14
¿Cómo calcular probabilidades binomiales con Minitab?
• Leandro, G. (24 de agosto de 2013). Uso de Minitab: distribución binomial.
[Archivo de video] Recuperado de:
https://www.youtube.com/watch?v=mIdpCn5pHkI
ESTADÍSTICA INFERENCIAL
15
Actividad de Aprendizaje
Instrucciones:
Con la finalidad de profundizar en los conocimientos adquiridos a lo largo de esta
sesión, ahora tendrás que realizar la siguiente actividad:
Resuelve los siguientes problemas empleando ya sea la hoja de cálculo de Excel
o algún otro software de estadística al cual tengas acceso.
1. En una cierta estación de radio llegan 48 llamadas por hora de la audiencia.
a) Calcula la probabilidad de recibir exactamente 10 llamadas telefónicas en
un lapso de 5 minutos.
b) Estima la probabilidad de recibir exactamente 10 llamadas en un lapso de
15 minutos.
2. Los pasajeros de las aerolíneas llegan en forma aleatoria e
independientemente al mostrador de revisión de pasajeros. La tasa promedio
de llegadas es 10 pasajeros por minuto.
a) Calcula la probabilidad de que no llegue ningún pasajero en un lapso de
un minuto.
b) Calcula la probabilidad de que lleguen 3 o menos pasajeros en un lapso
de un minuto.
c) De que no llegue ningún pasajero en un lapso de 15 segundos.
3. Un supervisor en una fábrica procede de acuerdo a una norma de control de
calidad, la cual consiste en elegir al azar 20 productos al azar diariamente y
determinar el número de unidades defectuosas. Si existen dos o más
productos defectuosos la producción se detiene para inspeccionarlos equipos.
Si la probabilidad de que un producto salga defectuoso es del 5%. ¿Cuál será
la probabilidad de que en cualquier día la producción se detenga para aplicar
la norma de control de calidad?
ESTADÍSTICA INFERENCIAL
16
4. El departamento de sistemas de computación hace planes para contratar
este año a 5 ingenieros. Cuenta con 12 candidatos que han salidos bien
evaluados, de los cuales 4 son hombres y 8 mujeres. ¿Cuál es la
probabilidad de que 3 de los 5 contratados sean mujeres?
Inserta las capturas de pantalla en un procesador de textos y analiza los
resultados obtenidos, al final tendrás que guardarlo en formato PDF, y entregarlo
de acuerdo a las indicaciones de tu profesor.
Recuerda que esta actividad te ayudará a familiarizarte con el software
estadístico para el cálculo de probabilidades de las distribuciones binomial,
hipergeométrica y de Poisson.
Esta actividad representa el 5% de tu calificación y se tomará en cuenta lo
siguiente:
• Tus datos generales.
• Título del ejercicio.
• Ejercicios resueltos de forma correcta y completa con su respectiva
captura de pantalla.
• Ortografía y redacción.
• Análisis y conclusiones.
ESTADÍSTICA INFERENCIAL
17
Bibliografía
• Alvarado Verdín, V. M. (2014). Probabilidad y estadística. México: Patria.
• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística
para administración y economía (10 ed.). México: Cengage Learning.
• Anderson, D. R., Sweeney, D. J., Williams, T. A., & Martin, K. (2011).
Métodos cuantitativos para los negocios (11 ed.). México: Cengage
Learning.
• Berenson, M. L., & Levine, D. M. (1996). Estadística básica en
administración. Conceptos y aplicaciones. México: Pearson Educación.
• Devore, J. L. (2008). Probabilidad y estadística para ingeniería y ciencias
(8 ed.). México: Cengage Learning.
• González, M. M. T., & Pérez de Vargas, A. (2012). Estadística aplicada.
Una visión instrumental. España: Díaz de Santos.
• Guerrero Peña, A., Buitrago Cardona, M. V., & Curieses Paulete, M. A.
(2007). Estadística básica. Medellín: ITM.
• Levin, R. I., & Rubin, D. S. (2004). Estadística para administración y
economía (7 ed.). México: Pearson Educación.
• Lind, D. A., Marchal, W. G., & Wathen, S. A. (2012). Estadística aplicada a
los negocios y economía (15 ed.). México: McGraw-Hill.
• Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2015). Introducción a la
probabilidad y estadística (14 ed.). México: Cengage Learning.
• Render, B., Stair, R. M., & Hanna, M. E. (2012). Métodos cuantitativos
para los negocios (11 ed.). México: Pearson Educación.
ESTADÍSTICA INFERENCIAL
18
• Rodríguez Franco, J., Pierdant Rodríguez, A., & Rodríguez Jiménez, E. C.
(2014). Estadística para administración. México: Grupo Editorial Patria.
• Valentin, H. (2015). Excel 2016: paso a paso. Estados Unidos: Dream
Berry.
Cibergrafía
• Cuando cae un avión, ¿a los pocos días cae otro? (24 de marzo de 2015).
El Observador. Recuperado de:
http://www.elobservador.com.uy/cuando-cae-un-avion-a-los-pocos-dias-
cae-otro-n301131
• Leandro, G. (24 de agosto de 2013). Uso de Minitab: distribución binomial.
[Archivo de video] Recuperado de:
https://www.youtube.com/watch?v=mIdpCn5pHkI
Te invito a que consultes la Biblioteca Digital UNID