probabilidad iii parte

FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES

Docente: Paolo Castillo Rubio

Hemos visto cómo se construye un gráfico de frecuencias con datos extraídos de una población. A medida que aumentamos la cantidad de observaciones que tomamos de la población, podemos construir nuestro gráfico con un número mayor de intervalos, aunque de menor amplitud (El rango total cubierto por la población es el mismo).

Si continuamos este proceso, con intervalos cada vez más estrechos y numerosos, los altibajos en el gráfico de la distribución de frecuencias tienden a desaparecer.

En el límite, el ancho del intervalo tiende a cero y la población puede representarse por una distribución de probabilidad continua.

Cuando, para representar esta distribución de probabilidad continua, se utiliza una función matemática, esta se denomina Función de Densidad de Probabilidad.

La forma de la curva en el gráfico de la función de distribución es característica de la población de observaciones asociada con la misma, y depende de variables internas del proceso que generó los datos de la población. Existen distintas funciones de distribución teóricas, cada una de las cuales está basada en un modelo de comportamiento del proceso

que generó el universo de observaciones.

La aplicación de una de estas distribuciones teóricas a una población particular está justificada si las hipótesis (suposiciones) del modelo de comportamiento del proceso que generó la población se cumplen. Dicho de otro modo, si conocemos el proceso, es decir, el conjunto de fenómenos que dieron lugar a nuestra población de mediciones u observaciones, y además estamos seguros de que el mismo se ajusta a un modelo de comportamiento determinado, entonces podemos decir que la distribución de probabilidades de nuestra población es la que corresponde al modelo.En la práctica, se sabe que ciertos procesos y fenómenos generan resultados numéricos cuya distribución de probabilidades se puede ajustar a determinados modelos teóricos. Por ejemplo, el número de partículas alfa emitidas por un material radiactivo sigue una distribución de Poisson.Existen muchas otras distribuciones teóricas, como la Binomial, la Exponencial, la de Weisbull, etc. Cada una de ellas tiene su propio campo de aplicación, que se sostiene en un determinado comportamiento de los fenómenos, y al aplicarla se está haciendo en forma implícita la suposición de que se cumplen las suposiciones del modelo subyacente.

La Distribución Normal

Una distribución muy importante es la Distribución Normal o de Gauss.La ecuación matemática de la función de Gauss es la siguiente:

La distribución normal es una curva con forma de campana, con eje de simetría en el punto correspondiente al promedio del universo . La distancia entre el eje de simetría de la campana y el punto de inflexión de la curva es igual a , la desviación standard de la población.El área total debajo de la curva es igual a 1. El área debajo de la curva comprendida entre - y + es aproximadamente igual a 0,68 del área total; entre - 2 y + 2 es aproximadamente igual a 0,95 del área total:Es importante ver que los únicos parámetros necesarios para dibujar el gráfico de la distribución normal son la Media y desviación standard de la población. Con estos dos parámetros sabemos donde situar la campana de Gauss (En el punto correspondiente a la media) y cuál es su ancho (Determinado por la desviación standard).Cuando nos encontramos con una población de observaciones, si podemos afirmar que la distribución correspondiente es normal, sólo hace falta estimar la media y la desviación standard para tener toda la información necesaria acerca de dicha población.

La Distribución Normal Standard

Podemos escribir la fórmula de la distribución normal de la siguiente manera:

con:

Ésta es la fórmula de la Distribución Normal Standard o Tipificada. Como podemos observar, en ella hay un sólo parámetro, Z, que incluye al promedio y la desviación standard de la población. Esta función está tabulada.Al calcular Z, lo que estamos haciendo, en realidad, es un cambio de variable por el cual movemos la campana de Gauss centrándola en el 0 del eje X, y modificamos el ancho para que la desviación standard sea 1.

De esta manera tenemos tabulada una función de Gauss que no depende de cual sea el promedio y la desviación standard de nuestra población real. El cambio de variable hace que se conserve la forma de la función y que sirva para cualquier población, siempre y cuando esa población tenga una distribución normal.

Cuando queremos calcular las probabilidades para una población real, calculamos Z y entramos en la tabla de la función normal estandard.

La Distribución T de Student

En la generalidad de los casos, no disponemos de la desviación standard de la población, sino de una estimación calculada a partir de una muestra extraída de la misma y, por lo tanto, no podemos calcular Z.

En estos casos calculamos el estadístico T:

Con:

donde: S es la desviación standard muestral, calculada con n-1 grados de libertad.

Nótese que utilizamos S, la Desviación Standard de una Muestra, en lugar de , la Desviación Standard de la

Población.

El estadístico T tiene una distribución que se denomina distribución T de Student, que está tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calculó la desviación standard. La distribución T tiene en cuenta la incertidumbre en la estimación de la desviación standard de la población, porque en realidad la tabla de T contiene las distribuciones de probabilidades para distintos grados de libertad.

La distribución T es más ancha que la distribución normal tipificada para un número de grados de libertad pequeño. Cuando los grados de libertad tienden a infinito, la distribución T tiende a coincidir con la distribución normal standard. Es decir, en la medida que aumentemos el número de observaciones de la muestra, la desviación standard calculada estará más próxima a la desviación standard de la población y, entonces, la distribución T correspondiente se acerca a la distribución normal standard. El uso de la distribución T presupone que la población con que estamos trabajando tiene una distribución normal.

Distribución de Promedios Muestrales

Para comprender que significa distribución de promedios muestrales, vamos a suponer que realizamos un experimento con bombos como los usados en la lotería. Colocamos un número muy grande de bolas blancas en un bombo blanco, en cada una de las cuales figura un dato X. Este bombo representa la población de observaciones X, y tiene media y varianza 2. Supongamos que a continuación hacemos los siguiente:

1) Tomamos una muestra de n=10 bolas blancas.2) Calculamos la media y la anotamos en una bola azul.3) Colocamos la bola azul en un segundo bombo de color azul.4) Devolvemos las bolas blancas a su bombo y le damos vueltas.5)Repetimos toda la operación muchas veces hasta que el bombo azul esté lleno de bolas azules.

Entonces, los números del bombo azul forman una población de promedios muestrales. Esta es una población derivada de la anterior, y tiene la misma media o promedio que la distribución original, pero su varianza es un enésimo de la varianza de la distribución original:

En el caso del bombo azul, si denominamos a la varianza 2

m y m a la media, tenemos:

La distribución de medias muestrales está situada en el mismo lugar (alrededor de la misma media) que la distribución original, pero es mucho más estrecha, porque su varianza es la décima parte de la varianza original. La distribución original de observaciones representada por el bombo blanco se denomina comúnmente distribución madre o base. Al construir la población de promedios muestrales, realizábamos extracciones de 10 bolas blancas después de dar vueltas al bombo. Es decir, que estábamos realizando un muestreo aleatorio de la población madre, porque cada una de las bolas blancas tenía la misma posibilidad de ser elegida para integrar la muestra. Aunque la población original no sea de distribución normal, si el muestreo es aleatorio, la población de promedios muestrales se aproximará a la normalidad, es decir, será casi de distribución normal. Este efecto se debe a un teorema de estadística matemática denominado Teorema Central del Límite. En resumen, si se cumple la hipótesis de muestreo aleatorio, tenemos:

En general, en los problemas que se presentan habitualmente, existe una población de observaciones cualesquiera, de la cual tomamos una muestra aleatoria, por medio de la cual intentamos conocer todo lo que sea posible acerca de la población de la cual fue extraída.

El promedio de la muestra de n elementos pertenece a la distribución de promedios muestrales de la población original. Es decir, que el promedio de la muestra que obtuvimos es uno de los muchos promedios muestrales que se distribuyen alrededor de con desviación standard.Por lo tanto, si la muestra es mas grande (n mayor), estaremos en una distribución de promedios con desviación standard más pequeña, por lo cual, el promedio de la muestra estará más cerca del promedio del universo. Es por esto que es razonable pensar que el promedio de la muestra es una estimación del promedio del universo.

Distribución binomial

Una persona arroja un dado apostando con otra a que saca un as (un 1). La probabilidad de sacar el as es igual a: 1/6 = 0,1666…

Es decir que la probabilidad que tiene de acertar es 17 % aproximadamente. Ahora, supongamos que la persona arroja 5 dados iguales a la vez. ¿Cuál es la probabilidad de que saque 0, 1, 2, 3... ases?Cuando realizamos una experiencia individual donde el resultado debe ser sólo uno de dos posibles: acierto/fallo, cara/cruz, etc., decimos que es un ensayo de Bernouilli.

¿Es tan probable sacar 1 ó 2 ases como sacar 5 ases?. A priori parecería que no. En nuestro caso, cada vez que arrojamos un dado podemos definir nuestro experimento registrando sólo dos resultados posibles:

Cada acto individual de arrojar un dado es independiente de los otros y las probabilidades de obtener un as o de no obtener ninguno, son, respectivamente:

Por lo que, cuando arrojamos 5 dados, la probabilidad de obtener 5 ases es:

Y la probabilidad de no obtener ningún As en los 5 dados arrojados es:

Nos falta calcular las probabilidades intermedias, es decir la probabilidad de obtener 1, 2, 3...ases. Es posible calcular todas estas probabilidades con una fórmula binomial. ¿Cuál es la probabilidad de sacar un As al arrojar cinco dados? Por ejemplo, una forma es que salga un As en el primer dado.

La probabilidad de sacar 1 As en el primer dado y no sacar As en los otros cuatro es:

Pero hay 5 formas diferentes de obtener 1 As en cinco dados arrojados: que se obtenga en el 1º de los dado, o en el 2º o en el 3º o en el 4º o en el 5º.

Por lo tanto, la probabilidad de sacar 1 As al arrojar 5 dados es:

¿Cómo podemos generalizar el cálculo de las distintas formas de obtener 1 As, 2 Ases, etc. en cinco dados ,arrojados? La respuesta la dan los números combinatorios:

La expresión representa el número de combinaciones de m elementos tomados de n en n (agrupados de n en n).

Por ejemplo, si tenemos las 5 letras A, B, C, D y E, y queremos saber cuántas son todas las combinaciones posibles agrupándolas de a tres en cualquier orden: ABC, ADC,...etc., tenemos :

Y las distintas combinaciones son : ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE, BDE, CDE

Supongamos que se realizan n ensayos de Bernoulli, con probabilidad p de tener un acierto, o (1-p) de tener un fallo. Entonces, la probabilidad de obtener y aciertos en n ensayos de Bernouilli es:

Esta probabilidad es un término del binomio siguiente:

,donde p+q = 1

Los términos de la suma son las probabilidades P(y), que determinan la distribución de probabilidades de la variable aleatoria y, la cual es una variable discreta (toma los valores 0, 1, 2, ...etc.). Aplicando la fórmula al caso de 5 dados:

Las probabilidades de no sacar ningún As o de sacar

uno, dos, tres, cuatro o cinco, son :

¿Cuáles son los parámetros estadísticos de la variable aleatoria Y ?

La media es: ; la varianza es: , y, finalmente, la desviación standard resulta:

En la experiencia de arrojar 5 dados:

¿Cómo interpretamos este resultado? Si bien el promedio resulta un valor fraccionario, nos está diciendo que al arrojar los cinco dados estaremos más cerca de sacar 1 As que de sacar 2 o más ases. De una manera más rigurosa, ese valor nos dice que si se repitiera la experiencia muchas veces, el promedio del número de ases que se obtendría en todos los experimentos sería igual a 0.83

La varianza de Y resulta ser: y la desviación standard:

Volvamos, ahora a nuestro jugador. Supongamos que arroja 5 dados y apuesta a que va a sacar 3 o más ases, ¿cuál es la probabilidad que tiene de ganar?

Esta probabilidad es la suma de los términos del binomio para 3, 4 y 5 aciertos (ases), es decir:

Lo que significa una probabilidad de ganar de aproximadamente el 3,5 %.

Distribución de Poisson

Para entender la Distribución de Poisson, vamos analizar un ejemplo detenidamente. Supongamos que se tiene una tabla rectangular de madera, de 1 metro por 1 metro, pintada con un recubrimiento sobre cuya superficie se presentan aleatoriamente pequeños defectos. Estos defectos podrían ser, por ejemplo, partículas muy pequeñas de pigmento que no fueron bien molidas al fabricar la pintura. Se desea calcular la probabilidad de que aparezcan estos defectos y para ello podríamos subdividir la superficie en zonas rectangulares más pequeñas y de igual tamaño:

Tenemos la superficie dividida en 4 zonas rectangulares de igual tamaño. Observamos que en algunas zonas aparece un defecto superficial y en otras no. Vamos a hacer las siguientes suposiciones:

• En cada zona sólo puede aparecer 1 defecto.• Si la probabilidad de que aparezca un defecto en todo el

área es p, la probabilidad de que aparezca un defecto en una zona es p/4.

Entonces, utilizando la Distribución Binomial podemos

calcular la probabilidad de que en nuestra superficie aparezcan 0, 1, 2, 3, 4 defectos:

El promedio de defectos en la superficie total será:

Pero sabemos que en realidad en cada zona podrían aparecer más de 1 defecto. Esto hace inexacto nuestro cálculo. Podríamos hacer el cálculo más exacto si subdividimos las zonas:

Dividimos cada zona en 4 y ahora tenemos 16 zonas. La probabilidad de tener 1 defecto en una zona es p/16 con lo que podemos entonces calcular la probabilidad de tener 0, 1, 2, 3, ...., 16 defectos en el área total:

Y el promedio de defectos en la superficie resulta ser el mismo que antes:

Aún así podrían aparecer más defectos por zona, por lo que

si dividimos nuevamente cada zona en 4 tendríamos 64 zonas y ahora la probabilidad de tener 1 defecto en una zona sería p/64.

La probabilidad de tener 0, 1, 2, 3, ....., 64 defectos en la superficie total sería:

Y nuevamente el promedio de defectos en la superficie es p.

Lo que estamos haciendo es ir aumentando n al mismo tiempo que disminuye p en igual proporción y de ese modo, el promedio de defectos en la superficie total n*p se mantiene constante. Como vimos, al suponer que en cada subzona sólo puede haber 1 defecto o ningún defecto estamos cometiendo un error. Este error se hace cada vez menor, porque a medida que subdividimos el área total se hace menos probable que en una subzona aparezca más de un defecto. Si continuamos subdividiendo el área indefinidamente, la fórmula binomial nos dará la probabilidad de obtener 0, 1, 2, 3, ... n defectos, con n tendiendo a infinito.

En el límite, la fórmula binomial tiende a la fórmula de Poisson:

donde x es la variable aleatoria y el parámetro de la distribución de Poisson. En el límite, el producto de n por p, , es igual al parámetro de la distribución:

El número de defectos x en la superficie total es una variable aleatoria discreta que puede tomar valores 0, 1, 2, 3, 4, ... y cuya distribución de probabilidades se conoce como Distribución de Poisson.

Se puede observar que la curva de la función de Poisson es asimétrica, como la binomial. El promedio y la varianza de esta variable aleatoria son iguales al parámetro de la distribución:

Por lo que, la desviación standard es:

La distribución de Poisson tiene una propiedad cuyas consecuencias son muy importantes para el Control Estadístico de Procesos. Supongamos que se tienen m variables aleatorias de Poisson:

Si w es una combinación lineal de tales variables:

Entonces w es una variable aleatoria de Poisson con parámetro:

Esto es muy importante porque podemos imaginar el producto fabricado por un proceso (Una licuadora, una computadora, un televisor, etc.) como una superficie en la que se pueden producir múltiples defectos, y donde el número de cada tipo de defecto es una variable aleatoria de Poisson. Entonces, la propiedad mencionada nos permite tratar la suma de todos los tipos de defectos como una variable aleatoria de Poisson. Esto se utiliza para el control del Número de Defectos en un producto (Gráficos C).

Supongamos ahora que tenemos un gran lote de artefactos, por ejemplo licuadoras. Tomamos una muestra de m = 5 unidades y medimos el número total de defectos en las 5 unidades. Si obtuvimos x1, x2, x3, ... xm defectos en cada unidad, el número total de defectos será:

El número promedio de defectos por unidad será:

y es una variable aleatoria discreta que puede tomar valores 0, 1/m, 2/m, 3/m, ... etc. ¿Cuál es la varianza de y?

La varianza de xi es cualquiera que sea el subindice i, porque todas las xi tienen la misma distribución; por lo tanto:

Este es un importante resultado que se utilizará para calcular la varianza en los Gráficos U.

probabilidad iii parte

Technology