[exposicion] modelos probabilísticos aplicados

Modelos

Probabilísticos

Aplicados

Catedrático:

Dr. Fernando López

Agenda

Distribución t-Student

Distribución ²

Intervalos de Confianza Parámetros de la

Normal

a) Media Simple

b) Diferencia de Medias

Sus aplicaciones giran alrededor de las

inferencias sobre una media de la

población o la diferencia entre dos

medias de población.

Sin embargo, se supuso que la desviación

estándar se conoce, lo cual en la mayoría de

las aplicaciones reales se desconoce

(desviación estándar) para una población σ.

Esto hace necesario remplazar σ con un

estimado, usualmente con el valor de la

desviación estándar de la muestra S.

Como resultado, una estadística natural a considerar para tratar con las inferencias de μ es:

T= 𝑋 −𝜇𝑆

𝑛

Si el tamaño de la muestra es pequeño, lo valores de 𝑆2 oscilan de forma considerable de una muestra a otra y la distribución T se desvía de forma apreciable de la de una distribución normal estándar.

Si el tamaño de la muestra es

suficientemente grande, digamos n≥30, la

distribución T no difiere considerablemente

de la normal estándar, por otro lado, para

n<30, es útil tratar con la distribución exacta

de T.

Sea Z una variable aleatoria normal estándar y V una variable aleatoria ji cuadrada con k grados de libertad. Si Z y V son independientes, entonces la distribución de la variable aleatoria T, donde

T=𝑍

𝑉𝑘

,

Está dada por

ℎ 𝑡 =Γ

𝑘+1

2

Γ𝑘

2𝜋𝑘

1 +𝑡2

𝑘

− 𝑘+12

, -∞ < t < ∞

Esta se conoce como distribución t con

k grados de libertad

La distribución de T es similar a la de Z , pues

ambas son simétricas alrededor de una media

cero. Ambas distribuciones tienen forma de

campana, pero la distribución T es más variable,

debido al hecho de que los valores T dependen

de las oscilaciones de dos cantidades 𝑋 𝑦 𝑆2,

mientras que los valores de Z dependen solo de

los cambios de 𝑋 de una muestra a otra.

Únicamente

cuando el tamaño de la muestra n

∞

Las dos

distribuciones

serán la misma.

En la figura se

muestra la relación

entre una

distribución normal

estándar ( k=∞) y

las distribuciones t

con 1,2,4 y 10

grados de libertad.

Debido a su importancia la distribución t

se ha tabulado extensamente.

Por ejemplo, la tabla que se presenta a continuación contiene los valores de 𝑡𝛼,𝑘

para

α = 0.40, 0.30, 0.20, 0.10, 0.50, 0.25, 0.010,

0.005, 0.0001, 0.0005, y k= 1,2,…30.

Donde 𝑡𝛼,𝑘 es tal que el área a su derecha

bajo la curva de la distribución t con k grados de libertad es igual a α . Esto es, 𝑡𝛼,𝑘

es tal que si T es una variable aleatoria que

tiene distribución t con k grados de libertad,

entonces:

𝑃(𝑇 ≥ 𝑡𝛼,𝑘)= α

La tabla no contiene valores de 𝑡𝛼,𝑘

para α>0.50, puesto que la densidad es

simétrica con respecto a t=0 y por tanto 𝑡1−𝛼,𝑘 = −𝑡𝛼,𝑘.

𝑡0.95 = −𝑡0.05

𝑡0.99 = −𝑡0.01

Etc..

En 16 corridas de prueba de una hora, el consumo de gasolina de una máquina promedió 16.4 galones con una desviación estándar de 2.1 galones. Pruebe la afirmación de que el consumo promedio de gasolina es de 12 galones por hora.

Solución:

n=16, 𝑋 =16.4, S= 2.1, μ=12

𝑡 =16.4−122.1

16 =8.3

Puesto que en la tabla se muestra que para k=15 la

probabilidad de obtener un valor T mayor que 4.073 es

0.0005, un valor mayor que 8 debe ser despreciable, por lo

tanto concluimos que el valor promedio de consumo de

gasolina por hora excede a los 12 galones.

Encuentre la probabilidad de –t0.025 < t < t0.05.

Solución:

Como t0.05 deja un área de 0.05 a la

derecha, y –t0.025 deja un área de 0.025 a

la izquierda, encontramos un área total de

1-0.05-0.025 = 0.925.

P( –t0.025 < t < t0.05) = 0.925

Esta distribución se puede ver como un

caso especial de la distribución gamma

haciendo α=v/2 y β=2, donde v es un

entero positivo.

Tiene un solo parámetro, v, llamado

grados de libertad.

Función gamma:

Donde α > 0 ,β > 0 y:

La distribución gamma juega un

papel importante en la teoría de

colas y en problemas de

confiabilidad.

Esta distribución se relaciona muy

bien con la distribución

exponencial, por lo que también se

relaciona en tiempos entre

llegadas en instalaciones de

servicio, y los tiempos de operación

antes del fallo de partes

componentes y sistemas eléctricos.

Donde v es un entero positivo

Esta distribución no tiene sentido para

valores negativos de x.

Para v=1 y v=2, la función de densidad de

x=0 se hace infinito:

Χ2(0)=∞

Para el resto de los valores de v,

para x=0, la función vale 0.

Se usan distintos tipos de tablas y

algoritmos para consultar

soluciones teniendo los grados de

libertad y el intervalo de confianza.

La distribución chi cuadrada es de

suma importancia, ya que es la

base para una gran variedad de

procedimientos de inferencia

estadística.

Este tipo de distribución esta

íntimamente relacionada con las

distribuciones normales.

Suponga que desea conocer la

distribución de una variable aleatoria con

una distribución chi cuadrada de 6

grados de libertad sea mayor a 3.4.

Según lo anterior tenemos:

En tablas tenemos que el valor de

es: 0.242777

Realizando el cálculo:

Tenemos que:

Cuál es la probabilidad de que una

variable aleatoria con distribución chi

cuadrada de 8 grados de libertad este

comprendida entre 3.4 y 5.6.

Según tablas obtenemos que:

y

Realizando los cálculos obtenemos:

La distribución de 𝑋 está centrada en y en la mayoría de las aplicaciones la varianza tiene un valor mas pequeño que cualesquiera de los otros estimadores de . Así la media muestral 𝑥 se utilizará como una estimación puntual para la media de la población .

Recuerde que 𝜎𝑋 2 = 𝜎2/𝑛 , por lo que una muestra

grande dará un valor de 𝑋 que proviene de una distribución de muestre con varianza pequeña de aquí que 𝑥 es probablemente una estimación muy precisa de cuando n es grande.

Consideremos ahora la estimación por

intervalo de . Si la muestra se selecciona a partir de una población normal ó a falta de

ésta. Si n es suficientemente grande (n>30),

podemos establecer un intervalo de

confianza para al considerar la distribución muestral de 𝑋 .

De acuerdo con el teorema del límite central, podemos esperar que la distribución muestral de 𝑋 esté distribuida de forma aproximadamente normal con media 𝜇𝑋 = 𝜇 y desviación estándar 𝜎𝑋 =𝜎/ 𝑛 . Al escribir 𝑍𝛼

2 para el valor z por

arriba del cual encontramos un área de /2

1)(22

zZzP

n

XZ

/

1)

/

(22

z

n

XzP

Al multiplicar cada término en la

desigualdad entre 𝜎/ 𝑛, y después restar 𝑋

y multiplicar por -1 (para invertir el sentido

de las desigualdades), obtenemos:

1)

/

(22

z

n

XzP

1)(

22 n

zX

n

zXP

Por lo tanto:

n

zX

n

zX

22

Se encuentra que la conc. promedio de

Zn que se saca del agua a partir de una

muestra de mediciones de Zn en 36 Sitios

diferentes es 2.6 gramos por mililitro.

Encuentre los intervalos de confianza de

95% y 99% para la concentración media

de Zn en el rio. Suponga que la SD de la

población es de 0.3

Solución

La estimación puntual de es 𝒙 =2.6. El valor z, que

deja un área de 0.025 a la derecha es: 𝑧0.025 = 1.96

Para un intervalo de confianza de 99% lo único que

cambia es el valor de 𝑧0.025 = 2.575

)

36

3.0)(96.1(6.2)

36

3.0)(96.1(6.2

7.25.2

73.247.2

z

z

x

e

1

2

))(2

1(2

¿Qué tan grande se requiere una muestra en

el ejemplo anterior, si queremos tener un

intervalo de confianza del 95% para que

nuestra estimación de difiera por menos de

0.05?

)3.0

)(96.1(6.2)3.0

)(96.1(6.2

nn

05.0)3.0

)(96.1(

n

3.138

05.0

)3.0)(96.1(2

n 139n

Si se tienen dos poblaciones con medias 𝜇1 𝑦 𝜇2 y

varianzas 𝜎12 𝑦 𝜎2

2 respectivamente, un estimador puntual de la diferencia entre 𝜇1 𝑦 𝜇2 esta dado Por la estadistica 𝑥 1 − 𝑥 2. Para obtener una estimación puntual de 𝜇1 − 𝜇2, se seleccionarán dos muestras aleatorias independientes, una de cada poblacion, de tamaños n1 y n2 y se calcula la diferencia de las medias de las muestras 𝑥 1 − 𝑥 2

Si estas muestras se seleccionan de poblaciones normales, o si ello no es posible, si tanto n1 como n2 son mayores que 30, se puede establecer un intervalo de confianza para 𝜇1 − 𝜇2, considerando la distribución muestral de 𝑥 1 − 𝑥 2

De acuerdo con el teorema de la distribución muestral de medias para muestras independientes, se puede esperar que la distribucion muestral de 𝑥 1 − 𝑥 2 tenga aprox. Una distribución normal con una media 𝜇𝑥 1−𝑥 2= 𝜇1 − 𝜇2 y desviación estándar

𝜎𝑥 1−𝑥 2=𝜎1

2

𝑛1+

𝜎22

𝑛2

Se puede afirmar con una

probabilidad de 1-𝛼 que la variable

normal estándar

Z= 𝑥 1−𝑥 2 − 𝜇1−𝜇2

𝜎12

𝑛1+

𝜎22

𝑛2

Caerá entre -Z𝛼 2 y Z𝛼 2

Por lo que:

P(-Z𝛼 2 < Z < Z𝛼 2 )

INTERVALO DE CONFIANZA PARA 𝜇1 −𝜇2 ; con

𝜎12 𝑦 𝜎2

2 conocidas. Un intervalo de confianza A

(1-∝)100% para 𝜇1 −𝜇2 es

𝑥 1 − 𝑥 2 - 𝑧𝛼 2 𝜎1

2

𝑛1+

𝜎22

𝑛2 < 𝜇1 −𝜇2 < 𝑥 1 − 𝑥 2 +

𝑧𝛼 2 𝜎1

2

𝑛1+

𝜎22

𝑛2

Donde 𝑥 1𝑦 𝑥 2 son las medias de las muestras

aleatorias independientes de tamaños n1 y n2,

tomadas de poblaciones con varianzas conocidas 𝜎1

2 𝑦 𝜎22 respectivamente, y 𝑧𝛼 2 es el

valor de la distribución normal estándar que

deja un área de 𝛼 2 hacia la derecha.

50 mujeres y 75 hombres presentaron un

examen de química. Las mujeres obtienen

una calificación promedio de 76 con una

desviación estándar de 6, mientras que los hombres obtienen una calificación

promedio de 82 con una desviación

estándar de 8. Encuentre el intervalo de

confianza al 96% para la diferencia

𝜇1 − 𝜇2, donde 𝜇1 es la puntuación media

de los muchachos y 𝜇2 es la puntuación

media de todas las que lo presentaron.

La estimación puntual de 𝜇1 − 𝜇2, es 𝑥 1 − 𝑥 2=82-

76=6. Ya que tanto n1 como n2 son grandes, se

puede substituir S1=8 por 𝜎1 y S2=6 por 𝜎2.

Utilizando 𝛼=0.04 de la tabla, se encuentra que Z 0.054. Sustituyendo en la formula anterior se

obtiene el intervalo de confianza al 96%

6-2.05464

75+

36

50< 𝜇1 − 𝜇2<6+2.054

64

75+

36

50

O

3.42< 𝜇1 − 𝜇2 <8.58

INTERVALO DE CONFIANZA EN MUESTRAS

PEQUEÑAS PARA 𝜇1 − 𝜇2; con 𝜎12 = 𝜎2

2

DESCONOCIDAS. Un intervalo de confianza al

A(1-𝛼)100% para 𝜇1 − 𝜇2 es 𝑥 1 − 𝑥 2 -

𝑡𝛼2 𝑆𝑝

1

𝑛1+

1

𝑛2< 𝜇1 − 𝜇2< 𝑥 1 − 𝑥 2 +𝑡𝛼

2 𝑆𝑝

1

𝑛1+

1

𝑛2

Donde 𝑥 1 y 𝑥 2 son las medias de muestras independientes

pequeñas de tamaños n1 y n2 respectivamente,

tomadas de distribuciones aprox normales, Sp es la desviación estándar mancomunada y 𝑡𝛼

2 es el valor de

la distribución t con n1+n2 -2 grados de libertad que deja

un área de 𝛼 2 a la derecha.

En varios procesos quimicos se comparan dos

catalizadores para medir su efecto en la reacción

resultante.

Se prepara una muestra de 12 experimentos

utilizando el catalizador 1 y una muestra de 10

experimentos con el catalizador 2. Los 12

experimentos realizados con el catalizador 1 dieron

un promedio que alcanzó 85 con una desviación

estándar de la muestra 4, el promedio de la muestra

dio un promedio de 81 y una desviación estándar de

5.

Encuentre el intervalo de confianza al 90% para la

diferencia entre las medias de las poblaciones.

Suponiendo que tienen distribuciones aprox normales

con varianzas iguales

La estimación puntual de 𝜇1 − 𝜇2 es 𝑥 1 − 𝑥 2=85-

81=4

La estimación mancomunada 𝑠𝑝

2 de la varianza

común 𝜎2 es

𝑆𝑝2 =

𝑛1 − 1 + 𝑛2 − 1 𝑆22

𝑛1 + 𝑛2 − 2

𝑆𝑝

2=[(11)(16)+(9)(25)] / (12+10-2) = 20.05 Sp=4.478

Usando 𝛼=0.1 se encuentra que t 0.05=1.725 para

v=n1+n2-2=20 grados de libertad

Al sustituir en la formula se obtiene el intervalo de confianza al 90%

4-(1.725)(4.478) 1

12+

1

10 < 𝜇1 − 𝜇2< 4-

(1.725)(4.478) 1

12+

1

10

0.69< 𝜇1 − 𝜇2<7.31

Si las varianzas de las poblaciones son diferentes.

La estadistica utilizada es:

T’= 𝑥 1−𝑥 2 − 𝜇1−𝜇2

𝑠12

𝑛1+

𝑠22

𝑛2

Que tiene aprox una distribucion t con v grados de libertad, donde

V=𝑠12 𝑛1 +𝑠2

2𝑛2

𝑠12

𝑛1

2

𝑛1−1 +𝑠22

𝑛2

2

𝑛2−1

Usando la estadistica T’

P(-t𝛼 2 <T’ < t 𝛼 2 ) =1-𝛼 Donde t 𝛼 2 es el valor de la distribucion t con v

grados de libertad.

INTERVALO DE CONFIANZA EN MUESTRAS PEQUEÑAS PARA

𝜇1 − 𝜇2 CON 𝜎12 ≠ 𝜎2

2 Y DESCONOCIDAS.

Un intervalo de confianza (1-𝛼)100% aprox para 𝜇1 − 𝜇2 es

𝑥 1 − 𝑥 2 -𝑡𝛼2

𝑠12

𝑛1+

𝑠22

𝑛2< 𝜇1 − 𝜇2< 𝑥 1 − 𝑥 2 +𝑡𝛼

2 𝑠12

𝑛1+

𝑠22

𝑛2

Donde 𝑥 1𝑠1 y 2 𝑥 2𝑠𝑦

2 son las medias y varianzas de muestras

independientes pequeñas de tamaños n1 y n2, tomadas de distribuciones aprox normales y 𝑡𝛼 2 es el valor de la

distribución t con

V=

𝑠12

𝑛1 +𝑠2

2 𝑛2 2

𝑠12 𝑛1

2𝑛1−1 + 𝑆2

2 𝑛3 2

𝑛2−1

Grados de libertad que deja un área de 𝛼 2 hacia la

derecha

INTERVALO DE CONFIANZA PARA 𝜇1 − 𝜇2

para observaciones apareadas.

Un intervalo de confianza A(1-𝛼)100% para

𝜇𝐷 es:

𝑑 -𝑡𝛼2

𝑆𝑑

𝑛< 𝜇𝐷 < 𝑑 + 𝑡𝛼

2 𝑆𝑑

𝑛

Donde 𝑑 y 𝑆𝑑 son la media y desviación

estándar de las diferencias de n pares de

mediciones y 𝑡𝛼2 es el valor de la

distribución t con v=n-1 grados de libertad

que deja un área de 𝛼 2 hacia la derecha.

20 estudiantes de

matemáticas fueron divididos

en 10 parejas, teniendo cada

miembro de la pareja aprox

el mismo cociente de

inteligencia. Uno de cada

pareja se selecciona al azar y

se asigna una sección que

utiliza material programado.

Parej

a

Materi

al

Profes

or

d

1 76 81 -5

2 60 52 8

3 85 87 -2

4 58 70 -12

5 91 86 5

6 75 77 -2

7 82 90 -8

8 64 63 1

9 79 85 -6

10 88 83 5

El otro miembro se asigna a una sección

que cuenta con profesor. Al finalizar el

semestre ambos grupos presentan el mismo

examen obteniendo los sig. resultados

Encuentre un intervalo de confianza al 98% para la

diferencia real en el promedio de calificaciones de

los dos procedimientos de enseñanza

Intervalo de confianza del 98% para 𝜇1 − 𝜇2 donde

𝜇1y 𝜇2 representan las calificaciones promedio de los

grupos con material programado y con profesor.

Las observaciones son apareadas, 𝜇1 − 𝜇2=𝜇𝐷.

La estimación puntual de 𝜇𝐷 esta dada por 𝑑=-1.6. La

varianza 𝑠𝑑2 de las diferencias de las muestras es:

𝑆𝑑2=

𝑛𝛴 𝑑𝑖2− 𝑑𝑖

2

𝑛 𝑛−1 = 40.7 𝑆𝑑=6.38.

Usando 𝛼=.02 en la tabla, t 0.01=2.821 para v=n-

1=9 grados de libertad.

Sustituyendo en la formula obtenemos el

intervalo de confianza al 98%

-1.6-(2.821)6.38/ 10<𝜇𝐷<-1.6+(2.821)6.38/ 10

-7.29<𝜇𝐷<4.09

Probabilidad y Estadística para Ingenieros;

Walpole, Myers, Myers ; Sexta Edición , Editorial Prentice Hall

Capítulos 5,6 y 8

[exposicion] modelos probabilísticos aplicados

Education