[exposicion] modelos probabilísticos aplicados
DESCRIPTION
Exposicion de Modelos ProbabilisticosTRANSCRIPT
Modelos
Probabilísticos
Aplicados
Catedrático:
Dr. Fernando López
Agenda
Distribución t-Student
Distribución ²
Intervalos de Confianza Parámetros de la
Normal
a) Media Simple
b) Diferencia de Medias
Sus aplicaciones giran alrededor de las
inferencias sobre una media de la
población o la diferencia entre dos
medias de población.
Sin embargo, se supuso que la desviación
estándar se conoce, lo cual en la mayoría de
las aplicaciones reales se desconoce
(desviación estándar) para una población σ.
Esto hace necesario remplazar σ con un
estimado, usualmente con el valor de la
desviación estándar de la muestra S.
Como resultado, una estadística natural a considerar para tratar con las inferencias de μ es:
T= 𝑋 −𝜇𝑆
𝑛
Si el tamaño de la muestra es pequeño, lo valores de 𝑆2 oscilan de forma considerable de una muestra a otra y la distribución T se desvía de forma apreciable de la de una distribución normal estándar.
Si el tamaño de la muestra es
suficientemente grande, digamos n≥30, la
distribución T no difiere considerablemente
de la normal estándar, por otro lado, para
n<30, es útil tratar con la distribución exacta
de T.
Sea Z una variable aleatoria normal estándar y V una variable aleatoria ji cuadrada con k grados de libertad. Si Z y V son independientes, entonces la distribución de la variable aleatoria T, donde
T=𝑍
𝑉𝑘
,
Está dada por
ℎ 𝑡 =Γ
𝑘+1
2
Γ𝑘
2𝜋𝑘
1 +𝑡2
𝑘
− 𝑘+12
, -∞ < t < ∞
Esta se conoce como distribución t con
k grados de libertad
La distribución de T es similar a la de Z , pues
ambas son simétricas alrededor de una media
cero. Ambas distribuciones tienen forma de
campana, pero la distribución T es más variable,
debido al hecho de que los valores T dependen
de las oscilaciones de dos cantidades 𝑋 𝑦 𝑆2,
mientras que los valores de Z dependen solo de
los cambios de 𝑋 de una muestra a otra.
Únicamente
cuando el tamaño de la muestra n
∞
Las dos
distribuciones
serán la misma.
En la figura se
muestra la relación
entre una
distribución normal
estándar ( k=∞) y
las distribuciones t
con 1,2,4 y 10
grados de libertad.
Debido a su importancia la distribución t
se ha tabulado extensamente.
Por ejemplo, la tabla que se presenta a continuación contiene los valores de 𝑡𝛼,𝑘
para
α = 0.40, 0.30, 0.20, 0.10, 0.50, 0.25, 0.010,
0.005, 0.0001, 0.0005, y k= 1,2,…30.
Donde 𝑡𝛼,𝑘 es tal que el área a su derecha
bajo la curva de la distribución t con k grados de libertad es igual a α . Esto es, 𝑡𝛼,𝑘
es tal que si T es una variable aleatoria que
tiene distribución t con k grados de libertad,
entonces:
𝑃(𝑇 ≥ 𝑡𝛼,𝑘)= α
La tabla no contiene valores de 𝑡𝛼,𝑘
para α>0.50, puesto que la densidad es
simétrica con respecto a t=0 y por tanto 𝑡1−𝛼,𝑘 = −𝑡𝛼,𝑘.
𝑡0.95 = −𝑡0.05
𝑡0.99 = −𝑡0.01
Etc..
En 16 corridas de prueba de una hora, el consumo de gasolina de una máquina promedió 16.4 galones con una desviación estándar de 2.1 galones. Pruebe la afirmación de que el consumo promedio de gasolina es de 12 galones por hora.
Solución:
n=16, 𝑋 =16.4, S= 2.1, μ=12
𝑡 =16.4−122.1
16 =8.3
Puesto que en la tabla se muestra que para k=15 la
probabilidad de obtener un valor T mayor que 4.073 es
0.0005, un valor mayor que 8 debe ser despreciable, por lo
tanto concluimos que el valor promedio de consumo de
gasolina por hora excede a los 12 galones.
Encuentre la probabilidad de –t0.025 < t < t0.05.
Solución:
Como t0.05 deja un área de 0.05 a la
derecha, y –t0.025 deja un área de 0.025 a
la izquierda, encontramos un área total de
1-0.05-0.025 = 0.925.
P( –t0.025 < t < t0.05) = 0.925
Esta distribución se puede ver como un
caso especial de la distribución gamma
haciendo α=v/2 y β=2, donde v es un
entero positivo.
Tiene un solo parámetro, v, llamado
grados de libertad.
Función gamma:
Donde α > 0 ,β > 0 y:
La distribución gamma juega un
papel importante en la teoría de
colas y en problemas de
confiabilidad.
Esta distribución se relaciona muy
bien con la distribución
exponencial, por lo que también se
relaciona en tiempos entre
llegadas en instalaciones de
servicio, y los tiempos de operación
antes del fallo de partes
componentes y sistemas eléctricos.
Donde v es un entero positivo
Esta distribución no tiene sentido para
valores negativos de x.
Para v=1 y v=2, la función de densidad de
x=0 se hace infinito:
Χ2(0)=∞
Para el resto de los valores de v,
para x=0, la función vale 0.
Se usan distintos tipos de tablas y
algoritmos para consultar
soluciones teniendo los grados de
libertad y el intervalo de confianza.
La distribución chi cuadrada es de
suma importancia, ya que es la
base para una gran variedad de
procedimientos de inferencia
estadística.
Este tipo de distribución esta
íntimamente relacionada con las
distribuciones normales.
Suponga que desea conocer la
distribución de una variable aleatoria con
una distribución chi cuadrada de 6
grados de libertad sea mayor a 3.4.
Según lo anterior tenemos:
En tablas tenemos que el valor de
es: 0.242777
Realizando el cálculo:
Tenemos que:
Cuál es la probabilidad de que una
variable aleatoria con distribución chi
cuadrada de 8 grados de libertad este
comprendida entre 3.4 y 5.6.
Según tablas obtenemos que:
y
Realizando los cálculos obtenemos:
La distribución de 𝑋 está centrada en y en la mayoría de las aplicaciones la varianza tiene un valor mas pequeño que cualesquiera de los otros estimadores de . Así la media muestral 𝑥 se utilizará como una estimación puntual para la media de la población .
Recuerde que 𝜎𝑋 2 = 𝜎2/𝑛 , por lo que una muestra
grande dará un valor de 𝑋 que proviene de una distribución de muestre con varianza pequeña de aquí que 𝑥 es probablemente una estimación muy precisa de cuando n es grande.
Consideremos ahora la estimación por
intervalo de . Si la muestra se selecciona a partir de una población normal ó a falta de
ésta. Si n es suficientemente grande (n>30),
podemos establecer un intervalo de
confianza para al considerar la distribución muestral de 𝑋 .
De acuerdo con el teorema del límite central, podemos esperar que la distribución muestral de 𝑋 esté distribuida de forma aproximadamente normal con media 𝜇𝑋 = 𝜇 y desviación estándar 𝜎𝑋 =𝜎/ 𝑛 . Al escribir 𝑍𝛼
2 para el valor z por
arriba del cual encontramos un área de /2
1)(22
zZzP
n
XZ
/
1)
/
(22
z
n
XzP
Al multiplicar cada término en la
desigualdad entre 𝜎/ 𝑛, y después restar 𝑋
y multiplicar por -1 (para invertir el sentido
de las desigualdades), obtenemos:
1)
/
(22
z
n
XzP
1)(
22 n
zX
n
zXP
Por lo tanto:
n
zX
n
zX
22
Se encuentra que la conc. promedio de
Zn que se saca del agua a partir de una
muestra de mediciones de Zn en 36 Sitios
diferentes es 2.6 gramos por mililitro.
Encuentre los intervalos de confianza de
95% y 99% para la concentración media
de Zn en el rio. Suponga que la SD de la
población es de 0.3
Solución
La estimación puntual de es 𝒙 =2.6. El valor z, que
deja un área de 0.025 a la derecha es: 𝑧0.025 = 1.96
Para un intervalo de confianza de 99% lo único que
cambia es el valor de 𝑧0.025 = 2.575
)
36
3.0)(96.1(6.2)
36
3.0)(96.1(6.2
7.25.2
73.247.2
z
z
x
e
1
2
))(2
1(2
¿Qué tan grande se requiere una muestra en
el ejemplo anterior, si queremos tener un
intervalo de confianza del 95% para que
nuestra estimación de difiera por menos de
0.05?
)3.0
)(96.1(6.2)3.0
)(96.1(6.2
nn
05.0)3.0
)(96.1(
n
3.138
05.0
)3.0)(96.1(2
n 139n
Si se tienen dos poblaciones con medias 𝜇1 𝑦 𝜇2 y
varianzas 𝜎12 𝑦 𝜎2
2 respectivamente, un estimador puntual de la diferencia entre 𝜇1 𝑦 𝜇2 esta dado Por la estadistica 𝑥 1 − 𝑥 2. Para obtener una estimación puntual de 𝜇1 − 𝜇2, se seleccionarán dos muestras aleatorias independientes, una de cada poblacion, de tamaños n1 y n2 y se calcula la diferencia de las medias de las muestras 𝑥 1 − 𝑥 2
Si estas muestras se seleccionan de poblaciones normales, o si ello no es posible, si tanto n1 como n2 son mayores que 30, se puede establecer un intervalo de confianza para 𝜇1 − 𝜇2, considerando la distribución muestral de 𝑥 1 − 𝑥 2
De acuerdo con el teorema de la distribución muestral de medias para muestras independientes, se puede esperar que la distribucion muestral de 𝑥 1 − 𝑥 2 tenga aprox. Una distribución normal con una media 𝜇𝑥 1−𝑥 2= 𝜇1 − 𝜇2 y desviación estándar
𝜎𝑥 1−𝑥 2=𝜎1
2
𝑛1+
𝜎22
𝑛2
Se puede afirmar con una
probabilidad de 1-𝛼 que la variable
normal estándar
Z= 𝑥 1−𝑥 2 − 𝜇1−𝜇2
𝜎12
𝑛1+
𝜎22
𝑛2
Caerá entre -Z𝛼 2 y Z𝛼 2
Por lo que:
P(-Z𝛼 2 < Z < Z𝛼 2 )
INTERVALO DE CONFIANZA PARA 𝜇1 −𝜇2 ; con
𝜎12 𝑦 𝜎2
2 conocidas. Un intervalo de confianza A
(1-∝)100% para 𝜇1 −𝜇2 es
𝑥 1 − 𝑥 2 - 𝑧𝛼 2 𝜎1
2
𝑛1+
𝜎22
𝑛2 < 𝜇1 −𝜇2 < 𝑥 1 − 𝑥 2 +
𝑧𝛼 2 𝜎1
2
𝑛1+
𝜎22
𝑛2
Donde 𝑥 1𝑦 𝑥 2 son las medias de las muestras
aleatorias independientes de tamaños n1 y n2,
tomadas de poblaciones con varianzas conocidas 𝜎1
2 𝑦 𝜎22 respectivamente, y 𝑧𝛼 2 es el
valor de la distribución normal estándar que
deja un área de 𝛼 2 hacia la derecha.
50 mujeres y 75 hombres presentaron un
examen de química. Las mujeres obtienen
una calificación promedio de 76 con una
desviación estándar de 6, mientras que los hombres obtienen una calificación
promedio de 82 con una desviación
estándar de 8. Encuentre el intervalo de
confianza al 96% para la diferencia
𝜇1 − 𝜇2, donde 𝜇1 es la puntuación media
de los muchachos y 𝜇2 es la puntuación
media de todas las que lo presentaron.
La estimación puntual de 𝜇1 − 𝜇2, es 𝑥 1 − 𝑥 2=82-
76=6. Ya que tanto n1 como n2 son grandes, se
puede substituir S1=8 por 𝜎1 y S2=6 por 𝜎2.
Utilizando 𝛼=0.04 de la tabla, se encuentra que Z 0.054. Sustituyendo en la formula anterior se
obtiene el intervalo de confianza al 96%
6-2.05464
75+
36
50< 𝜇1 − 𝜇2<6+2.054
64
75+
36
50
O
3.42< 𝜇1 − 𝜇2 <8.58
INTERVALO DE CONFIANZA EN MUESTRAS
PEQUEÑAS PARA 𝜇1 − 𝜇2; con 𝜎12 = 𝜎2
2
DESCONOCIDAS. Un intervalo de confianza al
A(1-𝛼)100% para 𝜇1 − 𝜇2 es 𝑥 1 − 𝑥 2 -
𝑡𝛼2 𝑆𝑝
1
𝑛1+
1
𝑛2< 𝜇1 − 𝜇2< 𝑥 1 − 𝑥 2 +𝑡𝛼
2 𝑆𝑝
1
𝑛1+
1
𝑛2
Donde 𝑥 1 y 𝑥 2 son las medias de muestras independientes
pequeñas de tamaños n1 y n2 respectivamente,
tomadas de distribuciones aprox normales, Sp es la desviación estándar mancomunada y 𝑡𝛼
2 es el valor de
la distribución t con n1+n2 -2 grados de libertad que deja
un área de 𝛼 2 a la derecha.
En varios procesos quimicos se comparan dos
catalizadores para medir su efecto en la reacción
resultante.
Se prepara una muestra de 12 experimentos
utilizando el catalizador 1 y una muestra de 10
experimentos con el catalizador 2. Los 12
experimentos realizados con el catalizador 1 dieron
un promedio que alcanzó 85 con una desviación
estándar de la muestra 4, el promedio de la muestra
dio un promedio de 81 y una desviación estándar de
5.
Encuentre el intervalo de confianza al 90% para la
diferencia entre las medias de las poblaciones.
Suponiendo que tienen distribuciones aprox normales
con varianzas iguales
La estimación puntual de 𝜇1 − 𝜇2 es 𝑥 1 − 𝑥 2=85-
81=4
La estimación mancomunada 𝑠𝑝
2 de la varianza
común 𝜎2 es
𝑆𝑝2 =
𝑛1 − 1 + 𝑛2 − 1 𝑆22
𝑛1 + 𝑛2 − 2
𝑆𝑝
2=[(11)(16)+(9)(25)] / (12+10-2) = 20.05 Sp=4.478
Usando 𝛼=0.1 se encuentra que t 0.05=1.725 para
v=n1+n2-2=20 grados de libertad
Al sustituir en la formula se obtiene el intervalo de confianza al 90%
4-(1.725)(4.478) 1
12+
1
10 < 𝜇1 − 𝜇2< 4-
(1.725)(4.478) 1
12+
1
10
0.69< 𝜇1 − 𝜇2<7.31
Si las varianzas de las poblaciones son diferentes.
La estadistica utilizada es:
T’= 𝑥 1−𝑥 2 − 𝜇1−𝜇2
𝑠12
𝑛1+
𝑠22
𝑛2
Que tiene aprox una distribucion t con v grados de libertad, donde
V=𝑠12 𝑛1 +𝑠2
2𝑛2
𝑠12
𝑛1
2
𝑛1−1 +𝑠22
𝑛2
2
𝑛2−1
Usando la estadistica T’
P(-t𝛼 2 <T’ < t 𝛼 2 ) =1-𝛼 Donde t 𝛼 2 es el valor de la distribucion t con v
grados de libertad.
INTERVALO DE CONFIANZA EN MUESTRAS PEQUEÑAS PARA
𝜇1 − 𝜇2 CON 𝜎12 ≠ 𝜎2
2 Y DESCONOCIDAS.
Un intervalo de confianza (1-𝛼)100% aprox para 𝜇1 − 𝜇2 es
𝑥 1 − 𝑥 2 -𝑡𝛼2
𝑠12
𝑛1+
𝑠22
𝑛2< 𝜇1 − 𝜇2< 𝑥 1 − 𝑥 2 +𝑡𝛼
2 𝑠12
𝑛1+
𝑠22
𝑛2
Donde 𝑥 1𝑠1 y 2 𝑥 2𝑠𝑦
2 son las medias y varianzas de muestras
independientes pequeñas de tamaños n1 y n2, tomadas de distribuciones aprox normales y 𝑡𝛼 2 es el valor de la
distribución t con
V=
𝑠12
𝑛1 +𝑠2
2 𝑛2 2
𝑠12 𝑛1
2𝑛1−1 + 𝑆2
2 𝑛3 2
𝑛2−1
Grados de libertad que deja un área de 𝛼 2 hacia la
derecha
INTERVALO DE CONFIANZA PARA 𝜇1 − 𝜇2
para observaciones apareadas.
Un intervalo de confianza A(1-𝛼)100% para
𝜇𝐷 es:
𝑑 -𝑡𝛼2
𝑆𝑑
𝑛< 𝜇𝐷 < 𝑑 + 𝑡𝛼
2 𝑆𝑑
𝑛
Donde 𝑑 y 𝑆𝑑 son la media y desviación
estándar de las diferencias de n pares de
mediciones y 𝑡𝛼2 es el valor de la
distribución t con v=n-1 grados de libertad
que deja un área de 𝛼 2 hacia la derecha.
20 estudiantes de
matemáticas fueron divididos
en 10 parejas, teniendo cada
miembro de la pareja aprox
el mismo cociente de
inteligencia. Uno de cada
pareja se selecciona al azar y
se asigna una sección que
utiliza material programado.
Parej
a
Materi
al
Profes
or
d
1 76 81 -5
2 60 52 8
3 85 87 -2
4 58 70 -12
5 91 86 5
6 75 77 -2
7 82 90 -8
8 64 63 1
9 79 85 -6
10 88 83 5
El otro miembro se asigna a una sección
que cuenta con profesor. Al finalizar el
semestre ambos grupos presentan el mismo
examen obteniendo los sig. resultados
Encuentre un intervalo de confianza al 98% para la
diferencia real en el promedio de calificaciones de
los dos procedimientos de enseñanza
Intervalo de confianza del 98% para 𝜇1 − 𝜇2 donde
𝜇1y 𝜇2 representan las calificaciones promedio de los
grupos con material programado y con profesor.
Las observaciones son apareadas, 𝜇1 − 𝜇2=𝜇𝐷.
La estimación puntual de 𝜇𝐷 esta dada por 𝑑=-1.6. La
varianza 𝑠𝑑2 de las diferencias de las muestras es:
𝑆𝑑2=
𝑛𝛴 𝑑𝑖2− 𝑑𝑖
2
𝑛 𝑛−1 = 40.7 𝑆𝑑=6.38.
Usando 𝛼=.02 en la tabla, t 0.01=2.821 para v=n-
1=9 grados de libertad.
Sustituyendo en la formula obtenemos el
intervalo de confianza al 98%
-1.6-(2.821)6.38/ 10<𝜇𝐷<-1.6+(2.821)6.38/ 10
-7.29<𝜇𝐷<4.09
Probabilidad y Estadística para Ingenieros;
Walpole, Myers, Myers ; Sexta Edición , Editorial Prentice Hall
Capítulos 5,6 y 8