03.00 principales distribuciones chi t f - 2015-i
DESCRIPTION
estadisticaTRANSCRIPT
1
Estadística para economistas II
M.Sc. Sabino Edgar Mamani Choque
UNIVERSIDAD NACIONAL DEL ALTIPLANO
FACULTAD DE INGENIERIA ECONÓMICA
PARTE II: PRINCIPALES DISTRIBUCIONES: X2,t, F,
2
Aspectos introductorios: (Taro Yamane, pag 396)
Existen situaciones en los que se deben hacer
inferencias con muestras pequeñas (n<30) y,
los supuestos básicos de la teoría del muestreo
grande (n>30), no funcionan.
En muestreo pequeño la distribución no es
normal y no puede emplearse adecuadamente
al teorema del límite central, la distribución por
muestreo difiere en cada caso.
3
Hay tres distribuciones de probabilidad que generalmente se usan para muestras pequeñas:
a) La distribución Ji cuadrada.
b) La distribución t de student
c) La distribución F.
Las tres distribuciones usan en su definición los “grados de libertad”
4
Grado de libertad es el nombre dado al número de
observaciones linealmente independientes que
ocurre en una suma de cuadrados.
GL. Número de variables aleatorias independientes
que se suman o, número de variables que pueden
variar libremente.
El número de grados de libertad es V = n-k, k=
número de restricciones para los cálculos de una
estadística θ o que abarca sumas de cuadrados y
las restricciones pueden ser por ejemplo el número
de estimadores requerido para calcular la θ.
5
Distribución Chi – cuadrado X2(m)
Una v.a. Y tiene una distribución chi-cuadrado con m gl si su función de
densidad es:
2
12
2
22
1)(
ym
mey
myf
si y > 0
= 0 si y ≤ 0
donde es la función gamma que se define como:
0
1 dwew w
!1 si α es un número entero positivo
6
f(y)
La distribución Chi – cuadrado tiene la siguiente forma:
X2(m)
7
Características
1. Está definida solo para valores positivos de la variable Y
2. Presenta un sesgo o asimetría a la derecha
3. Es asintótica con respecto al eje horizontal en el lado derecho
4. La distribución tiene menor sesgo a medida que los gl son cada vez
mayores
5. Para una distribución chi-cuadrado con m gl se tiene:
μY = m y σ2Y= 2m
6. Para elevados grados de libertad (m > 50), los valores tabulares de
una distribución chi-cuadrado se pueden aproximar mediante:
α
2
),( mX 2
)(mX
22
),( 12)(2
1 mZX m
Donde Z(α) es el valor de la variable normal estándar correspondiente a una probabilidad
acumulada igual a “α“
8
Caso especial 1
Si Z es una v.a. con distribución normal estándar, la v.a. Z2 tiene una
distribución chi-cuadrado con 1 gl.
Si Z ~ N(0,1) → Z2 ~ X2(1)
Caso especial 2
Si W1, W2, …, Wk son v.a. independientes con distribución chi-cuadrado
com m1, m2, … mk gl. La v.a. Y = W1, W2, …, Wk tiene una distribución
chi-cuadrado con m1 + m2 + …+ mk gl
Si W1 ~X2(m1) , …, Wk ~X2
(mk) → Y = W1 + … + Wk ~X2(m1 + …+ mk)
9
Caso especial 3
2
)1(2
222 )(
),( XXnX
ZNXx
x
x
xxx
si
Caso especial 4
si
2
)(21
22
1
2),( n
x
n
i
in
i x
ixx X
XX
NX
Caso especial 5
si ),( 2
xxNX
2
)1(2
2
21
22
1
)1(
n
xx
n
i
in
i x
i XSn
XxXx
10
Si Y ~ X212
Hallar:
a) P(Y>11.34)
= 1 - P(Y≤11.34)
= 1 – 0.5 = 0.5
b) P(7.807 < Y < 15.812)
= P(Y < 15.812) – P(Y ≤ 7.807)
= 0.8 – 0.2 = 0.6
c) P(6.304 < Y < 13)
= P(Y < 13) – P(Y ≤ 6.304)
= 0.624298 – 0.1 = 0.524298
d) Y1 si, P(Y1 < Y < 11.34)=0.25
= P(Y<11.34) – P(Y ≤ Y1) =0.25
= 0.5 – P(Y ≤ Y1 ) = 0.25
P(Y ≤ Y1) = 0.25
→ Y1=X2(0.25,12)
Interpolando
Y1 = 8.4205
11
De una población se selecciona, al azar y con reemplazo, una muestra
de tamaño 60. Si la variable de interés (X) se distribuye normalmente
con media 40 y varianza 100, y se establece que:
60
1
2
100
)(
i
i XXY
Determine el valor de K, tal que P(Y<K)=0.95
Y~X259, corresponde al caso especial 5, entonces:
21)59)(2(645.12
1K
Z(0.95)≡1.645
646408.77K
12
Distribución de la varianza muestral (S2) cuando la distribución inicial es
normal
Si X es una v.a. ~N(μ, σ2) y, de esta distribución se extraen muestras
aleatorias de tamaño n, la v.a. S2 tendrá una distribución con media y
varianza:
22)( SE y1
2)(
42
nSVar
Si el tiempo de atención por cliente en una tienda tiene una distribución
normal con una varianza de 0.81 minutos2, y se elige una muestra
aleatoria de 21 clientes, hallar:
13
a) P(S2 < 1.272)
b) P(0.50625 < S2 < 1.272)
c) El valor de k, tal que P(S2<k)=0.6
X = tiempo de atención al cliente
y X ~ N(μ,σ2) y n=21
2
)20(
2
2
2
81.0
)121()1(X
SSnY
Caso especial 5
22
22 )272.1)(1()1(
)272.1(
nSnPSP
81.0
)272.1)(121(2
)20(XP
a)
14
b) …
c)
Ejercicio
1. Los pesos de los artículos producidos por una máquina tiene una distribución
normal con una media de 200 gr. y una varianza de 25 gr2. Si se eligen al
azar 16 artículos, calcule:
a) P(S2<32.185),
b) P(20<S2<41.66)
c) k, tal que P(S2<k)=0.6
15
LA DISTRIBUCIÓN t DE STUDENT
Sea Z una v.a. N(0,1) y,
Y una v.a. que tiene una distribución Chi – cuadrado con r grados de
libertad y, si Z e Y son independientes, entonces:
Y
rZ
rY
ZT
/
se dice que tiene una distribución t de student, con r grados de
libertad con función de densidad:
2/)1(2
1
2.
2
1
)(
r
r
t
rr
r
tf
t
16
• La v.a. T está determinado por el parámetro r.
• Entonces, hay una distribución t para cada grado de libertad
• t simétrico alrededor de t=0
N(0,1)
n = 5
n = 2
10 2 3-1-2-3
Media y varianza de la
distribución t con r
grados de libertad:
0)( TE , r > 1
2)(2
r
rTVar , r > 2
17
• Por tanto, la distribución t no tiene media cuando r = 1
• No existe varianza cuando r = 1 ó 2
• La distribución t es similar a la distribución normal estándar porque
ambos varían de -∞ a ∞
• Son simétricos y centrados alrededor de t=0, (su media es cero)
• La distribución t tiene mayor dispersión que la distribución normal, ya
que:
22
rr
• La varianza de la distribución t, es mayor que 1, porque varía para
diferentes grados de libertad.
• La varianza de la distribución t, se aproxima a la distribución normal
cuando el grado de libertad es suficientemente grande. Se trata la
distribución t, como N(0,1) cuando r > 30.
18
t
T dzzftTP )(
La probabilidad de que la v.a. T sea menor o igual a una constante
t = tα es:
tα
α
19
Características
1. Tiene forma ligeramente acampanada
2. Es simétrica respecto al origen
3. Es asintótica con respecto al eje horizontal
4. Se aproxima cada vez mas a la distribución normal estándar a medida
que los grados de libertad son mayores
5. Para que la variable Y, que tiene una distribución T con “m” grados de
libertad se tiene:
0Y
)2(2
mm
Y
para m > 2
20
Si r = 5
90.0476.190.0 TPtTP
10.0476.190.010.0 TPtTPtTP
Porque
1tt debido a la simetría de la
distribución t
α α
tαt1- α = - tα
21
Caso especial 1
Sea X una v.a. con N(μx,σ2
x). Si se extrae una muestra aleatoria de
tamaño n, entonces la v.a.:
x
X
S
XY
Tiene una distribución T con (n-1) gl y:
X2
xS, para muestras con reemplazo
1
22
N
nN
n
SSx para muestreo sin reemplazo
Corresponden a una distribución aproximadamente T con (n-1) gl
22
Caso especial 2
Sean X1 y X2, dos v.a. independientes que tienen distribuciones
normales con μ1 y μ1 y varianza común σ2. Si se extraen muestras
aleatorias n1 y n2, entonces la v.a. :
21
)()( 2121
xxS
xxY
Tiene una distribución T con (n1+n2-2) gl
23
Sea T una v.a. con distribución t y varianza σ2=5/4, calcular:
228.2812.1 TP
22
rrDado que: r = 10
228.2812.1 TP
812.11975.0 TPtTP
812.1228.2 TPTP
95.0975.0 1 tTPtTP
= 0.975 -1 + 0.95 = 0.925
t1- α = - tα
24
Si r = 12 g.l. hallar: P[ Y >-1.356]
P[0.873< Y <2.179]
P[-2.179< Y <2] =
Y1 si P[Y1 < Y < 1.782] = 0.875
Si Y ~ T(12) P[Y > -1.356] = 1 - P[Y ≤ -1.356] = 1 - 0.1 = 0.9
P[0.873 < Y < 2.179] = P[Y < 2.179] – P[Y ≤ 0.873]
= 0.975 – 0.8 = 0.175
P[-2.179 < Y < 2] = P[Y < 2] – P[Y≤-2.179]
= 0.963728 – 0.025 = 0.938728
P[Y1 < Y < 1.782] = P[Y < 1.782] – P[Y ≤ Y1]
= 0.95 – P[Y ≤ Y1] = 0.875
= 0.075 = P[Y ≤ Y1]
Y1 = T (0.075,12) = t1
Y1 = T (0.075,12) ≈ -1.5675
25
Para analizar el tiempo de atención por cliente en un establecimiento
con 3000 clientes, se tomó una muestra aleatoria sin reemplazo de 15
atenciones con los que se obtuvo un tiempo promedio de 5.5 minutos y
una varianza de 1.04 minutos2.
Si se toma otra muestra de tamaño 15, cual es la probabilidad de que
el promedio muestral difiera de su media poblacional en menos de
0.45 minutos.
Si X~T (18)
Calcular: P(0.688 ≤ X ≤ 2.214)
P(-0.534 ≤ X ≤ 3.610)
26
Tabla t de Student
27
Distribución F de Snedecor
Si U y V son v.a. independientes que tienen distribuciones chi – cuadrado
mU y mV gl, respectivamente, entonces:
V
U
mV
mU
Y
Tiene distribución F con mU y mV gl´, con función de densidad:
2
12
2
122
2)(
VU
UU
mm
V
U
mm
V
U
VU
VU
m
m
ym
m
mm
mm
yf
si y > 0
= 0 si y ≤ 0
28
f(y)
La distribución F con mU y mV gl tiene la siguiente forma:
F(mU, mV)
29
2
V
VY
m
m
Características
1. Está definida solo para valores positivos de la variable
2. Presenta sesgo o asimetría a la derecha
3. Es asintótica con respecto al eje horizontal en su parte positiva
4. A mayores valores de los grados de libertad, la distribución es menos
asimétrica
5. Para una distribución F de mU y mV gl se tiene:
para mV > 2
)4()2(
)2(22
22
VVU
VUVY
mmm
mmm para mV > 4
6. Si Y se distribuye según T con m grados de libertad, entonces Y2
se distribuye según F con 1 y m gl.
30
Caso especial
Sean X1 y X2, v.a. independientes distribuidas normalmente con medias
μ1 y μ2, y varianzas σ12 y σ2
2. Si se extraen muestras aleatorias de
tamaños n1 y n2, entonces:
2
1
2
22
2
2
1
2
2
2
2
2
1
2
1
S
S
S
S
F
tiene una distribución F con (n1-1) y (n2-1) gl
31
Comprobación
Si ),( 2
111 NX 2
)1(2
1
2
11
1
)1(
nX
SnU
),( 2
222 NX 2
)1(2
2
2
22
2
)1(
nX
SnV
y)1,1(2
1
2
22
2
2
1
2
2
2
2
2
1
2
1
2
1
2
1
21
)1(
)1(
nnF
S
S
S
S
nV
nU
mV
mU
F
32
Propiedad recíproca
Si Y es una v.a. que tiene una distribución F con mU y mV gl, luego, la
inversa de dicha variable (1/Y) tendrá una distribucìón F com mV y mU gl
Si y2
)( VmXV 2
)( UmXU
),( VU mm
V
U F
mV
mU
Y
),(
1UV mm
U
V F
mU
mV
Y
Mediante esta propiedad se tiene que:
),,(
),,1(
1
UV
VU
mm
mmF
F
α y (1-α) son probabilidades acumuladas
33
Manejo de tabla
P[Y>2.95] = 1- P[Y≤ 2.95] = 1 – 0.95 = 0.05
P[2.95 < Y < 4.74] = P[Y < 4.74 ] – P[Y≤2.95] = 0.99 – 0.95 = 0.04
Hallar Y1 si P[Y1 < Y < 2.95] = 0.94
P[Y<2.95] – P[Y ≤ Y1] = 0.95 - P[Y ≤ Y1] = 0.94
de donde P[Y≤Y1] = 0.01 y Y1 = F(0.01,8,11)
Luego, Y1 = F(0.01, 8, 11) = 1 / F(0.99, 11, 8) = 1 / 5.73 = 0.17452
Si Y ~ F (8,11)
34
Si Y ~ F(45,24) hallar Y1 tal que P[Y > Y1] = 0.05
P[Y > Y1] = 1 – P[Y ≤ Y1] = 0.05
= P[Y ≤ Y1] = 0.95
y
Y1 = F(0.95, 45, 24)
Interpolando
Y1 = F(0.95, 45, 24) ≡ 1.875
gl denominador 24 24 24
gl numerador 44 45 46
Valor de F 1.88 Y1 1.87
(1/45 – 1/46) → (1/44 – 1/46)
(Y1 – 1.87) → (1.88-1.87)
874889.146/144/1
)46/145/1)(87.188.1(87.11
Y
35
Dos máquinas A y B producen un mismo artículo y los tiempos de
producción, en minutos, tienen distribuciones normales con medias
μ1=1430 y μ2=1410 y varianzas σ12=625 y σ2
2=900, respectivamente. Si
se eligen al azar 31 y 25 artículos producidos por las máquinas A y B,
hallar:
a) P(S22 < 2.7216S1
2)
b) P(2.7216 < S22/S1
2 < 3.5568)
c) k, tal que P(k < S22/S1
2 < 3.5568) = 0.98