03.00 principales distribuciones chi t f - 2015-i

1

Estadística para economistas II

M.Sc. Sabino Edgar Mamani Choque

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERIA ECONÓMICA

PARTE II: PRINCIPALES DISTRIBUCIONES: X2,t, F,

2

Aspectos introductorios: (Taro Yamane, pag 396)

Existen situaciones en los que se deben hacer

inferencias con muestras pequeñas (n<30) y,

los supuestos básicos de la teoría del muestreo

grande (n>30), no funcionan.

En muestreo pequeño la distribución no es

normal y no puede emplearse adecuadamente

al teorema del límite central, la distribución por

muestreo difiere en cada caso.

3

Hay tres distribuciones de probabilidad que generalmente se usan para muestras pequeñas:

a) La distribución Ji cuadrada.

b) La distribución t de student

c) La distribución F.

Las tres distribuciones usan en su definición los “grados de libertad”

4

Grado de libertad es el nombre dado al número de

observaciones linealmente independientes que

ocurre en una suma de cuadrados.

GL. Número de variables aleatorias independientes

que se suman o, número de variables que pueden

variar libremente.

El número de grados de libertad es V = n-k, k=

número de restricciones para los cálculos de una

estadística θ o que abarca sumas de cuadrados y

las restricciones pueden ser por ejemplo el número

de estimadores requerido para calcular la θ.

5

Distribución Chi – cuadrado X2(m)

Una v.a. Y tiene una distribución chi-cuadrado con m gl si su función de

densidad es:

2

12

2

22

1)(

ym

mey

myf

si y > 0

= 0 si y ≤ 0

donde es la función gamma que se define como:

0

1 dwew w

!1 si α es un número entero positivo

6

f(y)

La distribución Chi – cuadrado tiene la siguiente forma:

X2(m)

7

Características

1. Está definida solo para valores positivos de la variable Y

2. Presenta un sesgo o asimetría a la derecha

3. Es asintótica con respecto al eje horizontal en el lado derecho

4. La distribución tiene menor sesgo a medida que los gl son cada vez

mayores

5. Para una distribución chi-cuadrado con m gl se tiene:

μY = m y σ2Y= 2m

6. Para elevados grados de libertad (m > 50), los valores tabulares de

una distribución chi-cuadrado se pueden aproximar mediante:

α

2

),( mX 2

)(mX

22

),( 12)(2

1 mZX m

Donde Z(α) es el valor de la variable normal estándar correspondiente a una probabilidad

acumulada igual a “α“

8

Caso especial 1

Si Z es una v.a. con distribución normal estándar, la v.a. Z2 tiene una

distribución chi-cuadrado con 1 gl.

Si Z ~ N(0,1) → Z2 ~ X2(1)

Caso especial 2

Si W1, W2, …, Wk son v.a. independientes con distribución chi-cuadrado

com m1, m2, … mk gl. La v.a. Y = W1, W2, …, Wk tiene una distribución

chi-cuadrado con m1 + m2 + …+ mk gl

Si W1 ~X2(m1) , …, Wk ~X2

(mk) → Y = W1 + … + Wk ~X2(m1 + …+ mk)

9

Caso especial 3

2

)1(2

222 )(

),( XXnX

ZNXx

x

x

xxx

si

Caso especial 4

si

2

)(21

22

1

2),( n

x

n

i

in

i x

ixx X

XX

NX

Caso especial 5

si ),( 2

xxNX

2

)1(2

2

21

22

1

)1(

n

xx

n

i

in

i x

i XSn

XxXx

10

Si Y ~ X212

Hallar:

a) P(Y>11.34)

= 1 - P(Y≤11.34)

= 1 – 0.5 = 0.5

b) P(7.807 < Y < 15.812)

= P(Y < 15.812) – P(Y ≤ 7.807)

= 0.8 – 0.2 = 0.6

c) P(6.304 < Y < 13)

= P(Y < 13) – P(Y ≤ 6.304)

= 0.624298 – 0.1 = 0.524298

d) Y1 si, P(Y1 < Y < 11.34)=0.25

= P(Y<11.34) – P(Y ≤ Y1) =0.25

= 0.5 – P(Y ≤ Y1 ) = 0.25

P(Y ≤ Y1) = 0.25

→ Y1=X2(0.25,12)

Interpolando

Y1 = 8.4205

11

De una población se selecciona, al azar y con reemplazo, una muestra

de tamaño 60. Si la variable de interés (X) se distribuye normalmente

con media 40 y varianza 100, y se establece que:

60

1

2

100

)(

i

i XXY

Determine el valor de K, tal que P(Y<K)=0.95

Y~X259, corresponde al caso especial 5, entonces:

21)59)(2(645.12

1K

Z(0.95)≡1.645

646408.77K

12

Distribución de la varianza muestral (S2) cuando la distribución inicial es

normal

Si X es una v.a. ~N(μ, σ2) y, de esta distribución se extraen muestras

aleatorias de tamaño n, la v.a. S2 tendrá una distribución con media y

varianza:

22)( SE y1

2)(

42

nSVar

Si el tiempo de atención por cliente en una tienda tiene una distribución

normal con una varianza de 0.81 minutos2, y se elige una muestra

aleatoria de 21 clientes, hallar:

13

a) P(S2 < 1.272)

b) P(0.50625 < S2 < 1.272)

c) El valor de k, tal que P(S2<k)=0.6

X = tiempo de atención al cliente

y X ~ N(μ,σ2) y n=21

2

)20(

2

2

2

81.0

)121()1(X

SSnY

Caso especial 5

22

22 )272.1)(1()1(

)272.1(

nSnPSP

81.0

)272.1)(121(2

)20(XP

a)

14

b) …

c)

Ejercicio

1. Los pesos de los artículos producidos por una máquina tiene una distribución

normal con una media de 200 gr. y una varianza de 25 gr2. Si se eligen al

azar 16 artículos, calcule:

a) P(S2<32.185),

b) P(20<S2<41.66)

c) k, tal que P(S2<k)=0.6

15

LA DISTRIBUCIÓN t DE STUDENT

Sea Z una v.a. N(0,1) y,

Y una v.a. que tiene una distribución Chi – cuadrado con r grados de

libertad y, si Z e Y son independientes, entonces:

Y

rZ

rY

ZT

/

se dice que tiene una distribución t de student, con r grados de

libertad con función de densidad:

2/)1(2

1

2.

2

1

)(

r

r

t

rr

r

tf

t

16

• La v.a. T está determinado por el parámetro r.

• Entonces, hay una distribución t para cada grado de libertad

• t simétrico alrededor de t=0

N(0,1)

n = 5

n = 2

10 2 3-1-2-3

Media y varianza de la

distribución t con r

grados de libertad:

0)( TE , r > 1

2)(2

r

rTVar , r > 2

17

• Por tanto, la distribución t no tiene media cuando r = 1

• No existe varianza cuando r = 1 ó 2

• La distribución t es similar a la distribución normal estándar porque

ambos varían de -∞ a ∞

• Son simétricos y centrados alrededor de t=0, (su media es cero)

• La distribución t tiene mayor dispersión que la distribución normal, ya

que:

22

rr

• La varianza de la distribución t, es mayor que 1, porque varía para

diferentes grados de libertad.

• La varianza de la distribución t, se aproxima a la distribución normal

cuando el grado de libertad es suficientemente grande. Se trata la

distribución t, como N(0,1) cuando r > 30.

18

t

T dzzftTP )(

La probabilidad de que la v.a. T sea menor o igual a una constante

t = tα es:

tα

α

19

Características

1. Tiene forma ligeramente acampanada

2. Es simétrica respecto al origen

3. Es asintótica con respecto al eje horizontal

4. Se aproxima cada vez mas a la distribución normal estándar a medida

que los grados de libertad son mayores

5. Para que la variable Y, que tiene una distribución T con “m” grados de

libertad se tiene:

0Y

)2(2

mm

Y

para m > 2

20

Si r = 5

90.0476.190.0 TPtTP

10.0476.190.010.0 TPtTPtTP

Porque

1tt debido a la simetría de la

distribución t

α α

tαt1- α = - tα

21

Caso especial 1

Sea X una v.a. con N(μx,σ2

x). Si se extrae una muestra aleatoria de

tamaño n, entonces la v.a.:

x

X

S

XY

Tiene una distribución T con (n-1) gl y:

X2

xS, para muestras con reemplazo

1

22

N

nN

n

SSx para muestreo sin reemplazo

Corresponden a una distribución aproximadamente T con (n-1) gl

22

Caso especial 2

Sean X1 y X2, dos v.a. independientes que tienen distribuciones

normales con μ1 y μ1 y varianza común σ2. Si se extraen muestras

aleatorias n1 y n2, entonces la v.a. :

21

)()( 2121

xxS

xxY

Tiene una distribución T con (n1+n2-2) gl

23

Sea T una v.a. con distribución t y varianza σ2=5/4, calcular:

228.2812.1 TP

22

rrDado que: r = 10

228.2812.1 TP

812.11975.0 TPtTP

812.1228.2 TPTP

95.0975.0 1 tTPtTP

= 0.975 -1 + 0.95 = 0.925

t1- α = - tα

24

Si r = 12 g.l. hallar: P[ Y >-1.356]

P[0.873< Y <2.179]

P[-2.179< Y <2] =

Y1 si P[Y1 < Y < 1.782] = 0.875

Si Y ~ T(12) P[Y > -1.356] = 1 - P[Y ≤ -1.356] = 1 - 0.1 = 0.9

P[0.873 < Y < 2.179] = P[Y < 2.179] – P[Y ≤ 0.873]

= 0.975 – 0.8 = 0.175

P[-2.179 < Y < 2] = P[Y < 2] – P[Y≤-2.179]

= 0.963728 – 0.025 = 0.938728

P[Y1 < Y < 1.782] = P[Y < 1.782] – P[Y ≤ Y1]

= 0.95 – P[Y ≤ Y1] = 0.875

= 0.075 = P[Y ≤ Y1]

Y1 = T (0.075,12) = t1

Y1 = T (0.075,12) ≈ -1.5675

25

Para analizar el tiempo de atención por cliente en un establecimiento

con 3000 clientes, se tomó una muestra aleatoria sin reemplazo de 15

atenciones con los que se obtuvo un tiempo promedio de 5.5 minutos y

una varianza de 1.04 minutos2.

Si se toma otra muestra de tamaño 15, cual es la probabilidad de que

el promedio muestral difiera de su media poblacional en menos de

0.45 minutos.

Si X~T (18)

Calcular: P(0.688 ≤ X ≤ 2.214)

P(-0.534 ≤ X ≤ 3.610)

26

Tabla t de Student

27

Distribución F de Snedecor

Si U y V son v.a. independientes que tienen distribuciones chi – cuadrado

mU y mV gl, respectivamente, entonces:

V

U

mV

mU

Y

Tiene distribución F con mU y mV gl´, con función de densidad:

2

12

2

122

2)(

VU

UU

mm

V

U

mm

V

U

VU

VU

m

m

ym

m

mm

mm

yf

si y > 0

= 0 si y ≤ 0

28

f(y)

La distribución F con mU y mV gl tiene la siguiente forma:

F(mU, mV)

29

2

V

VY

m

m

Características

1. Está definida solo para valores positivos de la variable

2. Presenta sesgo o asimetría a la derecha

3. Es asintótica con respecto al eje horizontal en su parte positiva

4. A mayores valores de los grados de libertad, la distribución es menos

asimétrica

5. Para una distribución F de mU y mV gl se tiene:

para mV > 2

)4()2(

)2(22

22

VVU

VUVY

mmm

mmm para mV > 4

6. Si Y se distribuye según T con m grados de libertad, entonces Y2

se distribuye según F con 1 y m gl.

30

Caso especial

Sean X1 y X2, v.a. independientes distribuidas normalmente con medias

μ1 y μ2, y varianzas σ12 y σ2

2. Si se extraen muestras aleatorias de

tamaños n1 y n2, entonces:

2

1

2

22

2

2

1

2

2

2

2

2

1

2

1

S

S

S

S

F

tiene una distribución F con (n1-1) y (n2-1) gl

31

Comprobación

Si ),( 2

111 NX 2

)1(2

1

2

11

1

)1(

nX

SnU

),( 2

222 NX 2

)1(2

2

2

22

2

)1(

nX

SnV

y)1,1(2

1

2

22

2

2

1

2

2

2

2

2

1

2

1

2

1

2

1

21

)1(

)1(

nnF

S

S

S

S

nV

nU

mV

mU

F

32

Propiedad recíproca

Si Y es una v.a. que tiene una distribución F con mU y mV gl, luego, la

inversa de dicha variable (1/Y) tendrá una distribucìón F com mV y mU gl

Si y2

)( VmXV 2

)( UmXU

),( VU mm

V

U F

mV

mU

Y

),(

1UV mm

U

V F

mU

mV

Y

Mediante esta propiedad se tiene que:

),,(

),,1(

1

UV

VU

mm

mmF

F

α y (1-α) son probabilidades acumuladas

33

Manejo de tabla

P[Y>2.95] = 1- P[Y≤ 2.95] = 1 – 0.95 = 0.05

P[2.95 < Y < 4.74] = P[Y < 4.74 ] – P[Y≤2.95] = 0.99 – 0.95 = 0.04

Hallar Y1 si P[Y1 < Y < 2.95] = 0.94

P[Y<2.95] – P[Y ≤ Y1] = 0.95 - P[Y ≤ Y1] = 0.94

de donde P[Y≤Y1] = 0.01 y Y1 = F(0.01,8,11)

Luego, Y1 = F(0.01, 8, 11) = 1 / F(0.99, 11, 8) = 1 / 5.73 = 0.17452

Si Y ~ F (8,11)

34

Si Y ~ F(45,24) hallar Y1 tal que P[Y > Y1] = 0.05

P[Y > Y1] = 1 – P[Y ≤ Y1] = 0.05

= P[Y ≤ Y1] = 0.95

y

Y1 = F(0.95, 45, 24)

Interpolando

Y1 = F(0.95, 45, 24) ≡ 1.875

gl denominador 24 24 24

gl numerador 44 45 46

Valor de F 1.88 Y1 1.87

(1/45 – 1/46) → (1/44 – 1/46)

(Y1 – 1.87) → (1.88-1.87)

874889.146/144/1

)46/145/1)(87.188.1(87.11

Y

35

Dos máquinas A y B producen un mismo artículo y los tiempos de

producción, en minutos, tienen distribuciones normales con medias

μ1=1430 y μ2=1410 y varianzas σ12=625 y σ2

2=900, respectivamente. Si

se eligen al azar 31 y 25 artículos producidos por las máquinas A y B,

hallar:

a) P(S22 < 2.7216S1

2)

b) P(2.7216 < S22/S1

2 < 3.5568)

c) k, tal que P(k < S22/S1

2 < 3.5568) = 0.98

03.00 principales distribuciones chi t f - 2015-i

Documents