Download - 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Informática. Universidad Carlos III de Madrid1

7. Inferencia en poblaciones normales


Tema 7: Inferencia en poblaciones normales

1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²


1. Inferencia en muestras pequeñas

En el tema anterior usamos que si X es una v. aleatoria de interés con distribución cualquiera y con

si n es grande (n>30)

Construimos métodos estadísticos basados en la aproximación a esa normal

¿Y si n no es grande?


1. Inferencia en muestras pequeñas

¿Y si n no es grande?

Las propiedades estadísticas de

/X

nμ

σ−

ˆ /XS n

μ−

cambian!! Dependen de la distribución de X

Los intervalos y los contrastes del tema anterior no serían correctos

En el caso de X normal, se tiene que independientemente del tamaño de n

(0,1)/

X Nnμ

σ− ∼ ˆ /

XS n

μ− ∼ Distribución

t de Student


2. Inferencia con la distribución t de Student

• La distribución t de Student es una variable aleatoria continua, simétrica, de media cero, y de perfil muy parecido a la normal estándar.

• Depende de un parámetro g que se denomina grados de libertad. Su notación habitual es tg


2. Inferencia con la distribución t de Student

Puede demostrarse que si X∼N(μ,σ²),

1ˆ / nX tS n

μ−

− ∼La distribución cambia con n

Si el tamaño muestral es grande

1 (0,1)ˆ / nX t NS n

μ−

− ∼ ∼


3. Inferencia sobre μ

Intervalos de confianza para m

αα μ −

⎧ ⎫⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎩ ⎭

1; /2

ˆ(1 ) : n

SIC X t

n

en lugar de α /2z


En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que

Ejemplo

= 9.77x

Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 95% para el

contenido medio de Cadmio en las rocas de la mina.

=ˆ 3.164s

αα μ −

⎧ ⎫⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎩ ⎭

1; /2

ˆ(1 ) : n

SIC X t

n



Ejemplo

= 9.77x

Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 95% para el

contenido medio de Cadmio en las rocas de la mina.

=ˆ 3.164s

Para n=25

y a=0.05

a/2=0.025

=24;0.025 2.06t

μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭

3.164(0.95) : 9.77 2.06 (8.47,11.07)

25IC


Para n=25

y a=0.05a/2=0.025

=24;0.025 2.06t

Usando la aproximación N(0,1) como si fuese para muestras grandes...

a/2=0.025

=0.025 1.96z


μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭

3.164(0.95) : 9.77 2.06 (8.47,11.07)

25IC

Usando la t de Student: intervalo exacto

μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭

3.1649.77 1.96 (8.53,11)

25

Usando la aproximación a N(0,1) para muestras grandes

Si no usamos la t de Student, daremos un intervalo más estrecho del que tiene realmente un confianza del 95%. Este intervalo tiene una confianza menor de la que pensamos

Para poblaciones normales usaremos siempre la t de Student


3. Inferencia sobre μ

Contraste de hipótesis

(a) H0:μ=μ0; frente a H1:μ≠μ0,

(b) H0:μ≤μ0; frente a H1:μ>μ0,

(c) H0:μ≥μ0; frente a H1:μ<μ0.

Se hacen igual, pero usando las siguientes distribuciones de referencia

00 (0,1)

/XZ N

nμ

σ−

= ∼ 00 1ˆ / n

XT tS n

μ−

−= ∼


0 0 1 0: ; :H Hμ μ μ μ≥ <

0 0 1 0: ; :H Hμ μ μ μ≤ >

0 0 1 0: ; :H Hμ μ μ μ= ≠

PASO 1: PASO 2:

PASO 3:

(a)

Rechazo H0 Rechazo H0

Acepto H0

(a)

(b)

Rechazo H0

Acepto H0

(b)

(c)

Rechazo H0 Acepto H0

(c)

PASO 4:

La región de rechazo está donde señala H1

0 (0,1)Z N∼

0 1nT t −∼

α /2zα− /2zα−1; /2ntα−− 1; /2nt

αzα−1;nt

α−zα−− 1;nt


Ejemplo Se quiere saber si la media de la ganancia β de los transistoresBC547B se mantiene el valor nominal μ=290

H0 : μ=290 H1: μ≠290

Con 100 datos:

p-valor del test de la chi-cuadrado para el ajuste de una normal:

p-value=0.43

Podemos asumir normalidad en X


Ejemplo Se quiere saber si la media de la ganancia β de los transistoresBC547B se mantiene el valor nominal μ=290

H0 : μ=290 H1: μ≠290

Con 100 datos:


Acepto H0

(a)99;0.025t− 99;0.025t

a=0.05

1.98-1.98=0.025( 1.96)z

Con un nivel de significación del 5%, rechazamos H0

La diferencia entre los datos y 290 es significativa

El tamaño muestral es grande, y por eso el valor crítico es muy similar al de

N(0,1)


4. Inferencia sobre σ²

Estimadores de s2

( )2

2 1

n

ii

X XS

n=

−=∑ ( )2

2 1ˆ1

n

ii

X XS

n=

−=

−

∑

sesgado (cuasivarianza)

insesgado

En poblaciones normales, la distribución muestral de estos estimadores está relacionada con la distribución chi-cuadrado


La distribución c2

• La c2 es una variable aleatoria no negativa. Es asimétrica positiva

• Depende de un parámetro g que se llama grados de libertad

• Su notación es2gχ

Si X es normal

22

12

ˆ( 1)n

n S χσ −− ∼

22

12 nnS χσ −∼




Intervalos de confianza para σ²

Operando igual que en el caso de la media...

No son simétricos alrededor de la

estimación

2 22

2 21; / 2 1;1 / 2

ˆ ˆ( 1) ( 1)(1 ) : ;n n

n s n sICα α

α σχ χ− − −

⎧ ⎫⎪ ⎪− −⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭

2 22

2 21; / 2 1;1 / 2

(1 ) : ;n n

ns nsICα α

α σχ χ− − −

⎧ ⎫⎪ ⎪⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭



Ejemplo

= 9.77x

Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2

=ˆ 3.164s =2ˆ 10.01s

2 22

2 21; / 2 1;1 / 2

ˆ ˆ( 1) ( 1)(1 ) : ;n n

n s n sICα α

α σχ χ− − −

⎧ ⎫⎪ ⎪− −⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭



Ejemplo

= 9.77x

Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2

=ˆ 3.164s

a/2=0.005 a/2=0.005

224;0.995 9.89χ = 2

24;0.005 45.6χ =

Para una confianza del 99% tenemos a/2=0.005

2 22 24 3.165 24 3.165(0.99) : ,

45.6 9.89IC σ

⎛ ⎞× ×∈⎜ ⎟⎝ ⎠

( )2(0.99) : 5.27,24.29IC σ ∈

=2ˆ 10.01s

¿Podría ser σ2=25?



Contraste de hipótesis para σ²

(a): H0 : σ²=σ0²; H1: σ²≠σ0²

(b): H0 : σ²≤σ0²; H1: σ²>σ0²

(c): H0 : σ²≥σ0²; H1: σ²<σ0²

Estadístico de contraste

220 2

0

ˆ( 1)n SXσ−

=

2 20 1nX χ −∼

220 2

0

nSXσ

=

Sigue la misma metodología que para otros parámetros

Distribución de referencia


PASO 1: PASO 2:

PASO 3:

(a)


Acepto H0

(a)

(b)

(c)

PASO 4:

La región de rechazo está donde señala H1

H0 : σ²=σ0²; H1: σ²≠σ0²

H0 : σ²≥σ0²; H1: σ²<σ0²

H0 : σ²≤σ0²; H1: σ²>σ0²

220 2

0

ˆ( 1)n SXσ−

=

220 2

0

nSXσ

=

2 20 1nX χ −∼

21; / 2n αχ −

21;1 / 2n αχ − −

Rechazo H0Acepto H0

21;n αχ −

(b)

Rechazo H0Acepto H0

21;1n αχ − −

(c)


Ejemplo Sobre los transistores BC547B mencionados anteriormente, teníamos el objetivo de comprobar si la media no había cambiado, así como comprobar si la varianza no había aumentado. Podemos ahora contrastar este segundo punto. Los datos históricos decían que σ0²=760. Por tanto el contraste es

H0:σ²≤760;H₁:σ²>760.

Rechazo H0Acepto H0

299;0.05 123.2χ =

Con 100 datos2ˆ 766.85s =

220 2

0

ˆ( 1) 99 766.85 99.89760

n sxσ− ×

= = =

No rechazamos H0

La diferencia entre los datos y la hipótesis no es significativa

(con nivel 5%) y puede deberse al azar de la muestra

Download - 7. Inferencia en poblaciones normaleshalweb.uc3m.es/esp/Personal/personas/ismael/Docencia/DepaWeb_I… · Informática. Universidad Carlos III de Madrid 11 En una explotación minera

Top Related