Informática. Universidad Carlos III de Madrid1
7. Inferencia en poblaciones normales
Informática. Universidad Carlos III de Madrid2
Tema 7: Inferencia en poblaciones normales
1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²
Informática. Universidad Carlos III de Madrid3
1. Inferencia en muestras pequeñas
En el tema anterior usamos que si X es una v. aleatoria de interés con distribución cualquiera y con
si n es grande (n>30)
Construimos métodos estadísticos basados en la aproximación a esa normal
¿Y si n no es grande?
Informática. Universidad Carlos III de Madrid4
1. Inferencia en muestras pequeñas
¿Y si n no es grande?
Las propiedades estadísticas de
/X
nμ
σ−
ˆ /XS n
μ−
cambian!! Dependen de la distribución de X
Los intervalos y los contrastes del tema anterior no serían correctos
En el caso de X normal, se tiene que independientemente del tamaño de n
(0,1)/
X Nnμ
σ− ∼ ˆ /
XS n
μ− ∼ Distribución
t de Student
Informática. Universidad Carlos III de Madrid5
Tema 7: Inferencia en poblaciones normales
1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²
Informática. Universidad Carlos III de Madrid6
2. Inferencia con la distribución t de Student
• La distribución t de Student es una variable aleatoria continua, simétrica, de media cero, y de perfil muy parecido a la normal estándar.
• Depende de un parámetro g que se denomina grados de libertad. Su notación habitual es tg
Informática. Universidad Carlos III de Madrid7
2. Inferencia con la distribución t de Student
Puede demostrarse que si X∼N(μ,σ²),
1ˆ / nX tS n
μ−
− ∼La distribución cambia con n
Si el tamaño muestral es grande
1 (0,1)ˆ / nX t NS n
μ−
− ∼ ∼
Informática. Universidad Carlos III de Madrid8
Tema 7: Inferencia en poblaciones normales
1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²
Informática. Universidad Carlos III de Madrid9
3. Inferencia sobre μ
Intervalos de confianza para m
αα μ −
⎧ ⎫⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎩ ⎭
1; /2
ˆ(1 ) : n
SIC X t
n
en lugar de α /2z
Informática. Universidad Carlos III de Madrid10
En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que
Ejemplo
= 9.77x
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 95% para el
contenido medio de Cadmio en las rocas de la mina.
=ˆ 3.164s
αα μ −
⎧ ⎫⎪ ⎪− ∈ ±⎨ ⎬⎪ ⎪⎩ ⎭
1; /2
ˆ(1 ) : n
SIC X t
n
Informática. Universidad Carlos III de Madrid11
En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que
Ejemplo
= 9.77x
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 95% para el
contenido medio de Cadmio en las rocas de la mina.
=ˆ 3.164s
Para n=25
y a=0.05
a/2=0.025
=24;0.025 2.06t
μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭
3.164(0.95) : 9.77 2.06 (8.47,11.07)
25IC
Informática. Universidad Carlos III de Madrid12
Para n=25
y a=0.05a/2=0.025
=24;0.025 2.06t
Usando la aproximación N(0,1) como si fuese para muestras grandes...
a/2=0.025
=0.025 1.96z
Informática. Universidad Carlos III de Madrid13
μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭
3.164(0.95) : 9.77 2.06 (8.47,11.07)
25IC
Usando la t de Student: intervalo exacto
μ ⎧ ⎫∈ ± =⎨ ⎬⎩ ⎭
3.1649.77 1.96 (8.53,11)
25
Usando la aproximación a N(0,1) para muestras grandes
Si no usamos la t de Student, daremos un intervalo más estrecho del que tiene realmente un confianza del 95%. Este intervalo tiene una confianza menor de la que pensamos
Para poblaciones normales usaremos siempre la t de Student
Informática. Universidad Carlos III de Madrid14
3. Inferencia sobre μ
Contraste de hipótesis
(a) H0:μ=μ0; frente a H1:μ≠μ0,
(b) H0:μ≤μ0; frente a H1:μ>μ0,
(c) H0:μ≥μ0; frente a H1:μ<μ0.
Se hacen igual, pero usando las siguientes distribuciones de referencia
00 (0,1)
/XZ N
nμ
σ−
= ∼ 00 1ˆ / n
XT tS n
μ−
−= ∼
Informática. Universidad Carlos III de Madrid15
0 0 1 0: ; :H Hμ μ μ μ≥ <
0 0 1 0: ; :H Hμ μ μ μ≤ >
0 0 1 0: ; :H Hμ μ μ μ= ≠
PASO 1: PASO 2:
PASO 3:
(a)
Rechazo H0 Rechazo H0
Acepto H0
(a)
(b)
Rechazo H0
Acepto H0
(b)
(c)
Rechazo H0 Acepto H0
(c)
PASO 4:
La región de rechazo está donde señala H1
0 (0,1)Z N∼
0 1nT t −∼
α /2zα− /2zα−1; /2ntα−− 1; /2nt
αzα−1;nt
α−zα−− 1;nt
Informática. Universidad Carlos III de Madrid16
Ejemplo Se quiere saber si la media de la ganancia β de los transistoresBC547B se mantiene el valor nominal μ=290
H0 : μ=290 H1: μ≠290
Con 100 datos:
p-valor del test de la chi-cuadrado para el ajuste de una normal:
p-value=0.43
Podemos asumir normalidad en X
Informática. Universidad Carlos III de Madrid17
Ejemplo Se quiere saber si la media de la ganancia β de los transistoresBC547B se mantiene el valor nominal μ=290
H0 : μ=290 H1: μ≠290
Con 100 datos:
Rechazo H0 Rechazo H0
Acepto H0
(a)99;0.025t− 99;0.025t
a=0.05
1.98-1.98=0.025( 1.96)z
Con un nivel de significación del 5%, rechazamos H0
La diferencia entre los datos y 290 es significativa
El tamaño muestral es grande, y por eso el valor crítico es muy similar al de
N(0,1)
Informática. Universidad Carlos III de Madrid18
Tema 7: Inferencia en poblaciones normales
1. Inferencia en muestras pequeñas2. Inferencia con la distribución t de Student3. Inferencia sobre μ4. Inferencia sobre σ²
Informática. Universidad Carlos III de Madrid19
4. Inferencia sobre σ²
Estimadores de s2
( )2
2 1
n
ii
X XS
n=
−=∑ ( )2
2 1ˆ1
n
ii
X XS
n=
−=
−
∑
sesgado (cuasivarianza)
insesgado
En poblaciones normales, la distribución muestral de estos estimadores está relacionada con la distribución chi-cuadrado
Informática. Universidad Carlos III de Madrid20
La distribución c2
• La c2 es una variable aleatoria no negativa. Es asimétrica positiva
• Depende de un parámetro g que se llama grados de libertad
• Su notación es2gχ
Si X es normal
22
12
ˆ( 1)n
n S χσ −− ∼
22
12 nnS χσ −∼
4. Inferencia sobre σ²
Informática. Universidad Carlos III de Madrid21
4. Inferencia sobre σ²
Intervalos de confianza para σ²
Operando igual que en el caso de la media...
No son simétricos alrededor de la
estimación
2 22
2 21; / 2 1;1 / 2
ˆ ˆ( 1) ( 1)(1 ) : ;n n
n s n sICα α
α σχ χ− − −
⎧ ⎫⎪ ⎪− −⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭
2 22
2 21; / 2 1;1 / 2
(1 ) : ;n n
ns nsICα α
α σχ χ− − −
⎧ ⎫⎪ ⎪⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭
Informática. Universidad Carlos III de Madrid22
En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que
Ejemplo
= 9.77x
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2
=ˆ 3.164s =2ˆ 10.01s
2 22
2 21; / 2 1;1 / 2
ˆ ˆ( 1) ( 1)(1 ) : ;n n
n s n sICα α
α σχ χ− − −
⎧ ⎫⎪ ⎪− −⎪ ⎪− ∈⎨ ⎬⎪ ⎪⎪ ⎪⎩ ⎭
Informática. Universidad Carlos III de Madrid23
En una explotación minera las rocas excavadas se someten a un análisis químico para determinar su contenido de Cadmio. Después de analizar 25 rocas se obtiene que
Ejemplo
= 9.77x
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2
=ˆ 3.164s
a/2=0.005 a/2=0.005
224;0.995 9.89χ = 2
24;0.005 45.6χ =
Para una confianza del 99% tenemos a/2=0.005
2 22 24 3.165 24 3.165(0.99) : ,
45.6 9.89IC σ
⎛ ⎞× ×∈⎜ ⎟⎝ ⎠
( )2(0.99) : 5.27,24.29IC σ ∈
=2ˆ 10.01s
¿Podría ser σ2=25?
Informática. Universidad Carlos III de Madrid24
4. Inferencia sobre σ²
Contraste de hipótesis para σ²
(a): H0 : σ²=σ0²; H1: σ²≠σ0²
(b): H0 : σ²≤σ0²; H1: σ²>σ0²
(c): H0 : σ²≥σ0²; H1: σ²<σ0²
Estadístico de contraste
220 2
0
ˆ( 1)n SXσ−
=
2 20 1nX χ −∼
220 2
0
nSXσ
=
Sigue la misma metodología que para otros parámetros
Distribución de referencia
Informática. Universidad Carlos III de Madrid25
PASO 1: PASO 2:
PASO 3:
(a)
Rechazo H0 Rechazo H0
Acepto H0
(a)
(b)
(c)
PASO 4:
La región de rechazo está donde señala H1
H0 : σ²=σ0²; H1: σ²≠σ0²
H0 : σ²≥σ0²; H1: σ²<σ0²
H0 : σ²≤σ0²; H1: σ²>σ0²
220 2
0
ˆ( 1)n SXσ−
=
220 2
0
nSXσ
=
2 20 1nX χ −∼
21; / 2n αχ −
21;1 / 2n αχ − −
Rechazo H0Acepto H0
21;n αχ −
(b)
Rechazo H0Acepto H0
21;1n αχ − −
(c)
Informática. Universidad Carlos III de Madrid26
Ejemplo Sobre los transistores BC547B mencionados anteriormente, teníamos el objetivo de comprobar si la media no había cambiado, así como comprobar si la varianza no había aumentado. Podemos ahora contrastar este segundo punto. Los datos históricos decían que σ0²=760. Por tanto el contraste es
H0:σ²≤760;H₁:σ²>760.
Rechazo H0Acepto H0
299;0.05 123.2χ =
Con 100 datos2ˆ 766.85s =
220 2
0
ˆ( 1) 99 766.85 99.89760
n sxσ− ×
= = =
No rechazamos H0
La diferencia entre los datos y la hipótesis no es significativa
(con nivel 5%) y puede deberse al azar de la muestra