estadÍstica teÓrica: contrates de hipÓtesis intervalos ... · intervalos de confianza. ... la...
TRANSCRIPT
Estadística Teórica: Contrastes 1
Gestión Aeronáutica: Estadística TeóricaFacultad Ciencias Económicas y EmpresarialesDepartamento de Economía Aplicada
Profesor: Santiago de la Fuente Fernández
ESTADÍSTICA TEÓRICA: CONTRATES DE HIPÓTESIS INTERVALOS DE CONFIANZA
Estadística Teórica: Contrastes 3
RELACIÓN: INTERVALOS CONFIANZA - CONTRASTE HIPÓTESIS
Intervalo de confianza para la media de una distribuciónnormal ),(N de varianza conocida:
nzx
nzx
nz
nzx
nzx
nzx)(I
2
22
22muestralerror
2
muestralmedia
1
Hipótesis sobre la media de una población con 2 conocida : REGIÓN DE RECHAZO
00 :H 01 :H
nzxR 2/0 bilateral (compuesta)
00 :H 011 :H
nzxR 0 unilateral (simple)
00 :H 011 :H
nzxR 1
1zz
0 unilateral (simple)
Intervalo de confianza para la media de una distribución normal),(N de varianza desconocida con muestras pequeñas 30n
1n
txn
stx)(I x)1n(,
2
1n
2x
n
2xs
2xs)1n(2
xnmuestralerror
x)1n(,
2
muestralmedia
1
nstx
nst
nstx
nstx x
)1n(,2
x)1n(,
2
x)1n(,
2
x)1n(,
2
nstx x
)1n(,2
Hipótesis sobre la media de una población con 2 desconocida : REGIÓN DE RECHAZO
00 :H 01 :H
n
stxR x
)1n(;2/0 bilateral (compuesta)
00 :H 011 :H
n
stxR x
)1n(;0 unilateral (simple)
00 :H 011 :H
ns
txR x)1n(;1
n;1tn;t
0 unilateral (simple)
Estadística Teórica: Contrastes 4
Intervalo de confianza para la diferencia de medias )( 21 de dos distribucionesnormales ),(N 11 , ),(N 22 con varianzas poblacionales conocidas:
muestralerror
2
22
1
21
2
muestraldiferencia
211 nnz)yx()(I
de donde,
2
22
1
21
221
2
22
1
21
221
2
22
1
21
2
nnz)()yx(
nnz)yx()(
nnz)yx(
Estadística Teórica: Contrastes 5
Contraste de igualdad de medias de dos poblaciones normales con varianzas conocidas:REGIÓN DE RECHAZO
210 :H
2
22
1
21
2 nnz0)yx(R bilateral
k:H 210
2
22
1
21
2/ nnzkyxR bilateral
k:H 210
2
22
1
21
nnzkyxR unilateral
k:H 210
2
22
1
21
1 nnzkyxR unilateral
210 :H
2
22
1
21
nnzyxR unilateral
210 :H
2
22
1
21
1
1zz
nnzyxR unilateral
CONTRASTE HIPÓTESIS
Contraste de la media de una población normal ),(N con varianza 2 conocida:
a) CONTRASTE BILATERAL o DE DOS COLAS
Hipótesis nula: 00 :H Hipótesis alternativa: 01 :H
Como la hipótesis alternativa es 0 en la decisión que hayamos de tomar deberánser válidos los valores de mayores o menores que 0 , por lo cual el contraste debeser bilateral o de dos colas.
Regla de decisión
)chazoRegión(ReHnulahipótesislarechazasekxSi)Aceptacióngión(ReHnulahipótesislaaceptasekxSi
0
0
De otra parte, en la distribución del muestreo
n,Nx , que bajo la hipótesis nula
n,Nx 0 , con lo que la variable
nx 0
es N(0, 1).
Estadística Teórica: Contrastes 6
El valor crítico k se calcula mediante el error de significación :
K
nx
Pn
,N/kxPciertaesH/HchazarReP 0000
22K
nx
PKn
xPK
nx
Kn
xP
)1,0(Nsimetría0000
La región crítica será
n
zxRzn
x202
0
En otras palabras,
Se acepta 0H si 20 zn
x
Se rechaza 0H si 20 zn
x
b) CONTRASTE UNILATERAL o DE UNA COLA
Hipótesis nula: 00 :H Hipótesis alternativa: 011 :H
Como la hipótesis alternativa es 01 en la decisión que hayamos de tomar solo sonválidos los valores de 1 mayores que 0 , por lo cual el contraste debe ser unilateral ode una cola.
Regla de decisión
)chazoRegión(ReHnulahipótesislarechazasekxSi)Aceptacióngión(ReHnulahipótesislaaceptasekxSi
0
0
De otra parte, en la distribución del muestreo
n,Nx
Bajo la hipótesis nula:
n,Nx 0
Bajo la hipótesis alternativa:
n,Nx 1
Estadística Teórica: Contrastes 7
Para hallar el valor crítico K recurrimos al Error Tipo I:
K
nx
Pn
,N/kxPciertaesH/HchazarRePIETP 0000
La región crítica será
n
zxRzn
x0
0
En otras palabras,
Se acepta 0H si
z
nx 0
Se rechaza 0H si
z
nx 0
Contraste de igualdad de medias de dos poblaciones normales con varianzasconocidas
a) CONTRASTE BILATERAL o DE DOS COLAS
Hipótesis nula: 0:H 210 Hipótesis alternativa: 0:H 211
La regla de decisión será:
)RC(HrechazasekyxSi)RA(HrechazasenokyxSi
0
0
La región crítica de dos colas kyx es función de la diferencia de las mediasmuestrales. En esta línea, las distribuciones en el muestreo de las medias son:
1
11 n
,Nx ,
2
22 n
,Ny , con lo cual, la diferencia de medias muestrales,
bajo la hipótesis nula 0:H 210 , se distribuye:
2
22
1
21
nn,0Nyx
El valor crítico k se determina mediante el error tipo I:
0:H/kyxP)ciertaHHchazar(ReP)IET(P 21000
Estadística Teórica: Contrastes 8
K
)n()n(
0)yx(P2
221
21
K
)n()n(
yxK)n()n(
yxP2
221
212
221
21
22
K)n()n(
yxPK)n()n(
yxP2
221
212
221
21
(simetría)
La región crítica es
22
221
21
z)n()n(
yx
2
22
1
21
2 nnz)yx(R
En otras palabras, se acepta la hipótesis nula 0H si: teórico
oestadístic
2
observadooestadístic
2221
21
z)n()n(
yx
se rechaza la hipótesis nula 0H si: teórico
oestadístic
2
observadooestadístic
2221
21
z)n()n(
yx
b) CONTRASTE UNILATERAL o DE UNA COLA
Hipótesis nula: o210 K:H Hipótesis alternativa: o211 K:H
La regla de decisión será:
)RC(Hrechazasek)yx(Si)RA(Hrechazasenok)yx(Si
0
0
La región crítica de una cola k)yx( es función de la diferencia de las mediasmuestrales. En esta línea, las distribuciones en el muestreo de las medias son:
1
11 n
,Nx ,
2
22 n
,Ny , con lo cual, la diferencia de medias muestrales,
2
22
1
21
21 nn,)(Nyx , bajo la hipótesis nula o210 K:H ,
2
22
1
21
o nn,KNyx
Estadística Teórica: Contrastes 9
El valor crítico K se determina mediante el nivel de significación :
o21000 K:H/k)yx(P)ciertaHHchazar(ReP)IET(P
)n()n(
KkzP)n()n(
Kk
)n()n(
K)yx(P2
221
21
o
2221
21
o
2221
21
o
con lo cual, el valor crítico se despeja
z)n()n(
Kk
2221
21
o .
Comprobando después si se verifica o no la evidencia empírica k)yx(
De otra parte, la región crítica
z)n()n(
K)yx(
2221
21
o
por tanto, la región de rechazo:
)n()n(zK)yx(R 2
221
21o
Estadística Teórica: Contrastes 10
CÁLCULO DEL ERROR TIPO I, DEL TIPO II Y POTENCIA, DADAS LAS HIPÓTESIS SIMPLES
)ContrastePotencia(falsasiendoHnulahipótesislarechazardeadprobabilid
)IITipoError(falsasiendoHnulahipótesislaaceptardeadprobabilid
)ITipoError(ciertasiendoHnulahipótesislarechazardeadprobabilid
0
0
0
1
Los errores están relacionados, al disminuir el uno aumenta el otro:
1)ITipoError(HsiemprechazarRe0)IITipoError(
1)IITipoError(HsiemprechazarRe0)ITipoError(
PP
PP
0
1
Un contraste debería buscar simultáneamente el nivel de significación más bajoposible y la potencia 1 más alta posible.Fijado el nivel de significación, se determina la región de rechazo cuya potencia esmayor entre todos los contrastes cuyo tamaño sea el fijado a priori.
La única posibilidad para conseguir que un contraste mejore su potencia 1 , sinaumentar el nivel de significación , es incrementar el tamaño de la muestra.Al aumentar el tamaño de la muestra, varía la ley de distribución del estadístico decontraste, y generalmente disminuye la varianza. Generalmente, las propiedades delcontraste mejoran.
Antes de la universalización del ordenador se utilizaban como más representativos losvalores del 1%, 5%, y 10%. La metodología más razonable es tomar un nivel designificación de acuerdo con la experiencia y después obtener el llamado p-valor.
Estadística Teórica: Contrastes 11
0
0
0
HrechazaSevalorp
HaceptaSevalorp
.actualmuestralaconHnulahipótesislarechazaríasetodavíaqueelpara,escogerpuedesequeposiblepequeñomásiónsignificacdenivel
SiSi
valorp
El p-valor es el menor que permite aceptar la hipótesis alternativa 1H .
El p-valor tiene la ventaja de permitir que se decida que hipótesis se acepta, esto no esposible cuando se indica sólo el resultado del contraste (si se acepta o se rechaza 0H
con un fijo.
En otras palabras, los CRITERIOS GENERALES para los CONTRASTES:
Calcular una cantidad experimental expQ a partir de los datos Calcular una cantidad teórica Q a partir de las tablas
Si QQexp Se acepta 0H Si QQexp Se rechaza 0H
EL NIVEL MÍNIMO DE SIGNIFICACIÓN (P-valor) es el error de la primeraregión crítica de rechazo. Es decir, el área que deja a la derecha la cantidadexperimental expQ
Estadística Teórica: Contrastes 12
CÁLCULO DEL NIVEL DE SIGNIFICACIÓN. POTENCIA DEL CONTRASTE.
1. - La edición de un libro se considera buena si el número medio de erratas por páginano supera el 0,1 ( 0H ). Dadas las pruebas de imprenta, se eligen 10 páginas al azar, y serechazan las pruebas si se observan 2 ó más erratas. Se supone que el número deerratas por página sigue una distribución de Poisson.¿Qué nivel de significación tiene el contraste? ¿Con qué probabilidad se aceptara unlibro si realmente tiene una media de 0,2 erratas por página?
Solución:
Se tiene una muestra aleatoria )X,,X,X( n21 , de tamaño 10, donde X = ‘número de
erratas por página’, con ).(PX
Nos interesa el número medio de erratas por página )páginaporerratasNúmero(E.)X(E
La región de rechazo de la hipótesis nula:
10
1ii 2X2páginasdiezenerratasdetotalNúmeroR
El nivel de significación:
1,0:H2XP 0
10
1ii
Considerando que se verifica la hipótesis nula ( 1,0:H0 ), tenemos que
)11,0.10(PX10
1ii
, con lo cual:
2642,03679,03679,01
)1X(P)0X(P12XP112XP10
1i
10
1ii1i1
10
1ii1
10
1ii
Por otra parte, un libro que tiene generalmente una media de 0,2 erratas por página, es
un libro para el que 2,0 , con lo que )22,0.10(PX10
1ii
, por tanto la
probabilidad de aceptar un libro en estas condiciones es:
4060,02707,01353,0)1X(P)0X(P21XP10
1i
10
1ii2i2
10
1ii
Estadística Teórica: Contrastes 13
CÁLCULO DEL NIVEL DE SIGNIFICACIÓN. POTENCIA DEL CONTRASTE.
2.- En una piscifactoría se desea contrastar la hipótesis nula de que el porcentaje depeces adultos que miden menos de 20 cm es, como máximo, del 10%. Para ello, se tomauna muestra de 7 peces, rechazando la hipótesis nula si se encuentra más de un pez conlongitud inferior a 20 cm. Se pide:
1. Nivel de significación del contraste.2. Calcular la potencia del contraste si en realidad hay un 20% de peces que miden
menos de 20 cm.
Solución:
1) Sea el parámetro p = ‘Proporción de peces adultos que miden menos de 20 cm’, enuna muestra aleatoria )X,,X,X( 721 , con )p,1(BX
La región de rechazo de la hipótesis nula:
17entre,cm20aeriorinflongitudconpecesdeNúmeroR
Considerando que se verifica la hipótesis nula ( 1,0p:H0 ), tenemos que la muestra
sigue una distribución binomial )1,0p,7n(B , con que el nivel de significación:
1497,03720,04783,011)1,0p,7n(BP0)1,0p,7n(BP1
1)1,0p,7n(BP11)1,0p,7n(BP
2) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000
La potencia del contraste, cuando 20,0p , donde la muestra sigue una distribuciónbinomial )2,0p,7n(B , viene dada por:
4233,03670,02097,011)2,0p,7n(BP0)2,0p,7n(BP1
1)2,0p,7n(BP11)2,0p,7n(BPoP
Estadística Teórica: Contrastes 14
CÁLCULO DEL ERROR TIPO I, DEL TIPO II Y POTENCIA.
3.- Sea una variable aleatoria X procedente de una población con densidad deprobabilidad ).5,(N Efectuadas dos hipótesis sobre el valor de
15:H12:H 1100
mediante un muestreo aleatorio simple de tamaño 25, se contrasta la hipótesis 0H
respecto de la hipótesis 1H , estableciéndose que si la media muestral es menor que 14
se aceptaría la hipótesis nula. Determinar:a) La probabilidad de cometer el error tipo Ib) La probabilidad de cometer el error tipo IIc) La potencia del contraste
Solución:
Sea la variable aleatoria X )5,(N
Las hipótesis sobre la media poblacional (contraste unilateral):
15:H12:H
11
00
Regla de decisión
.)C.R(críticaregiónHaceptaseno14x.)A.R(aceptaciónregiónHaceptase14x
0
0
La distribución de la media muestral x , de tamaño 25, con la varianza poblacional252 conocida:
)1,15(N)255,15(N)
n,(Nx:H
)1,12(N)255,12(N)
n,(Nx:H
11
00
a) Error Tipo I: )ciertaH/Hchazar(ReP)IET(P 00
0228,0)2z(P)1
1214z(P)12:H14x(P)IET(P 00
0H se rechaza cuando es cierta el 2,28% de los casos
Estadística Teórica: Contrastes 15
b) Error Tipo II: )falsaH/HAceptar(P)IIET(P 00
1587,0)1z(P)1z(P)1
1514z(P)15:H14x(P)IIET(P 11
0H se acepta cuando es falsa el 15,87% de los casos
c) Potencia del Contraste: 1)falsaHHchazar(RePPotencia 00
8413,01587,01)falsaHHchazar(ReP1 00
0H se rechaza cuando es falsa el 84,13% de los casos
Resaltar que es más grave cometer un Error Tipo I )( que un Error Tipo II )( .
Estadística Teórica: Contrastes 16
4.- Las latas de mejillones de una determinada marca indican que el peso escurrido dedicho producto es de 250 gr. No obstante, un consumidor está convencido de que elpeso escurrido medio de dicho producto es menor que el que indican las latas. Si el pesoescurrido sigue una ley normal con desviación típica 9 gr.
a) Determinar, si existe, la mejor región crítica para contrastar la mejor regióncrítica, con un nivel de significación del 5% y muestras aleatorias simples detamaño 100.
b) Tomar una decisión acerca del rechazo o no de la hipótesis nula a partir de unamuestra aleatoria simple de tamaño 100 en la cual se ha observado un pesoescurrido promedio de 245 gr.
c) Determinar la función de potencia del contraste.
Solución:
a) Sea la variable aleatoria X = "peso escurrido de las latas de mejillones"
Se trata de un contraste unilateral:
250:H0 250:H1
La regla de decisión del muestreo:
.)C.R(Hrechazasekx.)A.R(Haceptasekx
0
0
La variable aleatoria X en el muestreo, bajo la hipótesis nula, sigue una distribución
1009,250N
El valor crítico k, bajo la hipótesis nula, se determina con el nivel de significación :
05,09,0250kzP
9,0250k
9,0250xP)9,0;250(N/kxP
)ciertaH/kx(P)ciertaH/Hchazar(ReP)IET(P 000
observando las tablas de la N(0,1), y considerando que 1zz , se tiene:
52,248k96,19,0250k
La región crítica más potente, para muestras de tamaño 100, es 52,248x
Estadística Teórica: Contrastes 17
b) Dado que 52,248245x , el pesoescurrido promedio se encuentra en laregión de rechazo de la hipótesis nula.
c) La función potencia del contraste se establece como:
9,052,248
9,0xP)
1009;(N/kxP)52,248x(P)(P
2509,0
52,248zP
Estadística Teórica: Contrastes 18
5.- Sea una variable aleatoria X procedente de una población con densidad deprobabilidad ).4,(N Se quiere contrastar la hipótesis nula 10:H 00 frente ala hipótesis alternativa 12:H 11 , con un nivel de significación 05,0 , con unmuestreo simple de tamaño 25.Determinar:a) La probabilidad de cometer el error tipo IIb) La potencia del contraste
Solución:
Sea la variable aleatoria X )4,(N
Las hipótesis sobre la media poblacional (contraste unilateral):
12:H10:H
11
00
Regla de decisión
.)C.R(críticaregiónHaceptasenokx.)A.R(aceptaciónregiónHaceptasekx
0
0
La distribución de la media muestral x , de tamaño 25, con la varianza poblacional162 conocida:
)8,0;12(N)254,12(N)
n,(Nx:H
)8,0;10(N)254,10(N)
n,(Nx:H
11
00
a) Para hallar el valor crítico 'k' recurrimos al Error Tipo I:
05,0)ciertaH/Hchazar(ReP)IET(P 00
05,0)8,010kz(P
)10:Hkx(P)IET(P 00
316,11K645,18,010k
Estadística Teórica: Contrastes 19
Error Tipo II: )falsaH/HAceptar(P)IIET(P 00
)855,0z(P)8,0
12316,11z(P)12:H316,11x(P)IIET(P 11
1963,0)855,0z(P
b) Potencia del Contraste: 1)falsaHHchazar(RePPotencia 00
8037,01963,01)falsaHHchazar(ReP1 00
Estadística Teórica: Contrastes 20
6.- Un agricultor sabe que el peso en kg. de las patatas sigue una distribución)1,(N . Una muestra de patatas dio un peso medio de 330 gramos. Con la muestra se
realizó un contraste, con un nivel de significación del 5% y una potencia de 0,6406, enel que la hipótesis nula era 4,0 Kg y la alternativa 3,0 Kg. Se pide:
a) ¿Cuál es el tamaño de la muestra utilizada por el agricultor?.b) Qué hipótesis fue aceptada
Solución:
a) Sea la variable aleatoria X = 'peso en kg. de las patatas". )1;(NX
Hipótesis sobre :
3,0:H4,0:H
11
00
Regla de decisión:
0
0
HchazoRe:C.RkxSiHAcepto:A.RkxSi
La distribución de la media muestral, bajo la hipótesis nula, sigue una ley
n1;4,0N
A partir del nivel de significación, se tiene:
)4,0kx(P)ciertaHkx(P)ciertaHHchazar(ReP 000
05,0n14,0k
n14,0xP
64,1
n14,0k)1;0(N
Por otro lado, como la potencia del contraste es 0,6406:
)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000
La media muestral, bajo la hipótesis alternativa, sigue una ley
n1;3,0N , con lo cual,
36,0n13,0k3594,0
n13,0kzP
n13,0k
n13,0xPPotencia )1;0(N
Estadística Teórica: Contrastes 21
Resolviendo el sistema:
n36,03,0k
400n1,02nn
64,14,0k
Con el tamaño muestral 400n , es decir, el tamaño de la muestra de patatas utilizadapor el agricultor es de 400 patatas.
Se determina el valor crítico k: 318,0k64,14001
4,0k
b) La región crítica es de la forma 318,0x , lo que significa que se rechazará lahipótesis nula cuando el peso medio de la muestra de patatas sea igual o inferior a 318gramos. En consecuencia, se acepta la hipótesis nula de que el peso medio de las patatases de 400 gramos.
Estadística Teórica: Contrastes 22
CONTRASTE UNILATERAL DE LA PROPORCIÓN. HIPÓTESIS SIMPLES.
7.- Un laboratorio farmacéutico quiere lanzar un nuevo medicamento para lahipertensión, llamado Hipotensil. El director de dicho laboratorio cree que la eficaciadel medicamento sería de un 95%, medida ésta como la proporción de pacientes a losque se les suministra y que experimentan una mejoría. Sin embargo, el inspector desanidad del Ministerio no es tan optimista y opina que la eficacia es sólo del 85%. Paraanalizar la eficacia del medicamento antes de su comercialización, se selecciona unamuestra aleatoria de 500 pacientes, a los que se les administra Hipotensil, de los cualesmejoran 467. ¿Tiene razón el director del laboratorio?.Suponga un nivel de significación del 5%.
Solución:
Sea la variable aleatoria X =’eficacia Hipotensil’ )p,1(B
Las hipótesis sobre la proporción (contraste unilateral):
85,0p:H95,0p:H
11
00
Regla de decisión para el valor crítico k
.)C.R(HrechazaSekp̂.)A.R(HrechazaseNokp̂
0
0
La distribución en el muestreo del estadístico
nq.p,pN
n
xp̂
.L.C.Tn
1ii
, en
consecuencia:
Bajo la hipótesis )00974,0;95,0(N500
05,0.95,0;95,0Np̂:H 00
Bajo la hipótesis )01597,0;85,0(N500
15,0.85,0;85,0Np̂:H 11
Se determina el valor crítico k a partir del nivel de significación :
Estadística Teórica: Contrastes 23
05,0)00974,0
k95,0z(P
05,0)00974,0
95,0kz(P)kp̂(P)ciertaHHchazar(ReP)IET(P 00
Observando en las tablas de la normal ),1;0(N resulta:
9339,0)645,1.00974,0(95,0k645,100974,0
k95,0
Comparando el valor crítico 9339,0k con el valor del estadístico muestral p̂
(evidencia empírica), 934,0500467p̂ , se tiene:
9339,0934,0p̂ , por lo que no existe evidencia empírica suficiente para rechazar lahipótesis 0H . Es decir, se acepta la hipótesis 0H concluyendo que el Hipotensil es
eficaz en un 95% de los casos.
Estadística Teórica: Contrastes 24
8.- Se trata de determinar si en una ciudad el 20% o el 30% de las familias disponede lavavajillas; para dilucidarlo se toma al azar una muestra de 400 familias de lamencionada ciudad y se adopta el criterio de si en la muestra hay menos de 100 familiascon lavavajillas, se rechaza que el 20% de las familias poseen el mencionadoelectrodoméstico. Se pide:
a) Nivel de significación del test.b) Potencia del test.
Solución:
a) Sea el parámetro p = "proporción de familias con lavavajillas"
Al realizar un contraste sobre una proporción, partimos de una muestra aleatoria)X,,X,X( n21 de tamaño 400n , donde )p;1(BX .
Para calcular la probabilidad interesa conocer la distribución del parámetro muestral
n
xp̂
n
1ii
donde
aslavavajilltienenofamilialasi0
aslavavajilltienefamilialasi1x i
Al ser el tamaño suficientemente grande (N = 400) y estar definido p̂ como suma devariables independientes según una distribución de Bernouilli )p;1(B , se puedeaproximar la distribución muestral de p̂ como :
nq.p,pN
n
xp̂x
.L.C.Tn
1ii
En el contraste: La hipótesis nula 2,0p:H 0 y la hipótesis alternativa 3,0p:H1
Por el lema de Neyman-Pearson, la regla de decisión del muestreo ( 25,0400100p̂ ):
.)C.R(Hrechazase25,0p̂.)A.R(Haceptase25,0p̂
0
0
Con la hipótesis nula 2,0p:H 0 : )02,0;2,0(N400
8,0.2,0,2,0Np̂
El nivel de significación , bajo la hipótesis nula, se determina, mediante el valorcrítico k = 0,25:
Estadística Teórica: Contrastes 25
00621,05,2zP02,0
2,025,002,0
2,0p̂P)02,0;2,0(N/25,0p̂P
)ciertaH/25,0p̂(P)ciertaH/Hchazar(ReP)IET(P 000
b) Potencia del Contraste: 1)falsaHHchazar(RePPotencia 00
Error Tipo II: )falsaH/HAceptar(P)IIET(P 00
Con la hipótesis alternativa 3,0p:H1 : )0229,0;3,0(N400
7,0.3,0,3,0Np̂
1822,2zP
0229,03,025,0
0229,03,0p̂P)0229,0;3,0(N/25,0p̂P)IIET(P
0144,01822,2zP
En consecuencia, 9856,00144,01)falsaHHchazar(ReP1Pot 00
Estadística Teórica: Contrastes 26
CONTRASTE UNILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL CONOCIDA.
9.- Las especificaciones de un tipo de báscula aseguran que los errores de los pesajessiguen una distribución ).,0(N Se quiere contrastar la afirmación sobre la dispersiónque es igual a la unidad, frente a una hipótesis alternativa de que es el doble. Para ellose realizan 5 pesajes en las que el error cometido resultó ser:
1 0,9 - 0,2 1,4 - 0,7
Para un nivel de significación del 5% se pide enunciar una regla de decisión (obtener laregión crítica) e indicar que hipótesis resulta aceptada.
Solución:
Sea la variable aleatoria X = ‘Errores en el peso’ ),0(NX
Hipótesis sobre :2
4:H1:H
211
200
Regla de decisión:
02x
02x
HAcepto:A.RkSiHchazoRe:C.RkSi
Por el Lema de Fisher: 21n2
2x
2
2x s)1n(n
con lo cual,
0H
24
21n
202
x 5n.
La determinación del valor crítico k a partir de (Error Tipo I):
)1k(P)ciertaHk(P)ciertaHHchazar(ReP 22x0
2x00
05,0)k5(Pk5
P 24
24
898,1k488,9k5Pearson2Tablas
Comparamos el valor crítico )898,1k( con la evidencia muestral, siendo:ix 1 0,9 - 0,2 1,4 - 0,7 48,05xx i 2ix 1 0,81 0,04 1,96 0,49 86,05x2
i 6296,0)5x()5x( 2
i2i
2x
Estadística Teórica: Contrastes 27
Como 898,16296,O2x nos situamos en la región de
aceptación (R.A), no pudiendo rechazar la hipótesis de que ladispersión sea 1, con un nivel de confianza del 95%.
II Método
Regla de decisión
.)A.R(Haceptasek)x(Si
.)C.R(Hrechazasek)x(Si
0
5
1i
2i
0
5
1i
2i
Para calcular el valor de la constante k, determinando la región crítica de forma óptima,se parte del nivel de significación :
ciertaH/k)x(P)ciertaH/HchazarRe(P 0
5
1i
2i00
El estadístico
5
1i
2i )x( en el muestreo, bajo la hipótesis nula, donde las variables
aleatorias independientes ).,(Nx 0i En consecuencia, 0
ix
sigue una )1,0(N
2n
n
1i
2
0
ix
Recuerda que 2n 2
n22
21 XXX variables aleatorias
N(0, 1) independientes entre si
A partir del nivel de significación (Error Tipo I):
05,0kPciertaH/kxP)ciertaH/HchazarRe(P 2
5020
5
1i
2
20
i00
07,11k 25;05,0
El valor muestral del estadístico 3,4)0x(5
1i
2i
verifica que
k07,113,4)0x(5
1i
2i
, lo que conduce a no rechazar la hipótesis nula de que la
población sigue una )1,0(N , advirtiendo que se halla en la región de aceptación.
Estadística Teórica: Contrastes 28
CONTRASTE UNILATERAL DE LA VARIANZA CON LA MEDIA POBLACIONAL CONOCIDA.POTENCIA DEL CONTRASTE.
10.- En una población ),5(N se quiere contrastar la hipótesis nula 2:H 20
20
frente a la hipótesis alternativa 3:H 21
21 , con un nivel de significación
025,0 , con una muestra aleatoria simple de tamaño 10:
5,1 6,2 4 2,8 2,9 5,6 3,7 3,4 2,5 5,2
Hallar la potencia del contraste.
Solución:
Hipótesis sobre :2
3:H2:H
211
200 2
021
Regla de decisión
.)A.R(Haceptasek)x(Si
.)C.R(Hrechazasek)x(Si
0
10
1i
2i
0
10
1i
2i
Para calcular el valor de la constante k, determinando la región crítica de forma óptima,se parte del nivel de significación :
ciertaH/k)x(P)ciertaH/HchazarRe(P 0
10
1i
2i00
El estadístico
10
1i
2i )x( en el muestreo, bajo la hipótesis nula, donde las variables
aleatorias independientes ix siguen una ley )2,5(N .
En consecuencia, 2
5xi sigue una )1,0(N . Por tanto, 210
10
1i
2i
25x
(Recuerda que 2n 2
n22
21 XXX variables aleatorias N(0, 1) independientes
entre si)
A partir del nivel de significación (Error Tipo I), calculamos el valor crítico k:
025,02kP
2k
25x
P)ciertaH/HchazarRe(P 210
10
1i
2i
00
Estadística Teórica: Contrastes 29
966,40k483,202k 2
10;025,0
Por otra parte, el valor muestral del estadístico 6,22)5x(10
1i
2i
Siendo k966,406,22)5x(10
1i
2i
no se rechaza la hipótesis nula de que la
población sigue una )2,5(N .
La potencia del contraste:
)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000
267,0655,13P3966,40PciertaH/kP1 2
1021012
1
210
Abscisas Áreas
987,15665,13
987,15865,4
10,0x
10,090,0
267,0
122,11
80,0.322,210,0x
II Método
Hipótesis sobre :2
3:H2:H
211
200 2
021
Regla de decisión:
02x
02x
HAcepto:A.RkSiHchazoRe:C.RkSi
Por el Lema de Fisher: 21n2
2x
2
2x s)1n(n
con lo cual,
n. 2
1n202
x
En el muestreo, bajo la hipótesis nula 220 , con tamaño muestral ,10n se tiene:
0H
29
21n
202
x 10.2
n.
La determinación del valor crítico k a partir de (Error Tipo I):
)2k(P)ciertaHk(P)ciertaHHchazar(ReP 22x0
2x00
Estadística Teórica: Contrastes 30
025,0)k5(Pk10
.2P 2
9
29
8046,3k023,19k5Pearson2Tablas
Comparamos el valor crítico )8046,3k( con la evidencia muestral 5204,12x
Como 8046,35204,12x nos situamos en la región de aceptación (R.A), aceptando
la hipótesis de que la varianza es 2, con un nivel de confianza del 97,5%.
De otra parte, la potencia del contraste será:
)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000
En el muestreo, bajo la hipótesis alternativa 320 , con tamaño muestral ,10n se
tiene:
1H
29
21n
202
x 10.3
n.
252,0682,12PciertaH/8046,310
.3PPotencia 2
91
29
Abscisas Áreas
684,14682,12
684,14168,4
10,0x
10,090,0
252,0
516,10
80,0.002,210,0x
Estadística Teórica: Contrastes 31
CONTRASTE UNILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL DESCONOCIDA.POTENCIA DEL CONTRASTE.
11.- En una población con distribución ),(N , con un nivel de significación del 1%,para contrastar la hipótesis nula 25:H 2
00 frente a la hipótesis alternativa
36:H 211 , se toma una muestra aleatoria de tamaño 16, con varianza igual a 27.
Hallar la potencia del contraste.
Solución:
Hipótesis simple sobre :2
36:H25:H
211
200 2
021
Regla de decisión
.)A.R(Haceptasek)xx(Si
.)C.R(Hrechazasek)xx(Si
0
16
1i
2i
0
16
1i
2i
Por el Lema de Fisher-Cochran:
21n2
2i
2
2i
2
2x
2
2x )xx(n
)xx(nns.)1n(
bajo la hipótesis nula, se tiene: 2152
0
16
1i
2i )xx(
Para calcular el valor de la constante k, determinando la región crítica de forma óptima,se parte del nivel de significación :
ciertaH/k)xx(P)ciertaH/HchazarRe(P 0
16
1i
2i00
025,025kPciertaH/k)xx(
P)ciertaH/HchazarRe(P 21502
020
16
1i
2i
00
2,687k488,2725k 2
15;025,0
Por otra parte, el valor muestral 432)xx(2716
)xx( 16
1i
2i
16
1i
2i
2x
Estadística Teórica: Contrastes 32
Siendo 2,687432 conduce a no rechazar la hipótesis nula de que la población sigueuna )5,(N , advirtiendo que se halla en la región de aceptación.
La potencia del contraste:
)ciertaH/Hchazar(ReP)falsaH/Hchazar(RePPotencia1 1000
287,009,19P36
2,687PciertaH/k)xx(P1 215
2151
16
1i
2i
Áreas Abscisas
10,0x
10,090,0
307,2209,19
307,22547,8
287,0
76,13
80,0.217,310,0x
II Método
Hipótesis sobre :2
36:H25:H
211
200 2
021
Regla de decisión:
02x
02x
HAcepto:A.RkSiHchazoRe:C.RkSi
Por el Lema de Fisher: 21n2
2x
2
2x s)1n(n
con lo cual,
n. 2
1n202
x
En el muestreo, bajo la hipótesis nula 2520 , con tamaño muestral ,16n se tiene:
0H
215
21n
202
x 16.25
n.
La determinación del valor crítico k a partir de (Error Tipo I):
)2k(P)ciertaHk(P)ciertaHHchazar(ReP 22x0
2x00
01,0)k2516(Pk
16
.25P 2
15
215
778,47k578,30k
2516Pearson2
Comparamos el valor crítico )778,47k( con la evidencia muestral 272x
Como 778,47272x nos situamos en la región de aceptación (R.A), aceptando la
hipótesis de que la varianza es 25, con un nivel de confianza del 99%.
Estadística Teórica: Contrastes 33
De otra parte, la potencia del contraste será:
)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000
En el muestreo, bajo la hipótesis alternativa 3620 , con tamaño muestral ,16n se
tiene:
1H
215
21n
202
x 16.36
n.
162,0235,21PciertaH/778,4716
.36PPotencia 2
151
215
Abscisas Áreas
307,22235,21
307,22547,8
10,0x
10,090,0
162,0
76,13
80,0.072,110,0x
Estadística Teórica: Contrastes 34
CONTRASTE UNILATERAL DE LA VARIANZA DE UNA POBLACIÓN CON MEDIA POBLACIONALCONOCIDA Y DESCONOCIDA. POTENCIA DEL CONTRASTE.
12.- El retraso de salidas de vuelos sigue un normal ),(N . Los responsables de unaeropuerto afirman que el retraso medio es de 30 minutos con una desviación típica de5 minutos. A pesar de ello, una organización de consumidores manifiesta que se muestrade acuerdo de que los retrasos sigue una ley normal con media 30 minutos, pero que ladesviación típica es de 15 minutos. Se pide:
1. Contrastar con un nivel de significación del 5%, la hipótesis nulautosmin5:H0 frente a la alternativa utosmin15:H1 , a partir de una
muestra aleatoria simple de vuelos cuyos retrasos se adjuntan:32,3 36,4 35,2 38,9 39,3 38,4 51,5 36,429,3 39,2 43,4 30,2 37,4 42,6 40,1
2. Calcular la potencia del contraste anterior.3. ¿Cambia la decisión tomada en el apartado (1) si el retraso medio hubiera sido
desconocido?
Solución:
1. Hipótesis sobre :2
225:H25:H
211
200 2
021
Las hipótesis nula y alternativa son simples, con media poblacional conocida. El lema deNeyman-Pearson conduce a la regla de decisión:
Regla de decisión
.)A.R(Haceptasek)x(Si
.)C.R(Hrechazasek)x(Si
0
15
1i
2i
0
15
1i
2i
Para calcular el valor de la constante k, determinando la región crítica de forma óptima,se parte del nivel de significación :
cierta25:H/k)x(P)ciertaH/HchazarRe(P 2
00
15
1i
2i00
El estadístico
15
1i
2i )x( en el muestreo, bajo la hipótesis nula, donde las variables
aleatorias independientes ix siguen una ley )5,30(N .
Estadística Teórica: Contrastes 35
En consecuencia, 5
30xi sigue una )1,0(N . Por tanto, 215
15
1i
2i
25x
A partir del nivel de significación (Error Tipo I):
05,025kPciertaH/
25k
530x
P)ciertaH/HchazarRe(P 2150
15
1i
2i
00
9,624k996,2425k 2
15;05,0
Por otra parte, el valor muestral del estadístico 02,1393)30x(15
1i
2i
Siendo k9,62402,1393)30x(15
1i
2i
se rechaza la hipótesis nula, el retraso
medio de la salida de los vuelos no sigue una )5,30(N .
Adviértase que la región de rechazo de la hipótesis nula:
2n;2
0
2n
1ii )x(
R
en este caso,
996,2472,55
25
)30x(R 2
15;05,0
215
1ii
la región de rechazo se
verifica, con lo que no se acepta la hipótesis nula, esto es, el retraso medio de salida delos vuelos no sigue una ley normal )5,30(N .
2. La potencia del contraste:
1)cierta225:HHchazar(ReP)falsaHHchazar(RePPotencia 211000
1777,2P225
9,624PciertaH/kP1 215
21512
1
215
3. Como se desconoce el valor de la media poblacional las hipótesis son compuestas, nopudiéndose aplicar el lema de Neyman-Pearson.En consecuencia, para obtener la región crítica es necesario utilizar el test de razón deverosimilitud, que conduce a la regla de decisión:
Estadística Teórica: Contrastes 36
Regla de decisión
.)A.R(Haceptasek)xx(Si
.)C.R(Hrechazasek)xx(Si
0
15
1i
2i
0
15
1i
2i
Por el Lema de Fisher-Cochran 21n2
2xn
, bajo la hipótesis nula: 2
14
15
1i
2i
25
)xx(
Para calcular el valor de la constante k, determinando la región crítica de forma óptima,se parte del nivel de significación :
25:H/k)xx(P)ciertaH/HchazarRe(P 2
00
15
1i
2i00
125,592k685,2325k05,0
25kP
25k
25
)xx(P 2
14
15
1i
2i
De otro lado, el valor muestral 396,423)xx(2264,2815
)xx( 15
1i
2i
15
1i
2i
2x
Siendo k125,592396,423)xx(15
1i
2i
no se rechaza la hipótesis nula, por
tanto, se cambia la decisión que se tomó en el apartado (1).
Adviértase que la región de rechazo de la hipótesis nula:
2)1n(;2
0
2n
1ii )xx(
R ,
en este caso,
685,2394,16
25
)xx(R 2
14;05,0
215
1ii
la región de rechazo no
se verifica, con lo que se acepta la hipótesis nula, esto es, el retraso medio de salida delos vuelos sigue una ley normal )5,30(N .
Estadística Teórica: Contrastes 37
CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA DESCONOCIDA. CALCULAR YREPRESENTAR LA FUNCIÓN DE POTENCIA.
13.- El directorio de uno de los grandes operadores de Internet está considerando laposibilidad de ofrecer tarifa plana a sus clientes. Según sus conocimientos sobre eltema, sabe que está trabajando con una variable aleatoria que se distribuye como unanormal. Mantiene la hipótesis de que los hogares que tienen Internet se conectan conuna media de 5 horas mensuales. No obstante, existen otros estudios que sostienen queel tiempo de conexión es más alto. Para evaluar, a un 10% de significación, dichahipótesis, el directorio decide encuestar a una muestra aleatoria de 30 hogares,obteniendo una media de 5,34 horas de conexión, con una dispersión de 7,24 horas.
a) Formular el contraste a realizar.b) Determinar la mejor región crítica del contraste.c) ¿Se puede rechazar la hipótesis nula?d) Calcular y representar la función de potencia. ¿Qué representa la función depotencia?. Para facilitar los cálculos, suponer que el tamaño muestral es 300hogares.
Solución:
Sea la variable aleatoria X = ’conexión a Internet por hogares’ ),5(NX
a) Las hipótesis sobre la media poblacional con 2 desconocida:
Hipótesis sobre :
5:H5:H
11
00
Se trata de un contraste unilateral, siendo 1H compuesta.
b) Regla de decisión:
0
0
HAcepto:A.RkxSiHchazoRe:C.RkxSi
En el muestreo de una población normal con varianza desconocida, y desviación típica
muestral x , la variable: 1nx
t
1n
x
1n
tx x1n
c) Determinación de k a partir del nivel de significación :
)5kx(P)ciertaHkx(P)ciertaHHchazar(ReP 0000
10,024,7
29.)5k(tPk130
24,7t5P5k1n
tP 291300x
1n0
Estadística Teórica: Contrastes 38
En las tablas de la t de Student: 311,1t 29;10,0 , con lo cual,
76,629
24,7.311,15k311,124,7
29.)5k(
Comparando k con el valor del estadístico muestral 34,5x0
El valor 76,634,5x0 , no pudiendo rechazar 0H , porlo que tiene razón el Directivo, el tiempo medio deconexión es de 5 horas.
Alternativamente, con el estadístico de contraste (valor experimental), la regiónde rechazo R viene dada por la expresión:
1ntx
n
stxR x
)1n(;0x
)1n(;0
763,134,02924,7311,1534,5R
29;10,0t
, no cumpliéndose la región de
rechazo, no existe evidencia significativa de rechazar la hipótesis 0H con un nivel deconfianza del 90%.
Una forma análoga de enfocar el problema consistiría en aceptar la hipótesis 0H cuando
el estadístico experimental fuera menor o igual que el estadístico teórico, es decir:
Se acepta 0H cuando se verifica: teóricooestadístic
1n;
erimentalexpoestadístic
x1n t
1n
xt
En este caso, 29;10,029 t311,12537,02924,7534,5t
, se acepta la hipótesis 0H
d) Potencia )falsaHHchazarRe(P)1( 00
La hipótesis 1H es compuesta (existen infinitos valores tal que > 5), se construye una
función, es decir:
5:H 11 1
Distintos valores
)Hkx(P)falsaHHAceptar(P)ciertaHHchazar(ReP)IIET(P 1
DecisióngiónRe
0011
Estadística Teórica: Contrastes 39
En el muestreo de una población normal con varianza desconocida, y desviación típica
muestral x , la variable: 1nx t
1n)x(
, siendo la muestra 300n , la
distribución se aproxima a una )1,0(N
76,6k
30nx
11n1
x1n11
1n.)k(tPHk
1ntP)Hkx(P
x
1 1n.)76,6(zP , en consecuencia:
5,5:H 11
9986,03zP24,7
299.)5,576,6(zP1n.)76,6(
zPx
1
6:H 11
9656,082,1zP24,7
299.)676,6(zP
7:H 11
2843,057,0zP24,7
299.)776,6(zP
8:H 11
00154,096,2zP24,7
299.)876,6(zP
5:H 11 1
5,5 0,9986 0,00146 0,9656 0,00347 0,2843 0,71578 0,0015 0,9985
A medida que se alejan las hipótesis 0H y 1H aumenta la potencia del contraste. Es
decir, cuanto más alejadas se encuentren las hipótesis para contrastar, mayor será laprobabilidad de que se rechace 0H cuando sea falsa, algo deseable (constante y k).
Estadística Teórica: Contrastes 40
14.- El propietario de un automóvil sospecha que su vehículo tiene un consumo mediode combustible en carretera superior a los 5,6 litros /100 Km., que es lo que elfabricante indica en su publicidad. Para apoyar empíricamente su sospecha observa elconsumo medio en 11 viajes seleccionados aleatoriamente entre todos los que realiza enel año, obteniendo los siguientes resultados:
6,1 6,5 5,1 6 5,9 5,2 5,8 5,3 6,2 5,9 6,3Se pide:
a) ¿Están fundadas las sospechas del propietario a un nivel de significación del 1%?b) ¿En cuántas ocasiones debería observarse el consumo medio para que con un nivel
de confianza del 99% se detectase un consumo medio de 5,9 litros/100 km.?
Solución:
a) Suponemos que el consumo medio del automóvil sigue una distribución normal ),(N , ambos parámetros desconocidos, y mientras el fabricante afirma que 6,5:H 0 el propietario del vehículo cree que 6,5:H1 . Se trata, pues, de un contraste unilateral, donde 1H es compuesta.
Regla de decisión:
0
0
HchazoRe:C.RkxSiHAcepto:A.RkxSi
En el muestreo de una población normal con varianza desconocida, desviación típica
muestral ( x ), cuasidesviación típica ( xs ), la variable: 1nxx
t1n
xns
x
Bajo la hipótesis nula, con los datos muestrales ( 8454,5x , 4612,0s x ), el
muestreo sigue una distribución )1390,0;6,5(t11
4612,0;6,5t 1010
El valor crítico k, bajo la hipótesis nula, se calcula a partir del nivel de significación :
)6,5kx(P)ciertaHkx(P)ciertaHHchazar(ReP 0000
764,21390,0
6,5k01,01390,0
6,5ktP1390,0
6,5k1390,0
6,5xP 10
de donde, 9842,5k . Siendo 9842,58454,5x no se puede rechazar la hipótesisnula 0H , con lo que se acepta las afirmaciones del fabricante sobre el consumo mediodel automóvil.b) En esta ocasión se plantea la cuestión )9,5/kx(P
Estadística Teórica: Contrastes 41
Donde el tamaño muestral es desconocido, y donde el estadístico 10x
tns9,5x
no
sigue un t-Student con 10 grados de libertad.
Por tanto, recurrimos a la siguiente estrategia:
764,2
ns3,09,5xP9,5/764,2
ns6,5xP)9,5/kx(P
xx
99,0ns
3,0764,2ns9,5xP764,2
ns3,0
ns9,5xP
xxxx
o bien, 01,0ns
3,0764,2ns9,5xP
xx
Nos encontramos en un punto donde no se pueden utilizar las tablas de la t-Sudentporque no conocemos el tamaño de la muestra. Para ello, suponemos que el tamaño essuficientemente grande para que pueda ser aceptable la aproximación de la t mediantela distribución normal.Con la aproximación normal, y con la simetría de la N(0, 1):
327,2ns
3,0764,201,0ns
3,0764,2zPxx
2x
x 3,0s.)091,5(
n091,5ns
3,0
Otra vez en un callejón sin salida, aún es necesario conocer la cuasidesviación típica deuna muestra sin saber su tamaño. Podemos dar una salida, suponiendo que lacuasidesviación típica de esta nueva muestra es igual a la obtenida en la muestraanterior 4612,0s x . En este caso,
255,613,0
)4612,0(.)091,5(n2
Para mayor seguridad en el logro de nuestro objetivo, redondeamos con el enteroinmediato superior, esto es, el tamaño de la muestra es 62.
Estadística Teórica: Contrastes 42
CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA CONOCIDA.
15.- El número de averías de un determinado tipo de avión se considera una variablealeatoria con distribución de Poisson de media 2 averías al mes. El equipo demantenimiento intenta reducir esta media incorporando algunas mejoras. Paracomprobar si con estas medidas se reduce el número medio de averías, se decideobservar el número medio de averías en los 25 meses siguientes a la introducción de lasmejoras. Si el número medio de averías en esos 25 meses fue de 1,5. ¿Qué decisióndebe adoptar el servicio técnico a un nivel de significación del 1%?. ¿Y si el serviciotécnico relaja su nivel de exigencia al 85% de confianza?. ¿Cambiaría su decisión?.
Solución:
Sea la variable aleatoria X = ‘Número de averías al mes’
)2,2(N)2(PXn
En la muestra de tamaño 25n meses 5,1xˆ averías. La distribución en el
muestreo, bajo la hipótesis nula 0H ,
252,2N
n,Nx
Es un contraste unilateral, donde se plantean las hipótesis:
)compuesta(2:H2:H
1
0 ,
donde la regla de decisión, existe
)RC(HrechazasekxSi)RA(HrechazasenokxSi
k0
0
Se determina el valor de k considerando el nivel de significación :
34,1kz32,225/2k201,0
25/2k2zP
01,025/22kzP)2:H/kx(P)ciertaHHchazar(ReP
01,0
000
Se advierte que ( 34,15,1 ), cae en la región de aceptación, con lo cual se acepta lahipótesis nula, esto es, con un nivel de significación del 1% se afirma que las averíasmensuales se mantienen siendo 2, y en consecuencia, las mejorías no son operativas.
Si 15,0 se replantean los cálculos: 71,1kz04,125/2k2
15,0
Como 34,171,1 , cae en la región de rechazo, con lo que no se acepta la hipótesis nula,y se concluye que las mejoras son operativas.
Estadística Teórica: Contrastes 43
CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL DESCONOCIDA.
16.- La concentración media de dióxido de carbono en el aire en una determinada zonano es habitualmente mayor que 355 p.p.m.v (partes por millón en volumen). Se sospechaque esta concentración es mayor en la capa de aire más próxima a la superficie.Para contrastar esta hipótesis se analiza aire en 20 puntos elegidos aleatoriamente auna misma altura del suelo. Los datos recogidos tienen una media muestral de 580p.p.m.v y una cuasidesviación típica muestral de 180.Suponiendo que las mediciones siguen una distribución normal, ¿podemos afirmar a unnivel de 0,01, que los datos proporcionan suficiente evidencia estadística a favor de lahipótesis de que la concentración es mayor cerca del suelo?.Indicar razonadamente si el p-valor es mayor o menor que 0,01
Solución:
Tenemos una muestra aleatoria )X,,X,X( n21 de tamaño 20n , donde lavariable aleatoria X = "concentración de dióxido de carbono en puntos cercanos alsuelo" sigue una distribución normal );(NX con varianza poblacional desconocida.
Deseamos comprobar si hay suficiente evidencia estadística a favor de que335 . Para ello, planteamos un contraste con la hipótesis nula 335:H0 frente a
la hipótesis alternativa 335:H1 , con un nivel de significación 01,0
En esta línea, nos encontramos ante un contraste unilateral (una cola) para la mediapoblacional con varianza poblacional desconocida.
Se rechaza la hipótesis nula si se verifica la región de rechazo:
ns
txR x)1n(;0
donde, 225355580x 0
19,10220
180539,2
ns
tt x19;01,0)1n(;
Como 19,102225R SI se verifica la condición de rechazo, por tanto,RECHAMOS la hipótesis nula 0H .En consecuencia, existe suficiencia estadística (con un nivel de significación 0,01) paraconcluir que la concentración media de dióxido de carbono es superior a 355 cerca delsuelo.
Estadística Teórica: Contrastes 44
Por otra parte, el p-valor se interpreta como el apoyo que los datos proporcionan a lahipótesis nula 0H .
En otras palabras, Cuando el p-valor < SE RECHAZA 0H
Como hemos rechazado 0H con 01,0 , el p-valor < 0,01
Estadística Teórica: Contrastes 45
CONTRASTE BILATERAL DE LA PROPORCIÓN.
17.- Un dentista afirma que el 40% de los niños de 10 años presentan indicios de cariesdental. Tomada una muestra de 100 niños, se observó que 36 presentaban indicios decaries.Contrastar la hipótesis del dentista para un nivel de confianza del 90%.
Solución:
Sea el parámetro p = "proporción de niños que presentan indicios de caries dental".
Como siempre que queremos hacer un contraste sobre una proporción, partimosde una muestra aleatoria )X,,X,X( n21 de tamaño 100n , donde )p;1(BX .
La distribución en el muestreo del estadístico
nq.p,pN
n
xp̂x
.L.C.Tn
1ii
Recurrimos al contraste de la hipótesis nula 40,0p:H 0 frente a la hipótesisalternativa 40,0p:H1 , con un nivel de significación 10,0
La Hipótesis nula se rechaza cuando se verifica la región de rechazo:
n)p1(p
zpxR 0020
donde,
04,040,01003640,0p̂px 0
08,0)0489898,0(.)64,1(100
)40,01(40,0zn
)p1(pz 05,0
002
por tanto, 08,004,0R NO se verifica la condición de rechazo y aceptamos lahipótesis nula 0H . En consecuencia, con un nivel de significación de 0,10, se puedeafirmar que el 40% de los niños presenta indicios de caries dental.
Estadística Teórica: Contrastes 46
18.- En los días previos a unas elecciones municipales, el candidato de un partidopolítico está convencido de obtener el 60% de los votos electorales. No obstante, supartido encarga una encuesta entre 100 votantes potenciales, resultando que el 52% deellos dijeron tener intención de votar a dicho candidato. Con un nivel de significacióndel 5%, se pide contrastar:
a) 60,0p:H 0 frente a 50,0p:H1
b) 60,0p:H 0 frente a 60,0p:H1
c) Potencia del contraste efectuado en el apartado (a).
Solución:
a) Sea la variable X ="% de votos al candidato"
Nos encontramos ante un contraste de hipótesis nula simple frente a una hipótesisalternativa simple: 60,0p:H 0 frente a 50,0p:H1
Regla de decisión:
.)C.R(HrechazaSekp̂.)A.R(HaceptaSekp̂
0
0
La distribución en el muestreo de
100
1iix
1001p̂ siendo
Novota0Sivota1
xi
donde se conoce p)p̂(E y que n
)p1(p)p̂(V .
Al ser el tamaño suficientemente grande 100n y estar definido p̂ como suma devariables aleatorias independientes, según una distribución de Bernouilli )p,1(B sepuede aproximar la distribución exacta de n)p1(.p,pNp̂
Bajo la hipótesis nula: )049,0;60,0(N100
)60,01(.60,0,60,0Np̂
El valor crítico K se determina, bajo la hipótesis nula, por el nivel de significación:
05,0)ciertaH/Hchazar(ReP)IET(P 00
05,0049,0
60,0kzP049,0
60,0k049,0
60,0p̂P)6,0p:Hkp̂(P)IET(P 0
5186,0k645,1049,0
60,0k
Estadística Teórica: Contrastes 47
En consecuencia, como la proporciónmuestral fue 52,010052xp̂ ,se encuentra dentro de la región deaceptación de la hipótesis nula.
b) En este caso, se trata de un contraste bilateral con hipótesis nula simple frente a una hipótesis alternativa compuesta: 60,0p:H 0 frente a 60,0p:H1
Regla de decisión:
.)C.R(HrechazaSekp̂.)A.R(HaceptaSekp̂
0
0
Bajo la hipótesis nula: )049,0;60,0(Np̂
Para determinar el crítico K, bajo la hipótesis nula, nos apoyamos en el nivel designificación:
05,0)ciertaH/Hchazar(ReP)IET(P 00
05,0049,0
60,0K049,0
60,0p̂P)6,0p:HKp̂(P)IET(P 0
La región crítica: 504,0)96,1()049,0(60,0p̂
696,0)96,1()049,0(60,0p̂z96,1
049,060,0p̂
025,0
Como 52,010052xp̂ se encuentraen la región de aceptación, se acepta lahipótesis nula.
c) Potencia del Contraste: 1)falsaHHchazar(RePPotencia 00
Error Tipo II: )falsaH/HAceptar(P)IIET(P 00
Con la hipótesis alternativa 50,0p:H1 : )05,0;5,0(N100
5,0.5,0;5,0Np̂
35496,0)372,0z(P
05,05,05186,0
05,05,0p̂P)05,0;5,0(N/5186,0p̂P)IIET(P
Estadística Teórica: Contrastes 48
Abscisas Areas0,37 - 0,38 0,3557 - 0,3520
0,372 - 0,38 x - 0,352035496,0
01,0)0037,0()008,0(3520,0x
6450,035496,011Potencia
También se podía haber realizado por la definición de potencia de un contraste:
6450,0)372,0z(P1)372,0z(P05,0
5,05186,005,0
5,0p̂P
)05,0;5,0(N/5186,0p̂P)falsaHHchazar(RePPotencia 00
Estadística Teórica: Contrastes 49
19.- El dueño de los cines CINEFILÓN considera que, dado el aforo de la sala, unaafluencia diaria a la misma del 85% sería óptima, en el sentido de que los clientes sesientan cómodos y para que a la vez no haya pérdidas económicas. Durante un período detiempo, se analiza la afluencia a los cines, observándose que, en media, se ocupan 171 delas 200 butacas. ¿Con qué confianza podrá afirmar el dueño de CINEFILÓN que laasistencia a sus cines es óptima? ¿Qué pasaría si el dueño quisiera estar más seguro desu decisión, y ampliar el nivel de confianza al 99%?
Nota: La regla de la decisión adoptada es que si hay una desviación inferior al 5% de lacantidad óptima, se aceptaría la hipótesis de que la afluencia es, efectivamente, óptima.
Solución:
Sea la variable aleatoria X = '% asistencia diaria a los cines CINEFILÓN' , )p,1(BX .
- En el contraste bilateral se establecen las hipótesis:
85,0p:H85,0p:H 1100
- En el muestreo, la proporción que acude a los cines (200 butacas) en un día (nXp̂ ),
bajo la hipótesis nula, por el TCL (Teorema Central Límite), sigue una distribución
)025,0;85,0(N200
15,0.85,0,85,0Nnq.p,pN
- Se determina )1( a partir de los valores críticos, considerando que una desviacióninferior al 5% de la cantidad óptima significa que 90,0p̂80,0
0456,0028,0.22zPz2P025,0
85,090,0zz025,0
85,080,0P
)ciertaH/Hchazar(ReP 00
El nivel de confianza: 9544,00456,011
Si el nivel de confianza %1%991 (mayor exigencia).
El valor crítico k se determina a partir del nivel de significación 01,0
Estadística Teórica: Contrastes 50
01,0025,0
85,0kzz
025,085,0k
P)ciertaH/Hchazar(ReP 2100
786,0k914,0k
z57,2025,0
85,0k2
1005,0
Comparando los valores críticos k con el valor del estadístico muestral (evidencia
empírica) 855,0200171p̂ , se observa que cae dentro de la región de aceptación (R.A.),
concluyendo que se acepta la hipótesis nula siendo óptima la afluencia a los cinesCINEFILÓN.
Estadística Teórica: Contrastes 51
CONTRASTE BILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL CONOCIDA.
20.- En una población ),10(N se desea contrastar la hipótesis nula 3:H 20
frente a la hipótesis alternativa 3:H 21 con un nivel de significación del 5%. En una
muestra aleatoria simple de tamaño 4 se obtuvieron los resultados:
10 8 12 14
Solución:
Hipótesis compuesta sobre :2
3:H3:H
21
20
Como la hipótesis alternativa es 32 en la decisión que tomemos deberán ser válidosvalores de 2 tanto mayores o menores que 3, por lo que el contraste debe serbilateral o de dos colas.
Regla de decisión:
02
4
1ii
02
4
1ii
HAcepto:A.Rk)x(Si
HchazoRe:C.Rk)x(Si
En la distribución en el muestreo del estadístico 24
1ii )x(
, las variables aleatorias
independientes ix se distribuyen ),10(N ; bajo la hipótesis nula )3,10(N :
4
1i
24
2i
4
1i
2
0
i
310xx
(suma de 4 variables aleatorias )1,0(N , independientes entre sí)
Fijado el nivel de significación (Error Tipo I), se halla el valor de la constante k:
05,0kPkP)k(kP
kPciertaH/k310x
PciertaH/HchazarReP
212241
242
241
24
240
4
1i
2i
00
)(
143,11k025,0kP
484,0k975,01kP1kP2
4;025,022224
24;975,0111
241
24
Estadística Teórica: Contrastes 52
Región de rechazo:)143,11(484,0 2
424 )( ,
con lo que la región de aceptación esel intervalo 143,11;484,0 .
El estadístico muestral, bajo la hipótesis nula, 83
)10x( 24
1ii
, pertenece a la
región de aceptación, concluyendo que la varianza de la distribución es 3.
Análogamente,
Considerando la región de rechazo:
2n;2/
2n;2/12
0
2n
1ii
;)x(
R
El valor del estadístico muestral 24)x( 24
1ii
, bajo la hipótesis nula resulta:
83
24)x(
20
24
1ii
. Los valores tabulares son
143,11484,0
24;025,0
2n;2/
24;975,0
2n;2/1
La región de aceptación de la hipótesis nula es el intervalo 143,11;484,0 .
Al pertenecer el valor muestral del estadístico 8)x(
20
24
1ii
a la región de
aceptación, se concluye que la varianza de la distribución es 3.
Estadística Teórica: Contrastes 53
CONTRASTE BILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL CONOCIDA.
21.- En una población )5,(N se quiere contrastar la hipótesis nula 18:H0 frentea la hipótesis alternativa 18:H1 , con un nivel de significación 01,0 , con unamuestra de tamaño 10:
16 12 15 16 20 25 14 18 17 22
Solución:
En el contraste se establecen las hipótesis:
18:H18:H
1
0 Como la hipótesis alternativa
es 18 en la decisión que hayamos de tomar deberán ser válidos valores de tantomayores o menores que 18, por lo cual el contraste debe ser bilateral o de dos colas.
Regla de decisión
.)A.R(HaceptasekxSi.)C.R(HrechazasekxSi
0
0
La muestra de tamaño 10, con media 5,17x 10
10
1iix
siendo la varianza poblacional
conocida 252 , bajo la hipótesis nula sigue una distribución )105,18(N , con lo que
la variable
105
18x es )1,0(N .
El valor de k se calcula mediante el nivel de significación 01,0 :
01,0K
10518xPK
10518xPK
10518xK
10518xP
K
10518xP)kx(P)ciertaHHchazar(ReP 00
La región crítica será:
Estadística Teórica: Contrastes 54
93,13)575,2(10518x
07,22)575,2(10518x
zz575,2
10518x
005,02/
En consecuencia, la región de aceptación: 07,22x93,13
Como la media muestral 5,17x 10
10
1iix
está contenida en la región de aceptación, nose rechaza la hipótesis nula 18 , con un nivel de significación de 0,01.
Análogamente, la región de rechazo:
n.zxR 20rechazo
071,45,0105).575,2(185,17
105.z185,17R 05,0rechazo
No se verifica la región de rechazo, en consecuencia se admite la hipótesis nula 18 ,con un nivel de significación de 0,01.
Estadística Teórica: Contrastes 55
CONTRASTE BILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL DESCONOCIDA.
22.- En una población ),(N se quiere contrastar la hipótesis nula 2:H0 frentea la hipótesis alternativa 2:H1 , con un nivel de significación 01,0 , con unamuestra aleatoria simple de tamaño 15:
2,1 2,25 3,01 2,92 2,98 3,08 3,8 3,952,75 2,74 3,16 2,56 3,15 2,65 3,12
Solución:
En la muestra se obtiene:
948,215
xx
15
1ii
2264,0
15
)xx(15
1i
2i
2x
2426,0
14
)xx(s
15
1i
2i
2x
476,0x 493,0sx 15n
Como la hipótesis alternativa es 2 en la decisión que hayamos de tomar deberán serválidos valores de bien sean mayores o menores que 2, por lo cual el contraste debeser bilateral o de dos colas.
Regla de decisión:
.)A.R(HaceptasekxSi.)C.R(HrechazasekxSi
0
0
En el muestreo de una población normal con varianza desconocida, y desviación típica
muestral x , la variable 1nxx
t
ns
x
1n
x
Con el nivel de significación 01,0 se determina la región crítica:
2/K1n
xP)H/kx(P)ciertaHHchazar(RePx
000
K14476,0
2xK14476,0
2xPK14476,0
2xP
14t
Estadística Teórica: Contrastes 56
01,022
K14476,0
2xPK14476,0
2xP
1414 tt
La región crítica es: 14;005,0)1n(;2/ tt977,214476,0
2x
, con lo cual,
622,1)14476,0(.977,22x378,2)14476,0(.977,22x
977,214476,0
2x
La región de aceptación será: 378,2x622,1
Se observa que el valor del estadístico muestral 948,2x no se encuentra en laregión de aceptación, por tanto, se rechaza la hipótesis nula y se acepta que la mediade la distribución poblacional es distinta de 2.
Adviértase que rechazamos la hipótesis nula si se verifica la región de rechazo:
379,0948,015493,0977,22948,2
ns
txR14;005,0t
x)1n(;2/0
verificándose la región de rechazo, con lo cual no se acepta la hipótesis nula,concluyendo que se acepta la hipótesis alternativa de que la media de la distribuciónpoblacional es distinta de 2.
Una forma análoga de enfocar la cuestión consiste en aceptar la hipótesis nula2:H0 cuando el estadístico experimental fuera menor o igual que el estadístico
teórico, esto es:
teóricooestadístic
)1n(;2/
erimentalexpoestadístic
x
01n t
ns
xt
El estadístico de contraste: 447,715/493,02948,2
ns
xt
x
01n
El valor tabular del estadístico teórico: 977,2tt 14;005,0)1n(;2/
Como 14;005,01n t977,2447,7t se rechaza la hipótesis nula, concluyendo que lamedia de la distribución poblacional es distinta de 2.
Estadística Teórica: Contrastes 57
23.- Se recibe un envío de latas de conserva de las que se afirma que el peso medioson 1.000 gr. Examinada una muestra de 5 latas se obtiene un peso medio de 995 gr. conuna cuasivarianza 6,19s2
x . Al nivel de confianza del 95%, ¿se puede aceptar que elpeso medio son 1.000 gr.?
Solución:
Tenemos una muestra aleatoria )X,,X,X( n21 de tamaño 5n , donde la variablealeatoria X = "peso de una lata de conserva", suponemos que sigue una distribuciónnormal );(NX con varianza poblacional desconocida.
Deseamos ver si resulta aceptable que 1000 . Para ello, planteamos un contrastecon la hipótesis nula 1000:H0 frente a la hipótesis alternativa 1000:H1 , conun nivel de significación 05,0
Adviértase que como la hipótesis alternativa 1000:H1 , en la decisión que hayamosde tomar deberán ser válidos valores de tanto mayores o menores que 1000, por loque el contraste debe ser BILATERAL o de dos colas.En esta línea, se rechaza la hipótesis nula si se verifica la región de rechazo:
ns
txR x)1n(;2/0
donde, 51000995x 0
50,55
6,19776,2
ns
tn
st x
4;025,0x
)1n(;2/
Como 5,55R NO se verifica la condición de rechazo, ACEPTAMOS la hipótesisnula 0H . En consecuencia, con un nivel de significación de 0,05, se puede afirmar que elpeso medio son 1000 gramos.
Estadística Teórica: Contrastes 58
CONTRASTE BILATERAL DE LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALESCONOCIDAS.
24.- El análisis laboral que la U.E ha realizado para toda Europa, señala que en España,el salario mensual de los varones, en algunos sectores económicos, supera en más de 100euros el salario de las mujeres que desempeñan las mismas tareas.El Ministerio de Trabajo español decide considerar el salario mensual como una variablealeatoria normalmente distribuida con desviación típica de 39,6 euros para lostrabajadores masculinos y de 36 euros para las trabajadoras de dichos sectores, siendoel salario de cada población independiente del de la otra. Para tratar de verificar lopublicado, se elige una muestra aleatoria simple de 500 trabajadores y de 700trabajadoras, obteniéndose unos salarios medios mensuales de 1.500 y 1.370 eurosrespectivamente.¿Está fundamentada las conclusiones de la U.E al 1% de significación?
Solución:
Sean las variables aleatorias, respectivamente, X = ‘Salario mensual de los varones’ eY = ‘Salario mensual de las mujeres’, donde )6,39,(NX x e )36,(NY y .
En las muestras se obtuvieron los resultados:
700n€370.1y
500n€500.1x
y
x
- En el contraste se establecen las hipótesis:
)compuesta(100:H100:H yx1yx0
La regla de decisión será:
)RA(Hrechazasenok)yx(Si)RC(Hrechazasek)yx(Si
0
0
- La diferencia de medias muestrales )yx( , siendo las varianzas muestralesconocidas, bajo la hipótesis nula, sigue una distribución:
)23,2;100(N70036
5006,39;100N
nn;)(N
22
y
2y
x
2x
yx
- Se determina el valor de k mediante el nivel de significación :
Estadística Teórica: Contrastes 59
€2,105kz32,223,2100k
01,023,2100kzP)100:H/kyx(P)ciertaHHchazar(ReP
01,0
yx000
La evidencia empírica €130370.1500.1yx . Se advierte que 2,105130 ,cae en la región de rechazo, con lo cual no se acepta la hipótesis nula, esto es, con unnivel de significación del 1%, se afirma que con el mismo trabajo las diferencias salariasentre hombres y mujeres en algunos sectores económicos españoles son superiores a100 euros mensuales.
Estadística Teórica: Contrastes 60
25.- Con un nivel de significación del 4,72%, se desea contrastar la hipótesis nula deigualdad de medias de dos poblaciones )4,(N 1 y )5,4,(N 2 . Para ello, se hantomado dos muestras aleatorias simples e independientes, respectivamente,obteniéndose los siguientes valores:
ix 20,4 10,2 7,3 12,8 13,4 9,4jy 19,8 9,7 14,6 15.7 8,4
Solución:
En el contraste bilateral se establecen las hipótesis
0:H0:H
211
210
Regla de decisión
0
0
HaceptasekyxSiHrechazasekyxSi
Para analizar el contraste, se realizan los cálculos muestrales:
5n6n64,135
yy25,12
6
xx 21
5
1jj
6
1ii
La región crítica de dos colas kyx es función de la diferencia de las mediasmuestrales. En esta línea, las distribuciones en el muestreo de las medias son:
1
11 n
,Nx ,
2
22 n
,Ny , con lo cual, la diferencia de medias muestrales,
bajo la hipótesis nula 0:H 210 , se distribuye:
59,2,0N55,4
64,0N
nn,0Nyx
22
2
22
1
21
Se determina el valor de k mediante el nivel de significación :
0:H/kyxP)ciertaHHchazar(ReP 21000
)1,0(Nsimetríapor05,022
K59,2
yxPK59,2
yxP
K59,2
yxK59,2
yxPK59,2
0)yx(P
Estadística Teórica: Contrastes 61
La región crítica es 17,5yx
17,5yxz995,1
59,2yx
0236,0
En consecuencia, la región de aceptación: 17,5yx17,5
La evidencia empírica 39,164,1325,12yx , valor que no se encuentra en laregión de rechazo, por lo que se acepta la hipótesis nula de igualdad de medias, con unnivel de significación del 4,72%.
Análogamente, la región de rechazo de la hipótesis nula 0H :
55,4
64)995,1(64,1325,12R
nnzyxR
22
2
22
1
21
2
La región de rechazo de la hipótesis nula no se cumple, 17,539,1R , se concluyeque existe igualdad entre las medias poblacionales.
Cálculo de 0236,0z :
Abscisas Áreas
99,1x
99,198,1
0233,00236,0
0233,00239,0
995,1
0006,00003,0.01,0
99,1x
Estadística Teórica: Contrastes 62
26.- Una empresa dedicada a la fabricación de artículos deportivos dispone de dosmáquinas para el inflado de balones. La presión en kg a la que son inflados los balones esuna variable aleatoria X con distribución )25,0;(N .Se desea contrastar con un nivel de significación del 5%, la hipótesis de que los balonesinflados con las dos máquinas tienen igual presión media. Para ello, se toman dosmuestras aleatorias simples de balones con las siguientes presiones de inflado:
Máquina 1 3 5 6 4 3 5Máquina 2 5 4 3 7 6 5 4 7 4
¿Cuál es el resultado del contraste?
Solución:
Sean las variables aleatorias X = ‘presión en kg que son inflados los balones en lamáquina 1’ e Y = ‘presión en kg que son inflados los balones en la máquina 2’,respectivamente, las variables aleatorias siguen distribuciones )25,0;(N 1 e
)25,0;(N 2 .La presión media con que son inflados los balones en las máquinas respectivas se
distribuyen con parámetros:
625,0;Nx 1 e
925,0;Ny 2
Se desea contrastar la hipótesis nula de que las presiones medias de inflado con ambasmáquinas son iguales: 210 :H frente a la hipótesis alternativa 211 :H
Como la hipótesis alternativa es 21 en la decisión que tengamos que tomar debenser válidos valores mayores o menores que 2 , con lo que el contraste debe serbilateral o de dos colas.
La regla de decisión será:
)RA(HrechazasenokyxSi)RC(HrechazasekyxSi
0
0
Para analizar el contraste se realizan los cálculos:
9n6n59
y
y33,46
xx 21
9
1jj
6
1ii
- En las distribuciones del muestreo
625,0,Nx 1 ,
925,0,Ny 2 , con lo cual,
la diferencia de medias muestrales, bajo la hipótesis nula 210 :H , se distribuye:
Estadística Teórica: Contrastes 63
)13,0;0(N925,0
625,0;0N
nn,0Nyx
22
2
22
1
21
- Se determina el valor de k mediante el nivel de significación :
0:H/kyxP)ciertaHHchazar(ReP yx000
)1,0(Nsimetríapor05,022
K13,0
yxPK13,0
yxPK13,0
yxK13,0
yxPK13,0
0)yx(P
La región crítica es 255,0yx
255,0yxz96,1
13,0yx
025,0
En consecuencia, la región de aceptación: 255,0yx255,0
La evidencia empírica 67,0533,4yx , valor que se encuentra en la región derechazo, por lo que no se acepta la hipótesis de que los balones inflados con las dosmáquinas tienen igual presión media.
Análogamente, la región de rechazo de la hipótesis nula 0H :
925,0
625,0)96,1(533,4R
nnzyxR
22
2
22
1
21
2
Se verifica la región de rechazo de la hipótesis nula, 255,067,0R , concluyendoque los balones inflados con las dos máquinas no tienen igual presión media.
Estadística Teórica: Contrastes 64
CONTRASTE BILATERAL – UNILATERAL DE DIFERENCIA DE MEDIAS CON VARIANZASPOBLACIONALES CONOCIDAS.
27.- Una empresa ubicada en Madrid tiene dos conductores para trasladar a losempleados a Segovia. Los conductores deben anotar la duración de cada trayecto. Enuna muestra aleatoria simple de 50 partes de incidencias por conductor, el conductor Aregistra un tiempo medio de trayecto de 62,30 minutos con una desviación típica de10,325 minutos, mientras que el conductor B tiene un tiempo medio de trayecto de60,02 minutos con una desviación típica de 8,625 minutos.El tiempo medio empleado por el conductor A en el trayecto sigue una ley normal
)9,(N 1 y el empleado por el conductor B se distribuye según una ley )8,(N 2 . Con unnivel de significación del 5%, se pide contrastar:1. 210:H frente a 211:H
2. 2:H 210 frente a 2:H 210
Solución:
1. Para realizar el contraste bilateral planteado ( 0 1 2H : ) se recurre al test razónde verosimilitud, ya que, en este caso el lema de Neyman-Pearson no proporciona unaregión crítica óptima.
La regla de decisión que proporciona el test de razón de verosimilitud es:
Regla de decisión: 0
0
x y k se acepta H (R.A.)
x y k se rechaza H (R.C.)
La región crítica de dos colas x y k es función de la diferencia de las mediasmuestrales. En esta línea, las distribuciones en el muestreo de las medias son:
11
1
x N ,n
, 22
2
y N ,n
Con lo cual, la diferencia de medias muestrales, bajo la hipótesis nula, se distribuye:
2 2 2 21 2
1 2
9 8x y N 0, N 0, N 0 , 1,7n n 50 50
El valor de k se determina a partir del nivel de significación 0,05
0 0 0 1 2P(Rechazar H H cierta) P x y k/H : 0
Estadística Teórica: Contrastes 65
1 2k kk 0P z P z z1,7 1,7 1,7
1 2k k P z P z 0,05
1,7 1,7
por simetría
10, 025 1
20, 025 2
k 1,96 z k 3,331,7k 1,96 z k 3,33 1,7
Región de aceptación: 3,33 x y 3,33
La evidencia empírica x y 62,30 60,02 2,28 , valor que se encuentra en laregión de aceptación, por lo que se acepta la hipótesis nula de igualdad de medias, con loque los dos conductores emplean en promedio el mismo tiempo en el trayecto Madrid-Segovia, con una fiabilidad del 95%.
Se podía haber decidido con otros métodos:
Se formulan las hipótesis: 1 2 1 20 1H : 0 H : 0
Se trata de un contraste bilateral o de doscolas, con 0,05
La región de aceptación se encuentraen el intervalo /2 /2( z , z )
Se acepta la hipótesis nula cuando,
p p/2 /2 /22 21 2
1 2
x y 2,28z z z 1,34 1,961,7
n n
Se acepta que los dos conductores emplean en promedio el mismo tiempo en el trayectoMadrid-Segovia.
El intervalo de confianza para la diferencia de medias de dos distribucionesnormales con varianza poblacionales 2
1 y 22 conocidas
Estadística Teórica: Contrastes 66
2 21 2
1 1 2 /21 2
I ( ) (x y) zn n
con lo cual, 0,95 1 2I ( ) 2,28 1,96 x 1,7 1,05 , 5,61
Como el intervalo cubre el cero no existe diferencia significativa entre el tiempoempleado por los dos conductores en el trayecto Madrid-Segovia.
2. La hipótesis nula planteada es 0 1 2H : 2 0 . Adviértase que se trata de uncontraste unilateral con cola a la izquierda 1 1 2(H : 2 0)
La regla de decisión que proporciona el test de razón de verosimilitud:
Regla de decisión: 0
0
x y 2 k se acepta H (R.A.)x y 2 k se rechaza H (R.C.)
La región de aceptación se encuentraen el intervalo ( z , )
Se acepta la hipótesis nula cuando p 2 2
1 2
1 2
x y kz z
n n
O bien, Región de aceptación: 2 21 2
1 2
R.A (x y k) zn n
En este caso, p 2 2
62,30 60,02 2z 0,164 1,6459 850 50
2 29 8R.A (62,30 60,02 2) 1,645 0,28 2,80
50 50
Se acepta la hipótesis nula formulada.
Estadística Teórica: Contrastes 67
CONTRASTE BILATERAL DE LA DIFERENCIA DE PROPORCIONES.
28.- Muebles Quintana realiza un estudio sobre la satisfacción de sus empleados endistintas secciones. En una muestra aleatoria simple de 100 trabajadores de barnizado60 se encuentran satisfechos y de otra de 200 trabajadores de cortado semanifestaron satisfechos 125. ¿Existen diferencias en los porcentajes de trabajadoressatisfechos de ambas secciones, con un nivel de significación del 5%?
Solución:
Sean las variables aleatorias X = ‘trabajador de la sección de barnizado’ e Y =‘trabajador de la sección de cortado’, respectivamente, las variables aleatorias toman elvalor uno si el trabajador está satisfecho, y el valor cero en caso contrario.Las dos variables aleatorias siguen una distribución de Bernouilli de parámetro pdesconocido.
Las proporciones muestrales obtenidas son: 625,0200125p̂6,0
10060p̂ yx
Se contrasta la hipótesis nula de que no existen diferencias entre las proporciones detrabajadores satisfechos en ambas secciones, es decir, yx0 pp:H ; frente a la
hipótesis alternativa de que si existen diferencias, esto es, yx1 pp:H . El contraste
debe ser bilateral o de dos colas.
La regla de decisión será:
)RA(HrechazasenokppSi)RC(HrechazasekppSi
0yx
0yx
La diferencia de las proporciones muestrales )p̂p̂( yx , teniendo en cuenta el tamaño delas muestras (TCL), bajo la hipótesis nula, podemos considerar que siguen una
distribución 06,0;0N200
375,0.625,0100
4,0.6,0,0Nn
q̂.p̂n
q̂.p̂,0N
y
yy
x
xx
Se determina el valor de k mediante el nivel de significación :
K
06,00)p̂p̂(
P0pp:H/kp̂p̂P)ciertaHHchazar(ReP yxyx0yx00
05,022
K06,0
p̂p̂PK
06,0p̂p̂
PK06,0
p̂p̂K
06,0p̂p̂
P yxyxyxyx
La región crítica es
1176,0p̂p̂1176,0p̂p̂
z96,106,0
p̂p̂
yx
yx025,0
yx
Estadística Teórica: Contrastes 68
Región de aceptación de la hipótesis nula: 1176,0p̂p̂1176,0 yx
La evidencia empírica (estadístico observado)025,0625,06,0p̂p̂ yx se encuentra en la
región de aceptación, por lo que se admite lahipótesis nula, es decir, no aparecen diferenciassignificativas en los porcentajes de trabajadoressatisfechos en las secciones de Muebles Quintana, con una fiabilidad del 95%.
Análogamente, analizando la región de rechazo:
025,0625,06,0p̂p̂ yx 96,1z 025,0
1176,0200
375,0.625,0100
4,0.6,0.96,1
y
yy
x
xx2yx n
q̂.p̂n
q̂.p̂zp̂p̂R
1176,0025,0 , por lo que no se cumple la región de rechazo, aceptándose la hipótesisnula con un nivel de significación del 5%.
Estadística Teórica: Contrastes 69
CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS CON MEDIAS POBLACIONALESDESCONOCIDAS.
29.- Una empresa productora de cemento ensaya productos químicos para mejorar laresistencia de las piezas de hormigón. Para ello, desea contrastar con un nivel designificación del 5% la resistencia de dos muestras aleatorias simples, la muestra A noes tratada con productos químicos mientras que la muestra B se encuentra tratada.En la tabla adjunta se muestra la resistencia de las piezas ensayadas en kg/cm2:
Muestra A 350 370 340 355 365 347Muestra B 348 363 372 360 359 365 361
Suponiendo que las dos muestras siguen una distribución normal, indicar si eltratamiento con productos químicos consiguió una mejora en la resistencia de las piezasde hormigón.
Solución:
Sea la variable aleatoria X que representa la resistencia de las piezas de hormigón sintratar con productos químicos, suponemos que X es una variable aleatoria normal demedia poblacional 1 desconocida y desviación típica poblacional 1 tambiéndesconocida. Análogamente, la variable aleatoria Y representa la resistencia de laspiezas de hormigón tratadas con media poblacional 2 y desviación típica poblacional
2 , ambas desconocidas.
Deseamos contrastar la hipótesis nula de que las resistencias esperadas son iguales,210 :H , frente a la hipótesis alternativa de que las resistencias esperadas de las
piezas sin tratar es menor que las tratadas, es decir, 211 :H .
Como se trata de muestras pequeñas necesitamos comprobar estadísticamente si lasvarianzas poblacionales 2
1 y 22 son iguales, planteando primero el siguiente contraste:
CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS POBLACIONALES CON MEDIASPOBLACIONALES DESCONOCIDAS:
22
211
22
210 :H:H
Región de rechazo de la hipótesis nula:
)12n(),11n(;2)12n(),11n(;2122
21 F;F
ss
R
análogamente, región de aceptación: )12n(),11n(;222
21
)12n(),11n(;21 Fss
F
ó el equivalente,
Estadística Teórica: Contrastes 70
región aceptación 0H : )12n(),11n(;2m
1j
2j
n
1i
2i
)12n(),11n(;21 F)yy()1n(
)xx()1m(F
En nuestro caso, con los datos muestrales:
1432,0
99,5F98,61
F1F
43,2ssF
476,526
)yy(s14,361y7n
5,1275
)xx(s5,354x6n
6,5;025,0
5,6;025,06,5;975,0
22
216,5
7
1j
2j
222
6
1i
2i
211
Se observa que el estadístico experimentalde contraste 43,2F 6,5 se encuentra en la
región de aceptación de la hipótesis nula,6,5;025,06,5;975,0 F99,543,21432,0F ,
con lo que concluimos que, con un nivel designificación del 5%, no hay evidencias deque la resistencia de las piezas tratadas conproductos químicos presente una varianza distinta de aquellas piezas que no fuerontratadas.
CONTRASTE UNILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZASPOBLACIONALES DESCONOCIDAS PERO IGUALES:
Planteamos la hipótesis nula 210 :H frente a la hipótesis alternativa 211 :H
Región de rechazo de la hipótesis nula:
21
p)22n1n(; n1
n1st)yx(R ,
o lo que es igual, se acepta 0H si
teóricooestadístic
)22n1n(;
contrasteoestadístic
21p
tn1
n1s
)yx(t
muestralianzavarcuasi
21
222
2112
p 2nns)1n(s)1n(
s
En nuestro caso,
Estadística Teórica: Contrastes 71
796,1tt
2832,1
71
6158,86
14,3615,354t
58,8611
476,52.65,127.5s
476,52s14,361y7n
5,127s5,354x6n
11;05,0)22n1n(;2p
222
211
El estadístico empírico (contraste) es menor que el estadístico teórico,11;05,0t796,12832,1t , con un nivel de significación del 5% se acepta la
hipótesis nula, concluyendo que no se aprecia en la primera muestra una resistenciamedia significativa menor que en la segunda muestra tratada. Esto es, el tratamientoquímico no presenta mayor resistencia en las piezas de hormigón.
Estadística Teórica: Contrastes 72
CONTRASTE BILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZASPOBLACIONALES DESCONOCIDAS.
30.- Un instituto de alimentación animal quiere comparar estadísticamente dos tiposde dietas. Selecciona al azar una muestra de quince animales de una población deanimales comparables. A nueve de ellos se les suministra la dieta primera y a los seisrestantes la dieta segunda. Los resultados del aumento de peso en kg en una semana sonlos siguientes:
Dieta primera 3,75 4,2 4,6 3,95 4,1 3,9 4,3 3,9 4Dieta segunda 3,6 4,5 4,4 3,2 4 3
Con un nivel de significación del 10%, ¿puede afirmarse que la dieta primera es mejorque la segunda?
Solución:
Suponiendo que la variable de respuesta (X, Y) para cada una de las dietas (aumentosemanal de peso en kg) es una variable que, respectivamente, se distribuye normal
),(N 11 y ),(N 22 , donde 1 y 2 son desconocidas, al tratarse de muestraspequeñas antes de realizar el contraste para la igualdad de medias poblacionalesnecesitamos comprobar estadísticamente si las varianzas poblacionales desconocidas
21 y 2
2 son iguales o distintas.Por ello, primeramente se plantea:
CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS POBLACIONALES CON MEDIASPOBLACIONALES DESCONOCIDAS:
22
211
22
210 :H:H
Región Rechazo de Hipótesis nula:
)1n(),1n(;2)1n(),1n(;2122
21
2121F;F
s
sR
Análogamente, la Región de Aceptación: )1n(),1n(;2)1n(),1n(;21 2122
21
21F
ss
F
Para hallar el estadístico de contraste, según los datos muestrales:
2711,0
8183,4F6875,31
F1F
1735,0ssF
386,05
)yy(s78,3y6n
067,08
)xx(s08,4x9n
5,8;05,0
8,5;05,05,8;95,0
22
215,8
6
1j
2j
222
9
1i
2i
211
Región de rechazo: 8183,4;2711,01735,0R
Estadística Teórica: Contrastes 73
Se observa que el estadístico experimentalde contraste 1735,0F 5,8 verifica laregión de rechazo de la hipótesis nula, conlo que concluimos que, con un nivel designificación del 10%, hay evidencias deque las varianzas poblacionales sondesconocidas y distintas.
CONTRASTE UNILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZASPOBLACIONALES DESCONOCIDAS Y DISTINTAS:
Basándonos en la comprobación estadística que hemos realizado, planteamos la hipótesisnula 210 :H frente a la hipótesis alternativa 211 :H
Región de rechazo de la hipótesis nula:
2
22
1
21
f; ns
ns
t)yx(R , o lo que es
igual, se acepta 0H si
teórico
oestadístic
f;
contrasteoestadístic
2
22
1
21
t
ns
ns
)yx(t
Welchdeónaproximaci
2
22
22
1
21
21
2
2
22
1
21
2
1n)n/s(
1n)n/s(
ns
ns
f
En nuestro caso,
386,0s78,3y6n
067,0s08,4x9n
222
211
266,06386,0
9067,0
ns
ns
128,1
6386,0
9067,0
)78,308,4(t2
22
1
21
886,1tt2125,22
7)6/386,0(
10)9/067,0(
9386,0
9067,0
f 2;01,0f;22
2
En consecuencia, la región de rechazo de la hipótesis nula no se verifica:
Estadística Teórica: Contrastes 74
5,03,0266,0.886,13,0ns
ns
t)yx(R2
22
1
21
f;
Análogamente, el estadístico empírico (contraste) es menor que el estadístico teórico,2;10,0t886,1128,1t , por tanto, con un nivel de significación del 10%, se acepta
la hipótesis nula, concluyendo que no existe evidencia estadística de que la primeradieta sea mejor que la segunda.
Estadística Teórica: Contrastes 75
31.- Una empresa que se dedica a fabricar zapatillas de deporte dispone de dosproveedores de suelas de goma. Para analizar el desgaste de las suelas se ha tomadouna muestra al azar de cada proveedor, obteniéndose los siguientes resultados:
Proveedor Tamaño muestral Desgaste medio Cuasivarianza desgaste1 n = 10 6,0x 068,0s2
x
2 m = 14 62,0y 054,0s2y
Suponiendo que el desgaste de las suelas sigue una distribución normal, ¿se puede decir,para un nivel de confianza del 95%, que ambos proveedores proporcionan un productode semejante resistencia media al desgaste?.
Solución:
Se tiene que realizar un contraste bilateral de igualdad de medias:
211
210
:H:H
con varianzas poblacionales desconocidas, con muestras pequeñas 30mn
Dependiendo de que se suponga que las varianzas son iguales o no el contraste variará.Por ello, es necesario realizar primero un contraste relativo a la igualdad de varianzas.
CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS POBLACIONALES CON MEDIASPOBLACIONALES DESCONOCIDAS:
22
211
22
210 :H:H
Como la hipótesis alternativa es 22
21 en la decisión que se elija deberán ser válidos
valores de 22
21 ó 2
221 , por lo cual el contraste debe ser bilateral o de dos colas.
Una distribución F de Fisher-Snedecor,con dos variables 2
n y 2m , independientes
entre si, es una variable mn
F 2m
2n
m,n
.
Estadístico de contraste: )1m(,)1n(22
21 F
ss
La regla de decisión será: kF0 13,9
El valor crítico de k se determina mediante el nivel de significación 05,0 :
05,0FkPkFP 13,92113,933
3
)Fk()kF0(PH/kF0)ciertaH/HchazarRe(P
1,9211,9
01,900
Estadística Teórica: Contrastes 76
213,9213,9213,9
213,913,913,92
113,913,9113,9113,9
kFPkFP11kFP1
kFPFPFkP
kFP0FPkFPkF0P
se tiene:
31,3Fk025,0FkP
2611,083,31
F1Fk025,0kFP
13,9;025,0213,92
9,13;025,013,9;025,011113,9
La región crítica es:
)31,3F()2611,0F0( 13,913,9
Se observa que el estadístico muestral 259,1054,0068,0
ss
F 22
21
13,9 no se encuentra en
la región de rechazo. En consecuencia, con un nivel de confianza del 95%, se acepta quelas varianzas son desconocidas pero iguales.
Otra forma rápida de contrastar la hipótesis es haber utilizado la Región deRechazo de la Hipótesis nula:
)1m(),1n(;2)1m(),1n(;2122
21 F;F
ss
R
)F31,3;F2611,0(259,1R 13,9;025,013,9;975,0
CONTRASTE BILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZASPOBLACIONALES DESCONOCIDAS PERO IGUALES:
La hipótesis nula 210 :H frente a la hipótesis alternativa 211 :H
Como la hipótesis alternativa es 21 en la decisión que tengamos que tomar debenser válidos valores mayores o menores que 2 , con lo que el contraste debe serbilateral o de dos colas.
Estadística Teórica: Contrastes 77
La regla de decisión será:
)RA(HrechazasekyxSi)RA(HaceptasekyxSi
0
0
En el muestreo de las dos poblaciones normales con varianzas desconocidas pero iguales,
las variables X e Y, respectivamente: 1101
1 tns
x
e 114
2
2 tms
y
Bajo la hipótesis nula )( 21 : )ms
ns
;0(t)yx(2p
2p
139 , donde:
0597,021410
)054,0()114()068,0()110(s
2mn
22s
1m21s
1n
2p
(cuasivarianza muestral ponderada)
es decir, )101,0;0(t)140597,0
100597,0;0(t)yx( 22139
El valor crítico k, bajo la hipótesis nula, )101,0;0(t)yx( 22 , se calcula a partir delnivel de significación :
)ciertaHkyx(P)ciertaHHchazar(ReP 000
05,0101,0k
101,0yxP
La región crítica: 209,0yxt074,2101,0
yx22;025,0
La región de rechazo de la hipótesis nula es: 209,0yxR . La evidenciaempírica muestra que 02,062,06,0yx , valor que no se encuentra en laregión de rechazo, por lo que se acepta la hipótesis nula.Así pues, no existe diferencia entre las resistencias medias al desgaste de losproductos proporcionados por los dos proveedores, con una confianza del 95%.
Otra forma rápida de contrastar la hipótesis es haber utilizado la Región deRechazo de la Hipótesis nula:
m1
n1styxR p)2mn(;2
2443,00597,0s p , 074,2t 22;025,0
141
101)2443,0()074,2(62,06,0R 209,002,0R
Estadística Teórica: Contrastes 78
La evidencia muestra que no se verifica la región de rechazo, por lo que se acepta lahipótesis nula, con un nivel de confianza del 95%. Esto es, no existe diferencia entrelas resistencias medias al desgaste de los productos proporcionados por los dosproveedores.
Estadística Teórica: Contrastes 79
32.- En un informa presentado por un reportero a una revista feminista se afirma queel número medio de horas semanales de conexión a Internet es el mismo para hombresque para mujeres. Sin embargo no parece prudente publicar estos datos sincontrastarlos estadísticamente. Se selecciona para ello una muestra de 75 hombres y50 mujeres. Los resultados muestrales se recogen en la siguiente tabla:
Hombres MujeresTamaño muestral 75 50Número medio de horas/semana 7,42 5,34Dispersión en la conexión 9,08 7,24
a) Formular el contraste a realizar y señalar los supuestos que se deben realizar pararesolver el ejercicio.
b) Determinar la región crítica del contraste.c) Calcular el estadístico del contraste.d) ¿Existe evidencia para rechazar la hipótesis nula a un nivel de significación del 5%?
Solución:
a) Sean las variables aleatorias, respectivamente, X = 'Tiempo conexión a Internet delos hombres' e Y = 'Tiempo conexión a Internet de las mujeres', donde 1 1X N( , )
e 2 2Y N( , ) .
En las muestras se obtuvieron los resultados:
1 1
2 2
x 7,42 s 9,08 n 75y 5,34 s 7,24 n 50
Si la dispersión muestral se refiriese a la desviación típica, habría que considerar larelación 2 2n (n 1)s . En este caso, se tendría 1s 9,14 y 2s 7,31
Se establecen las hipótesis: 1 2 1 20 1H : 0 H : 0
Como la hipótesis alternativa es 1 2 0 en la decisión que se elija deberán serválidos valores de 1 2 o 1 2 , por lo cual el contraste debe ser bilateral o de doscolas.
Regla de decisión: 0
0
x y k se acepta H (R.A.)
x y k se rechaza H (R.C.)
Es decir, la región de aceptación: 1 2k x y k
Supuestos: Varianzas poblacionales desconocidas con muestras grandesIndependencia de la selección muestral
Estadística Teórica: Contrastes 80
b) En el muestreo de las dos poblaciones normales con varianzas desconocidas, conmuestras grandes 1 2(n n 30) .
Las variables X e Y, respectivamente, siguen distribuciones: 11
1
sN ,
n
, 22
2
sN ,
n
,
con lo que la diferencia de medias muestrales
2 21 2
1 21 2
s s(x y) N ( ),
n n
La diferencia de medias muestrales, bajo la hipótesis nula 0 1 2H : 0 , sedistribuye:
2 2(9,08) (7,24)(x y) N 0, N(0 ; 1,465)75 50
El valor crítico k se determina medianteel nivel de significación
/2 0,025z 1,960,05 z
0 0 0 1 2P(Rechazar H H cierta) P x y k/H : 0
1 2 1 2P (x y) k (x y) k P (x y) k (x y) k
1 2k kx y x y P1,465 1,465 1,465 1,465
1 2k kP z P z 0,05
1,465 1,465 2 2por simetría N(0,1)
1 11
k kP z 0,025 1,96 k 2,87
1,465 1,465
2 22
k kP z 0,025 1,96 k 2,87
1,465 1,465
La evidencia muestral x y 7, 42 5,34 2, 08
Estadística Teórica: Contrastes 81
Siendo 2,87 2,08 2,87 se acepta la hipótesis nula de igualdad de medias, esdecir, con un nivel de significación del 5%, el número medio de horas conectados ainternet es el mismo para hombres que para mujeres.
Se podía haber decidido con otros métodos:
Se formulan las hipótesis: 0 11 2 1 2H : 0 H : 0
Se trata de un contraste bilateral o de doscolas, con 0,05
La región de aceptación se encuentraen el intervalo /2 /2( z , z )
Se acepta la hipótesis nula cuando,
p p/2 /2 /22 21 2
1 2
x y 2,08z z z 1,42 1,961,465s s
n n
Se acepta que el número medio de hombres y mujeres conectados a internet es elmismo.
El intervalo de confianza para la diferencia de medias de dos distribucionesnormales con varianza poblacionales 2
1 y 22 desconocidas, con muestras grandes
1 2(n n 30)
2 21 2
1 1 2 /21 2
s sI ( ) (x y) z
n n
con lo cual, 0,95 1 2I ( ) 2,08 1,96 x 1,465 0,79 , 4,95
Como el intervalo cubre el cero no existe diferencia significativa entre el número mediode horas conectados a internet es el mismo para hombres que para mujeres.
Estadística Teórica: Contrastes 82
33.- En dos poblaciones ),2(N 1 y ),3(N 2 , con un nivel de significación del 10%, se
quiere contrastar la hipótesis de igualdad de varianzas, habiendo tomado,respectivamente, dos muestras independientes, con los datos que se reflejan en la tablaadjunta:
ix 2 7 5 9jy 4 10 7 8 5 9
Solución:
Las variables aleatorias X e Y siguen, respectivamente, distribuciones ),2(N 1 e
),3(N 2 .
En el contraste bilateral se establecen las hipótesis:
22
21
22
21
:H:H
1
0
Sabemos que la variable 2n2
n
1i
2i )x(
por ser la suma de n variables aleatorias
)1,0(N , independientes entre sí. Por otro lado, la variable mn
F 2m
2n
m,n
se distribuye
como una F de Fisher-Snedecor con n y m grados de libertad.
Bajo la hipótesis nula 222
21 , las variables 2
421
4
1i
2i )2x(
e 2
622
6
1j
2j )3y(
, y
la variable
6
1j
2j
4
1i
2i
2
6
1j
2j
2
4
1i
2i
26
24
6,4)3y(
)2x(
46
6
)3y(
4
)2x(
64
F
Como la hipótesis alternativa es 22
21 en la
decisión que se elija deberán ser válidos valoresde 2
221 ó 2
221 , por lo cual el contraste
debe ser bilateral o de dos colas.
La regla de decisión será: kF0 6,4
El valor de k se determina mediante el nivel de significación 10,0 :
Estadística Teórica: Contrastes 83
100,)Fk()kF0(PH/kF0)ciertaH/HchazarRe(P 6,4216,406,400
100,FkPkFP 6,4216,4
26,426,426,426,46,46,42
16,46,416,416,4
kFPkFP11kFP1kFPFPFkP
kFP0FPkFPkF0P
se tiene:
53,4Fk05,0FkP
162,016,61
F1Fk05,0kFP
6,4;05,026,42
4,6;05,06,4;05,01116,4
La región crítica es: )53,4F()162,0F0( 6,46,4
De otra parte, para conocer el valor muestral del estadístico F, es necesario calcular:
83)2x(4
1i
2i
131)3y(6
1j
2j
95,0131.483.6
)3y(
)2x(
46F 6
1j
2j
4
1i
2i
6,4
Se observa que el estadístico muestral 95,0F 6,4 no pertenece a ninguno de los dos
intervalos, encontrándose en la región de aceptación, en consecuencia, aceptamos lahipótesis nula de igualdad de varianzas, a un nivel de significación del 10%.
Análogamente, la región de rechazo:
)12n(),11n(;2)12n(),11n(;212y
2x F;F
ss
R
En el muestreo: 66,1ss
37,51n
)yy(s92,8
1n
)xx(s 2
y
2x
y
6
1j
2ji
2y
x
4
1i
2i
2x
4095,5FF11,00135,91
F1FF 5,3;05,0)12n(),11n(;2/
3,5;05,05,3;95,0)12n(),11n(;2/1
El estadístico muestral 4095,5;11,066,1)s/s( 2y
2x , por lo que aceptamos la
hipótesis nula de igualdad de varianzas, con un nivel de significación del 10%.
Estadística Teórica: Contrastes 84
CONTRASTE DE HIPÓTESIS. TEOREMA DE NEYMAN-PEARSON.
34.- Un experto cree que el número medio de errores por página que comete es dos.Por otra parte, el editor defiende que el número medio es de cuatro. Para una muestraaleatoria simple de 100 páginas, con un nivel de significación del 5%, se pide:
1. Obtener la región crítica.2. Hallar la potencia del contraste.3. Si en la muestra aleatoria de 100 páginas se encontraron 250 errores, ¿qué
hipótesis se acepta?Nota.- Se supone que el número de errores por página sigue una distribución de Poisson.
Solución:
1) La variable aleatoria X = ’número de errores por página’ sigue una distribución dePoisson de parámetro (número medio de errores por página).
Sobre el parámetro se establecen las hipótesis nula y alternativa:
4:H2:H
1
0
La función de verosimilitud para una muestra aleatoria simple de tamaño n:
n
n
1ii
n
1iix
n
nx
2
2x
1
1x
n21 e!x
e!x
e!x
e!x
),x,,x,x(L
Para obtener la mejor región crítica se aplica el teorema de Neyman-Pearson:
0021
100
1iix
1002
100
1iix
400n
1ii
002n
1ii
n21
n21
ek
21ke
21
e!x
x4
e!x
x2
)4,x,,x,x(L)2,x,,x,x(L
100
1ii
100
1ii
0021100
1ii002
1100
1ii002
1
100
1iix
ek
ln2lnxek
ln21lnx
ek
21
k
2lnekln
x002
1100
1ii
. La mejor región crítica es de la forma kx
100
1ii
El valor de k se obtiene considerando que el nivel de significación es del 5%, y teniendoen cuenta que
100
1iix , bajo la hipótesis nula, sigue una distribución de Poisson de
Estadística Teórica: Contrastes 85
parámetro 2002.100 , es decir, )200(Px100
1ii
. Por otra parte,
100
1iix se puede
aproximar mediante la distribución normal )200,200(N . En consecuencia:
3,223k645,1200200k05,0
200200k
200
200xPkxP
100
1ii100
1ii
La mejor región crítica es 3,223x100
1ii
. En otras palabras, si la suma de observaciones
muestrales es mayor que 223,3 se rechaza la hipótesis nula.
2) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000
Considerando, de una parte, que bajo la hipótesis alternativa 4:H1 , el
100
1iix sigue
una distribución de Poisson de parámetro 4004.100 , es decir, )400(Px100
1ii
.
Teniendo en cuenta su aproximación a la distribución normal )400,400(N , resulta:
185,8zP400
400223400
400xP223xP
100
1ii100
1iiP
La potencia del contraste es prácticamente la unidad.
3) En la muestra aleatoria simple de 100 páginas se encontraron 250 errores, como laregión crítica es 3,223x
100
1ii
, con un nivel de significación del 5% se rechaza la
hipótesis nula del experto que aseguraba que el número medio de errores por página erade dos.
Estadística Teórica: Contrastes 86
35.- En una distribución de Poisson se establece sobre el parámetro la hipótesis nula,1,0:H0 , y la alternativa, 4,0:H1 . En muestras aleatorias simples de tamaño
100, siendo el nivel de significación 0,1, se desea conocer:a) La mejor región crítica.b) La potencia del contraste.
Solución.-
a) Una variable aleatoria X sigue una distribución de Poisson de parámetro cuando:
e
!k)kX(P
k
Aplicando el lema de Neyman-Pearson, el cociente de las funciones de verosimilitud:
4,0
100
100x4,0
2
2x4,0
1
1x
1,0
100
100x1,0
2
2x1,0
1
1x
10021
10021
e!x
4,0e!x
4,0e!x
4,0
e!x
1,0e!x
1,0e!x
1,0
)4,0;x,,x,x(L)1,0;x,,x,x(L
130
100
1iix
30
100
1iix
30
100
1iix
40
100
1iix
10
100
1iix
ke.4e.1,04,0e.
4,01,0
e4,0
e1,0
de donde,
)k.e(ln4lnk.e4ke.4 130
100
1iix
130
100
1iix
130
100
1iix
kx4ln
)k.e(lnx
100
1ii
130100
1ii
. La mejor región crítica es kx
100
1ii
- Bajo la hipótesis nula,
100
1iix es una variable aleatoria, suma de cien variables
aleatorias independientes, que sigue una distribución de Poisson de parámetro)10(P)1,0.100(P .
Por otra parte, como el tamaño muestral es lo suficientemente grande se puede utilizar
la aproximación normal (teorema central del límite): )10,10(Nx100
1ii
El valor crítico k se determina mediante el nivel de significación 1,0
Estadística Teórica: Contrastes 87
05,14k2817,11010k1,0
1010k
10
10xPH/kxP
100
1ii
0
100
1ii
Como los valores que toma una variable de Poisson son enteros, la mejor región crítica
es 15x100
1ii
. Es decir, cuando la suma de los valores muestrales sea mayor que 15,
rechazaremos la hipótesis nula.
b) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000
Considerando, de una parte, que bajo la hipótesis alternativa 4,0:H1 , el
100
1iix sigue
una distribución de Poisson de parámetro 404,0.100 : )40(Px100
1ii
Teniendo en cuenta su aproximación a la distribución normal )40,40(N , resulta:
99996,095,3zP40
401540
40xPciertaH/15xPo
100
1ii
1
100
1iiP
La potencia del contraste es prácticamente la unidad.
Estadística Teórica: Contrastes 88
36.- Las patatas cultivadas en la parcela A siguen una distribución )144,(N 1 ;
mientras que las cultivadas en la parcela B siguen una distribución )225,(N 2 . Unagricultor quiere contrastar que el peso medio de las patatas cultivadas en ambasparcelas es el mismo, 0:H 210 , frente a la hipótesis alternativa de que el peso
medio de las patatas cultivadas en la parcela A es de 80 gramos mayor que el de lascultivadas en la parcela B, 80:H 211 . Para ello, selecciona una muestra aleatoria
de 100 patatas de la primera parcela con un peso medio de 400 gramos; y otra de 81patatas de la segunda parcela con un peso medio de 324 gramos. Se pide:
1. Hallar la mejor región crítica.2. Calcular la potencia del contraste.3. ¿Se acepta la hipótesis de que las patatas cultivadas en ambas parcelas tienen el
mismo peso medio?
Solución:
Sean la variable aleatoria X = ’peso medio de las patatas en la parcela A’, que sigue unadistribución )144,(N 1 . Análogamente, sea la variable aleatoria Y = ’peso medio de las
patatas en la parcela B’, con una distribución )225,(N 2 . Sean, respectivamente, x ey , las dos medias muestrales de las dos muestras aleatorias simples de patatascorrespondientes a las dos parcelas.
x se distribuye según una
1
11 n,N , es decir, )4,14;(N
100144,N 11
y se distribuye según una
2
22 n,N , es decir, )25;(N
81225,N 22
La diferencia de las medias muestrales )yx( se distribuye según una normal:
85,28;N)yx(254,14;N)yx( 2122
21
Para hallar la mejor región crítica se aplica el teorema de Neyman-Pearson:
280)yx(2)yx(285,28.21
285,28.2
280)yx(
285,28.2
20)yx(22)x(
21
e2
1)x(f
21
21 e
e285,281
e285,281)80,x(L)0,x(L
1
)6400)yx(160(285,28.21
ke
Estadística Teórica: Contrastes 89
k)yx(6400kln64,1664)yx(160
kln)6400)yx(160(85,28.2
1ke
1
121
)6400)yx(160(285,28.21
Para hallar el valor de k se considera que el nivel de significación es 0,05, severifica la hipótesis nula 0:H 210 , y por tanto )85,28;0(N)yx( , entonces:
05,00:H/k)yx(P 210
46,47k645,185,28
k05,085,28
kzP85,28
k85,28
)yx(P
Si la diferencia entre las medias de las dos muestras es superior a 47,46 gramos serechaza la hipótesis nula de igualdad de medias poblacionales.
2) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000
Si se verifica la hipótesis alternativa 80:H 211 , se tiene )85,28;80(N)yx(
Con lo cual,
8708,013,1zP85,28
8046,4785,28
80)yx(PoP
2) La diferencia entre el peso medio de las muestras tomadas en ambas parcelas es:
gramos76324400
Como la diferencia es mayor que 47,46 gramos, se rechaza la hipótesis nula de queambas parcelas producen patatas con igual peso medio.
Estadística Teórica: Contrastes 90
37.- El gasto diario, en miles de euros, en electricidad de una empresa es una variablealeatoria con distribución ).1;(N Se desea contrastar con un nivel de significación del5%, la hipótesis nula de que el gasto medio diario es de 30 euros frente a la hipótesisalternativa de que dicho gasto es menor que la citada cifra.Para ello se toma una muestra aleatoria simple de diez días en los que el gasto enelectricidad en euros fue:
29,50 29,30 30,50 31,50 29,10 29,90 30,10 31 31,50 30
Se pide:
1. ¿Cuál es la hipótesis aceptada?2. ¿Cuál habría sido la probabilidad de aceptar que el gasto diario medio es de 30
euros, si el gasto medio diario fuese un 2% superior a la cifra supuesta en lahipótesis nula?
Solución:
1) La variable aleatoria X = ‘gasto diario en facturas de electricidad’ ).1;(NX
La hipótesis nula 30:H0 frente a la hipótesis alternativa 30:H1
Para una muestra aleatoria simple de tamaño n, de una población ),1;(N la función deverosimilitud es:
n
1i
2)ix(21n
2)nx(212)2x(
212)1x(
21
n21 e21e
21e
21e
21),x,,x,x(L
Para obtener la región crítica, aplicando el teorema de Neyman-Pearson:
1
ixn
1i)62()29(n
21
ixn
1i22n2
ixn
1iix
n
1i6n92
ixn
1i21
n
1i
n
1i
2)ix(212)3ix(
21
n
1i
2)ix(21n
n
1i
2)3ix(21n
n21
n21
kee
e
e21
e21
)3,x,,x,x(L)3,x,,x,x(L
1i
n
1i
21
ixn
1i)62()29(n
21
klnx)62()9(n21ke
)9(nkln2x)62(klnx)62()9(n21 2
1i
n
1i1i
n
1i
2
Estadística Teórica: Contrastes 91
)62()9(nkln2
x2
1i
n
1i
dividiendo por n, resulta k
n
xx
i
n
1i
con lo que la forma de la región crítica es kx .
Siendo el nivel de significación del 5%: 05,030:HkxP 0
Si la hipótesis nula es cierta, considerando que la muestra es de tamaño 10, la media
muestral se distribuye según una normal
101,30Nx , por tanto,
05,010130kzP
10130k
10130xP30:HkxP 0
observando las tablas de la )1,0(N se tiene que 48,29K645,110130k
La región crítica es: 48,29x
Por otra parte, la media muestral es: 24,3010
xx
10
1ii
Siendo 48,2942,30x se acepta la hipótesis nula, siendo el gasto medio diario enelectricidad de 30 euros, con una fiabilidad del 95%.
2) Si el gasto medio diario fuera un 2% superior a 30 euros, sería de 30,6 euros, esdecir .6,30 En este caso, la media muestral se distribuye según una normal
101;6,30Nx , por tanto, la probabilidad pedida sería:
9998,054,3zP101
6,3048,29101
6,30xP6,30siendoHAceptarP 0
Estadística Teórica: Contrastes 92
38.- Las especificaciones de un tipo de báscula aseguran que los errores en laspesadas siguen una distribución normal con esperanza nula y varianza unidad. Se deseacontrastar la afirmación sobre la varianza frente a la hipótesis alternativa de que lavarianza es 4. En este sentido, se realizan cinco pesadas en las que el error cometidoresultó ser
1 0,9 - 0,2 1,4 - 0,7
Para un nivel de significación del 5%, se pide:1. Obtener la mejor región crítica.2. Obtener la potencia del contraste.3. Indicar qué hipótesis resultada aceptada.
Solución:
1) Sea la variable aleatoria X = ‘error cometido en la báscula’ ).;0(NX
Se tiene la hipótesis nula 1:H 20 frente a la hipótesis alternativa 4:H 2
1
La función de verosimilitud para una muestra aleatoria simple de tamaño 5 es:
5
1i
2ix22
1525x22
121x22
12
521 e2
1e2
1e2
1),x,,x,x(L
La región crítica óptima se obtiene aplicando el teorema de Neyman-Pearson:
1
5
1i
2ix
83
5
5
1i
2ix
815
1i
2ix
21
55
1i
2ix
4.215
5
1i
2ix
215
2521
2521 ke2e2
e22
1
e21
)4,x,,x,x(L)1,x,,x,x(L
)32k(lnx8332keke2 1
5
1i
2i1
5
1i
2ix
83
1
5
1i
2ix
83
5
kx83
)32k(lnx
83)32k(ln
x5
1i
2i
15
1i
2i
15
1i
2i
La forma de la mejor región crítica es kx5
1i
2i
El valor de k se obtiene apoyándonos en que el nivel de significación es del 5%:
Estadística Teórica: Contrastes 93
05,01:HkxP 20
5
1i
2i
Si la hipótesis nula es cierta, la variable aleatoria se distribuye según una normal)1;0(N , siendo
5
1i
2ix una variable aleatoria suma de cinco variables aleatorias
independientes y con distribución )1;0(N . En consecuencia,
5
1i
2ix se distribuye como
una 25 (chi-cuadrado con cinco grados de libertad).
En este sentido, observando en las tablas: 07,11K05,0kxP5
1i
2i
La región crítica es: 07,11x5
1i
2i
En otras palabras, se aceptará la hipótesis nula cuando la suma de los cuadrados de lasobservaciones muestrales sea menor que 11,07
2) La potencia del contraste es la probabilidad de rechazar la hipótesis nula cuando escierta la hipótesis alternativa, esto es:
4:H07,11xPPotencia 2
1
5
1i
2i
Observemos que si la hipótesis alternativa es cierta, la variable aleatoria X sedistribuye según una normal )2;0(N , con lo que dividiendo cada ix por la desviación
típica 2 , se tiene que
5
1i
2i )2x( se distribuye según una 2
5 , en consecuencia:
75,07675,2)2x(P4:H07,11xPPotencia 25
1ii
21
5
1i
2i
3) El contraste se realiza hallando el
5
1i
2ix de la muestra aleatoria simple, siendo:
07,113,4)7,0(4,1)2,0(9,01x 222225
1i
2i
por lo que se acepta la hipótesis nula.
Estadística Teórica: Contrastes 94
39.- El precio de los productos vendidos por una empresa es una variable aleatoriacon función de densidad 1x)x(f , donde 0,1x0 , que depende delparámetro desconocido . Se quiere contrastar sobre el valor de dicho parámetro lahipótesis nula 1:H0 frente a la alternativa 2:H1 . Para ello, se toma una muestra
aleatoria simple de tamaño dos.Determinar el nivel de significación y la potencia del contraste, si se toma como regióncrítica 6,0xx 21
Solución:
El nivel de significación es la probabilidad de rechazar lahipótesis nula siendo cierta: )ciertaHHchazar(ReP 00 .
En la región crítica 6,0xx 21 , para 1 se tiene: 1)x(f ,
con lo cual:
2
11
6,01
16,02
02
12
6,01
01
12
02
1021 111:6,0 dxdxdxdxHxxP
x
x
xx
x
x
x
x
x
906,0)51,00(6,06,0)6,0ln1(ln6,06,0)ln()(
)6,0(1)()(
16,01
6,001
1
1
6,0
1
6,0
0
11
1
6,0
16,0021
6,0
0
102
xx
dxxdxdxxdxxx
La probabilidad de rechazar la hipótesis nula siendo cierta es alta, lo que indica que elcontraste es malo.
)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000 .
En la región crítica 6,0xx 21 , para 2 se tiene x2)x(f , la potencia será:
2
11
6,01
16,02
02
1212
6,01
01
12
02
121021 22222:6,0 dxdxxxdxdxxxHxxPPot
x
x
xx
x
x
x
x
x
7272,0)51,00(72,036,0)6,0ln1(ln72,036,0)xln(72,0)x(
dx)x/36,0(2dxx2dx)2x(x4dx)2x(x4
16,01
6,00
21
1
1
6,011
6,0
011
1x/6,00
22
1
6,011
10
22
6,0
01
La potencia del contraste no resulta excesivamente alta, el contraste no es bueno.
Estadística Teórica: Contrastes 95
40.- El volumen diario de ventas de una empresa, en cien mil euros, es una variablealeatoria X sobre cuya función de densidad se establece la hipótesis nula
2x0,2x)x(f:H0 , frente a la hipótesis alternativa .2x0,21)x(f:H1
Para realizar el contraste se toma una muestra aleatoria simple de dos días en los quelos volúmenes de venta fueron de 50.000 euros y 100.000 euros. Con un nivel designificación del 5 por ciento, se pide:
1. Hallar la mejor región crítica.2. Calcular la potencia del contraste.3. Qué hipótesis se acepta.
Solución:
1) Para una muestra aleatoria simple de tamaño dos, lamejor región crítica aplicando el teorema de Neyman-Pearson, el cociente de las funciones de verosimilitud es:
kx.x21.21
x.x)21)x(f,x,x(L)2x)x(f,x,x(L
2121
21
21
Si la hipótesis nula es cierta )2x)x(f , con un nivel designificación del 5%, se tiene:
2
21x
2k1x
1xk2x
02x1
212
2k1x
01x
22x
02x1
21021 dxdx
4xx
dxdx4xx
2x)x(f:HkxxP05,0
3733,0kdondede40,0kln8633,1k05,0kln8633,18k
kln8633,18kkln2ln2
21
8k)2k(ln2ln
8k
16k)xln(
8k)x(
41
dxx8
kdx2x
dx)2/x(4x
dx)2/x(4x
22
22222
2k1
22k
021
2
2k1
1
22k
01
121x
2k1x1
1xk0
22
12k1x
01x1
20
22
1
La regla de decisión es 3733,0x.x 21 .
Es decir, se rechaza la hipótesis nula si durante los días el producto de los dosvolúmenes de ventas de la muestra es inferior a 37.330 euros.
2) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000 .
En la región crítica 3733,0xx 21 , con la función de densidad 21)x(f , la potencia:
Estadística Teórica: Contrastes 96
2
21x
2/3733,01x
1x3733,0
012
2/3733,01x
01x
2
01121 dxdx
41dxdx
4121)x(f:H3733,0xxPP
3146,0)2/3733,0(ln2ln4
3733,04
3733,0)xln(4
3733,0)x(21
dxx1
43733,0dx
21dx)x(
41dx)x(
41
22/3733,01
2/3733,001
1
2
2/3733,0 1
2/3733,0
011
1x/3733,002
2
2/3733,01
202
2/3733,0
0
3) En la muestra aleatoria simple, los volúmenes de ventas fueron de 50.000 y 100.000euros, en consecuencia 5,0x1 y 1x2 , por tanto, 5,0x.x 21
Como la región crítica es 3733,0xx 21 , se acepta la hipótesis nula.
41.- Se sabe que las peras siguen una distribución )1,(N . En una muestra de peras,con peso medio de 300 gramos, se realizó un contraste con un nivel de significación del5% y una potencia de 0,6443, en donde la hipótesis nula era de 4,0:H0 kg frente a
la hipótesis alternativa de 3,0:H1 kg. Se desea saber:
1. Cuál es el tamaño de la muestra.2. Hallar la hipótesis aceptada.
Solución:
1) En una distribución )1,(N , en una muestra de tamaño n, la función de verosimilitudvendrá dada por la expresión:
n
1i
2)ix(21n2)nx(
212)2x(
212)1x(
21
n21 e21e
21e
21e
21),x,,x,x(L
Con las hipótesis del contraste, 4,0:H0 y 3,0:H1 . La región crítica óptima se
obtiene aplicando el teorema de Neyman-Pearson:
1
n
1iix2,0n7,0
21n
1i
n
1i
n
1iix6,0n09,02
ixn
1iix8,0n16,02
ix21
n
1i
n
1i
2)3,0ix(2)4,0ix(21
n
1i
2)3,0ix(21n
n
1i
2)4,0ix(21n
n21
n21
kee
e
e21
e21
)3,0,x,,x,x(L)4,0,x,,x,x(L
tomando logaritmos neperianos, resulta,
Estadística Teórica: Contrastes 97
1
n
1ii1
n
1ii1
n
1iix2,0n7,0
21
kln2x2,0n7,0klnx2,0n7,021ke
n2,0kln2n7,0
n
x
2,0kln2n7,0
xkln2n7,0x2,0 1
n
1ii1n
1ii1
n
1ii
La forma de la mejor región crítica es: kx
Ahora bien, la hipótesis nula 4,0:H0 es cierta si )n1;4,0(Nx . Con un nivel designificación del 5%, se tiene:
645,1n1
4,0k05,0n1
4,0kzPn1
4,0kn1
4,0xP4,0:HkxP 0
n645,14,0k
De otra parte, sabemos que la potencia del contraste es 0,6443.
)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000 .
Si se verifica la hipótesis alternativa 3,0:H1 se tiene que )n1;3,0(Nx
37,0n1
3,0k6443,0n1
3,0kzPn1
3,0kn1
3,0xP3,0:HkxP 1
n37,03,0k
Resolviendo el sistema: 3184,0k
406n
n015,21,0
n37,03,0k
n645,14,0k
El tamaño de la muestra es de 406 peras.
2) La mejor región crítica será 3184,0kx , rechazándose la hipótesis nula cuandoel peso medio de la muestra de peras sea inferior a 318,4 gramos.Como en la muestra se obtuvo un peso medio de 300 gramos ( 4,318300 ), se rechazala hipótesis nula de que el peso medio de las peras es de 0,4 kg.
Estadística Teórica: Intervalos Confianza 98
Gestión Aeronáutica: Estadística TeóricaFacultad Ciencias Económicas y EmpresarialesDepartamento de Economía AplicadaProfesor: Santiago de la Fuente Fernández
INTERVALOS DE CONFIANZA
a) Intervalo de confianza para la media de una distribución normal N( , ) devarianza conocida 2
1 2I ( ) x zn
b) Intervalo de confianza para la media de una distribución normal N( , ) devarianza desconocida 2
Muestras grandes n 30 x1 2
sI ( ) x z
n
Muestras pequeñas n 30 x1 /2 , (n 1)
sI ( ) x t
n
c) Intervalo de confianza para la varianza 2 de una distribución normal
2 2
2 x x1 2 2
/2 , (n 1) 1 /2 , (n 1)
(n 1)s (n 1)sI ( ) ;
d) Intervalo de confianza para la diferencia de medias de dos distribuciones normales
Las varianzas poblaciones 21 y 2
2 son conocidas
2 21 2
1 1 2 /21 2
I ( ) (x y ) zn n
En todos los intervalos de confianza
n2
ii 12
x
(x x)
sn 1
es la cuasivarianza muestral.
Las varianzas poblaciones 21 y 2
2 son desconocidas:
- Caso en que la suma 1 2(n n ) 30 con 1 2n n
Estadística Teórica: Intervalos Confianza 99
2 21 2
1 1 2 /21 2
s sI ( ) (x y ) z
n n
- Caso en que los tamaños muestrales son pequeños 1 2(n n ) 30 y las varianzas sondesconocidas, pero iguales ( 2
2 21 )
1 21 1 2 /2 , (n n 2) p
1 2
1 1I ( ) (x y ) t . s .n n
2ps es la media ponderada de las cuasivarianzas muestrales:
2 22 1 1 2 2p
1 2
(n 1 )s (n 1)ss
n n 2
- Caso en que los tamaños muestrales son pequeños 1 2(n n ) 30 y las varianzas sondesconocidas y distintas ( 2
2 21 ):
2 21 2
1 1 2 2 ; f1 2
s sI ( ) (x y ) t
n n
f es la aproximación de Welch:
22 21 2
1 22222
2 21 1
1 2
s sn n
f 2(s n )(s n )
n 1 n 1
Cuando el intervalo cubre el 0 no hay diferencia significativa entre las mediaspoblacionales.
e) Intervalo de confianza para la razón de varianzas de dos poblaciones normales
1 2 1 2
2 2 2 22 2 1 2 1 2
1 1 1/2 ; ( n 1) , ( n 1) (1 /2) ; ( n 1) , ( n 1)
s s s sI ( ) ;
F F
Cuando el intervalo cubre el 1 no hay diferencia significativa entre las varianzaspoblacionales.
Hay que considerar la relación: 1 2
2 1
; n , n(1 ) ; n , n
1FF
Estadística Teórica: Intervalos Confianza 100
f) Intervalo de confianza para el parámetro p de una distribución binomial deparámetros n, p, B(n, p)
1 /2
ˆ ˆp (1 p)ˆI (p) p zn
g) Intervalo de confianza para la diferencia de parámetros 1 2(p p ) de dosdistribuciones binomiales
1 1 2 21 1 2 1 2 /2
1 2
ˆ ˆ ˆ ˆp (1 p ) p (1 p )ˆ ˆI (p p ) (p p ) zn n
Cuando el intervalo cubre el 0 no hay diferencia significativa entre las proporcionespoblacionales.
h) Intervalo de confianza para el parámetro de una distribución de Poisson
1 /2
ˆˆI ( ) zn
i) Intervalo de confianza para la diferencia de datos apareados
Para muestras grandes n 30
d/2
sI d z
n
n n
22i i i i d i
i 1 i 1
1 1d d d s (d d )n n 1
Para muestras pequeñas n 30 d/2 , (n 1)
sI d t
n
Estadística Teórica: Intervalos Confianza 101
1. El peso (en gramos) de las cajas de cereales de una determinada marca sigue unadistribución N( , 5). Se han tomado los pesos de 16 cajas seleccionadasaleatoriamente, y los resultados obtenidos han sido:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.
a) Obtener los intervalos de confianza del 90%, 95% y 99% para la media poblacional.
b) Determinar cuál sería el tamaño muestral necesario para conseguir, con un 95% deconfianza, un intervalo de longitud igual a 2 gramos.
c) Suponiendo ahora que es desconocida, calcular los intervalos de confianza para lamedia al 90%, 95% y 99%.
Solución:
a) Se trata de construir un intervalo de confianza para la media poblacional devarianza conocida 2 25 . El intervalo de confianza de nivel 1 viene dado por:
2 Errorestimaciónmedia 2muestral
1 2
1 2
2
2 zL 2 z n L longitud o amplitud
longitudnI ( ) x zn
Error muestral z n
16
ii 1
x
x 503,7516
0,05
0,025
0,005
1 0,90 0,10 / 2 0,05 z 1,645 1 0,95 0,05 / 2 0,025 z 1,96 1 0,99 0,01 / 2 0,005 z 2,575
A medida que el nivel deconfianza es mayor, aumentalongitud del intervalo.
2 2P x z x z 1n n
Los intervalos de confianza solicitados serán:
0,905 5 5I ( ) 503,75 1,645 503,75 1,645 , 503,75 1,645 501,69 ; 505,8116 16 16
0,955 5 5I ( ) 503,75 1,96 503,75 1,96 , 503,75 1,96 501,30 ; 506,2016 16 16
Estadística Teórica: Intervalos Confianza 102
0,995 5 5I ( ) 503,75 2,575 503,75 2,575 , 503,75 2,575 500,53 ; 506,9716 16 16
La longitud de cada uno de los intervalos de confianza:º
0,90
0,95
0,99
L ( ) 505,81 501,69 4,12L ( ) 506,20 501,30 4,9L ( ) 506,97 500,53 6,44
b) La amplitud o longitud vendrá dado por la fórmula: x1 2
sI ( ) x z
n
2
/2/2 /2 /2
2 zamplitud ox z x z 2 z n
amplitudlongitud n n n
siendo, 2
x x2 1,96 5n 96 cajas de cereales2
c) Se trata de construir un intervalo de confianza para la media poblacional devarianza poblacional desconocida, con muestras pequeñas (n 30). El intervalo deconfianza de nivel (1 ) , viene dado por:
0,05;15x
1 /2 , (n 1) 0,025;15
0,005;15
1 0,90 0,10 t 1,753s
I ( ) x t 1 0,95 0,05 t 2,131n
1 0,99 0,01 t 2,947
Cuasivarianza muestral:
162
ii 12
x x
(x x )s 36,037 s 6
15
cuasidesviación típica
Los intervalos de confianza solicitados serán:
0,906I ( ) 503,75 1,753 501,12 ; 506,3816
0,956I ( ) 503,75 2,131 500,55 ; 506,9516
0,996I ( ) 503,75 2,947 499,33 ; 508,1716
Señalar que a mayor nivel de confianza (1 ) mayor es la amplitud del intervalo, y, enconsecuencia, los intervalos de confianza son mayores.
Estadística Teórica: Intervalos Confianza 103
2. Una muestra aleatoria extraída de una población normal de varianza 100, presentauna media muestral x 160 . Con una muestra de tamaño 144, se pide:
a) Calcular un intervalo de confianza del 95 por ciento para la media poblacional.
b) Si se quiere tener una confianza del 95 por ciento de que su estimación se encuentra a una distancia de 1,2 cm más o menos de la verdadera media poblacional, ¿cuántas observaciones adicionales deben tomarse?
Solución:
a) 0,025
x 160 10 n 1441 0,95 / 2 0,025 z 1,96
0,9510 10I ( ) 160 1,96 ; 160 1,96 158,37 ; 161,6312 12
b) El error absoluto que se quiere cometer es de 1,2, aplicando la fórmula para ladeterminación de la muestra a un nivel de confianza del 95 por 100, se tiene:
2 22
2
z 1,96. 10z n n 2671,2n
Se debería tomar una muestra adicional de 267 144 123 elementos
3. La afluencia de visitantes al parque de Monfragüe durante un mes, medida a travésde una muestra aleatoria durante 10 días elegidos aleatoriamente, han sido lossiguientes:
682, 553, 555, 666, 657, 649, 522, 568, 700, 552
Suponiendo que los niveles de afluencia siguen una distribución normal, y que ladesviación típica muestral es de 56,99.
a) Se podría afirmar, con un 95 por ciento de confianza, que la afluencia media alparque es de 600 personas al mes.
b) Los adjudicatarios de la explotación al parque, en negociaciones con la Junta deExtremadura, afirmaron que la afluencia media era constante y que la dispersión seríade unas 15 personas. ¿Queda esta afirmación probada con los datos disponibles con un95% de confianza?
Solución:
Estadística Teórica: Intervalos Confianza 104
a) Se trata intervalo de confianza para la media de una distribución normal devarianza poblacional desconocida siendo la muestra pequeña n 30
2x2 2 2
x x x
22x
1 /2 , (n 1) x x
2;(n 1) 0,025;9
nn (n 1)s s
(n 1)s 10. 56,99I ( ) x t s 3608,73 s 3608,73 60,07
9n
1 0,95 0,05 2 0,025 t t 2,262
10
ii 1
x
x
x 610,04 s 60,0710
0,9560,07 60,07 60,07I ( ) 610,04 2,262 610,04 2,262 , 610,04 2,262 567,07 ; 653,01
10 10 10
Como 567,07 600 653,01 se puede afirmar que con un 95 por ciento de confianzala afluencia media es de 600 personas al mes.
b) Intervalo de confianza para la varianza 2 de una distribución normal:
2x2 2
2 2 2x x1 /2 , (n 1) 0,025;92 2
/2 , (n 1) 1 /2 , (n 1) 2 21 /2 , (n 1) 0,975;9
s 3608,73(n 1)s (n 1)s
I ( ) ; 1 0,95 2 0,025 19,023
2,70
20,95
9.(3608,73) 9.(3608,73)I ( ) ; 1707,33 ; 12029,119,023 2,70
0,959.(3608,73) 9.(3608,73)I ( ) ; 1707,33 ; 12029,1 41,32 ; 109,68
19,023 2,70
15 41,32 ; 109,68 . El intervalo de la desviación típica no contiene el valor 15, con locual no se puede afirmar con una confianza del 95% que la dispersión de afluencia seade 15 personas.
Estadística Teórica: Intervalos Confianza 105
4. El gasto diario en llamadas telefónicas de dos departamentos X e Y de una mismaempresa sigue una distribución normal, con gasto medio desconocido en ambos. Sinembargo, se conocen las desviaciones típicas, que son 100 y 110 céntimos de euro para Xe Y, respectivamente. La dirección ha observado que una muestra aleatoria de 20 días,el gasto medio diario en llamadas realizadas por el departamento X ha sido de 1100céntimos, y de 1400 en el departamento Y. Obtener un intervalo de confianza para ladiferencia de gastos medios entre ambos departamentos.
Solución:
La variables aleatorias siguen, respectivamente, las distribuciones normales 1N( , 100)
y 2N( , 110) . El intervalo de confianza para la diferencia de medias 1 2( ) con
varianzas poblacionales conocidas viene dado por la expresión:
2 22 22 2 1 21 2
1 1 2 /2 1 21 2
/2
100 110I ( ) (x y ) z x 1100 n 20 y 1400 n 20
n n1 0,90 / 2 0,05 z 1,645
2 2
0,90 1 2100 110I ( ) (1100 1400) (1,645) 354,68 ; 245,3220 20
El intervalo de confianza no cubre el 0 por 100, lo que indica que existe diferenciasignificativa en el gasto de llamadas telefónicas.
Como el intervalo de confianza es negativo, se deduce que el gasto medio en llamadastelefónicas del departamento Y es superior al del departamento X, con una confianzadel 90 por ciento.
5. Se selecciona una muestra aleatoria de 600 familias, a las que se pregunta si tienen ono ordenador en casa. Contestaron afirmativamente 240 familias. Obtener un intervalode confianza al nivel del 95% para la proporción real de familias que poseen ordenadoren casa.
Solución:
La característica en estudio es dicotómica, hay que construir un intervalo de confianzapara el parámetro p (proporción) de la variable aleatoria binomial asociada al estudio dela característica.
Como el tamaño de la muestra es suficientemente grande, n = 600, se puede utilizar laaproximación normal.
Estadística Teórica: Intervalos Confianza 106
1 /2/2 0,025
ˆ ˆˆˆ ˆ p 240 600 0,4 q 1 p 0,6 n 600p (1 p)ˆI (p) p z 1 0,95 0,05 / 2 0,025 z z 1,96n
0,950,4 . 0,6I (p) 0,4 1,96 0,36 ; 0,44
600
Con una confianza del 95% se puede afirmar que las familias poseen ordenador entre el36% y el 44%.
6. Según los dirigentes del partido A, la intención de voto del partido rival B, enAndalucía, es la misma que la que tiene en Madrid. Se realiza una encuesta a 100personas en Andalucía de los que 25 mostraron su apoyo al partido B, y a otras 100personas en Madrid de las que 30 se inclinaron por el partido B.
a) Construir un intervalo de confianza del 90% para la proporción de personas quevotarían al partido B en Andalucía
b) ¿A cuántas personas habría que encuestar para obtener un margen de error o errorde estimación 2%, al nivel de confianza anterior?.
c) Construir un intervalo de confianza al 90% para la diferencia de proporciones en laestimación del voto del partido B en las dos comunidades. ¿Podemos afirmar que losdirigentes del partido A tienen razón?.
Solución:
a) La característica en estudio en ambas comunidades es dicotómica, tenemos queconstruir un intervalo de confianza para el parámetro 1p (proporción) de la variablealeatoria binomial asociada al estudio de la característica en la comunidad de Andalucía.Como el tamaño de la muestra es suficientemente grande, 1n 100 , se puede utilizar laaproximación normal.
1 1 1 11 /2
/2 0,05
ˆ ˆˆp 25 100 0,25 q 1 p 0,75 n 100ˆ ˆp (1 p)ˆI (p) p zn 1 0,90 0,10 / 2 0,05 z z 1,645
0,90 10,25 . 0,75I (p ) 0,25 (1,645) 0,179 ; 0,321
100
En Andalucía la intención de voto del partido B se encuentra entre el 17,9% y 32,1%,con un nivel de confianza del 90%.
b) La amplitud o longitud vendrá dado por la fórmula:
Estadística Teórica: Intervalos Confianza 107
2
21 /2 /2
ˆ ˆ ˆ ˆproporción error p (1 p) p .qˆI I (p) p z zn nmuestral estimación
2/2
2
ˆ ˆ(z ) (p .q)de donde, n
El caso más desfavorable será cuando ˆ ˆp q 0,5 .
Siendo 2
2 2 (1,645) (0,5.0,5)( 0,02) 0,0004 n 16910,0004
c) Se trata de un intervalo de confianza para la diferencia de parámetros poblacionales1 2(p p ) de dos distribuciones binomiales, con el tamaño de las muestras
suficientemente grandes, 1 2n n 100, para utilizar la aproximación normal.
1 1 2 21 1 2 1 2 /2
1 2
ˆ ˆ ˆ ˆp (1 p ) p (1 p )ˆ ˆI (p p ) (p p ) zn n
1 1 1 1
2 2 2 2
/2 0,05
ˆ ˆˆp 25 100 0,25 q 1 p 0,75 n 100ˆ ˆˆp 30 100 0,3 q 1 p 0,70 n 100
1 0,90 0,10 2 0,05 z z 1,645
0,90 1 20,25 . 0,75 0,3 . 0,70I (p p ) (0,25 0,3) 1,645 0,153 ; 0,053
100 100
El intervalo de confianza cubre el cero, lo que indica que no existe diferenciasignificativa entre la intención de voto del partido B en ambas comunidades, con lo cuallos dirigentes del partido A tienen razón con una fiabilidad del 90%.
Estadística Teórica: Intervalos Confianza 108
7. Un fabricante de televisores está desarrollando un nuevo modelo de televisor encolor, y para este fin se pueden utilizar dos tipos de esquemas transistorizados. Elfabricante selecciona una muestra de esquemas transistorizados del primer tipo detamaño 16, y otra del segundo tipo de tamaño 13. Los datos muestrales respecto a lavida media de cada esquema son los siguientes:
1 1 1
2 2 2
x 1400 horas s 30 horas n 16x 1500 horas s 17 horas n 13
Construir un intervalo de confianza del 90% para la diferencia de vida media de cadatipo de esquema.
Solución:
Sea la variable aleatoria X1 = 'vida media del primer esquema', que sigue unadistribución normal 1 1N( , ) . Análogamente, la variable aleatoria X2 = 'vida media delsegundo esquema', sigue una distribución normal 2 2N( , ) .
Hay que construir un intervalo de confianza para la diferencia de medias poblacionales1 2( ) con varianzas poblacionales desconocidas, y se desconoce si distintas o no,
siendo las muestras pequeñas 1 2n n 29 30 .
Para dilucidar si las varianzas poblacionales desconocidas son o no distintas, seconstruye primero un intervalo de confianza para el cociente de varianzas 2 2
1 2( ) , demodo que si el intervalo cubre al punto 1 se puede partir de que las varianzas sondesconocidas pero iguales.
Para construir un intervalo de confianza para el cociente de varianzas se emplea lafórmula:
1 2
1 2 1 2 2 1
2 2 2 22 2 1 2 1 2
1 1 1 (1 /2) ; ( n 1) , ( n 1)/2 ; ( n 1) , ( n 1) (1 /2) ; ( n 1) , ( n 1) /2 ; ( n 1) , ( n 1)
s s s s 1I ( ) ; siendo FF F F
2 22 2 2 21 1 2 2 1 2s 30 900 n 16 s 17 289 n 13 s / s 900 / 289 3,1141 0,90 / 2 0,05
0,05; 15,12 0,95; 15,12 0,05; 12,15F 2,6169 F 1 / F 1 / 2,4753 0,404
de donde, 2 20,90 1 2
3,114 3,114I ( ) ; 1,19 ; 7,712,6169 0,404
El intervalo no cubre el punto uno, y por tanto las varianzas poblacionales sondesconocidas y distintas, con una fiabilidad del 90%.
Estadística Teórica: Intervalos Confianza 109
Nos situamos ante un intervalo de confianza para la diferencia de mediaspoblacionales 1 2( ) con varianzas poblacionales desconocidas y distintas o no, conmuestras pequeñas 1 2n n 29 30 .
/2 , f
22 2 2 21 2 1 1 2 2
1 1 2 /2 , f 22221 2 2 21 1
1 2
t donde f es la aproximación de Welch
s s s / n s / nI ( ) (x y ) t f 2 n n (s n )(s n )n 1 n 1
siendo,
222 2 21 1 1 1 1 1
222 2 22 2 2 2 2 2
2 2 22 2 2 21 1 2 2 1 2
1 2
s 30 900 n 16 s / n 900 / 16 56,25 s / n 3164,06
s 17 289 n 13 s / n 289 / 13 22,23 s / n 494,17
s / n s / n s s186,12 13,294 6159,11
17 14 n n
22 21 1 2 2
22222 21 1
1 2
s / n s / n 6159,11f 2 2 28,89 29186,12 13,294(s n )(s n )
n 1 n 1
1 2 /2 , f 0,05 ; 29x 1400 horas x 1500 horas t t 1,699
0,90 1 2900 289I ( ) (1400 1500) (1,699) 115,05 ; 84,9516 13
El intervalo no cubre el cero, concluyendo que existe diferencia significativa entre lavida media de cada esquema, siendo mayor la vida media del segundo esquema con unafiabilidad del 90%.
Estadística Teórica: Intervalos Confianza 110
8. Un instituto de investigaciones agronómicas siembra, en cinco parcelas diferentes,dos tipos de maíz híbrido. Las producciones en quintales métricos por hectárea son:
1 2 3 4 5Híbrido I 90 85 95 76 80Híbrido II 84 87 90 92 90
a) Construir un intervalo de confianza para el cociente de varianzas con un error designificación de 0,10.
b) Construir un intervalo de confianza del 90% para la diferencia entre lasproducciones medias.
Solución:
a) Sea la variable aleatoria X1 = 'producción de maíz del híbrido I', que sigue unadistribución normal 1 1N( , ) . Análogamente, la variable aleatoria X2 = 'producción demaíz del híbrido II', sigue una distribución normal 2 2N( , ) .
Al construir un intervalo de confianza para el cociente de varianzas se puede concluir silas varianzas poblacionales desconocidas son o no distintas.
De modo que, si el intervalo de confianza para el cociente de varianzas 2 21 2( ) cubre
al punto 1 podremos partir de que las varianzas son desconocidas pero iguales.
1 2
1 2 1 2 2 1
2 2 2 22 2 1 2 1 2
1 1 2 (1 2) ; (n 1) ,(n 1)2;(n 1),(n 1) (1 2); (n 1),(n 1) 2 ; (n 1) ,(n 1)
s s s s 1I ( ) ; donde F
F F F
En el caso,
21 1 1
2 2 22 2 2 1 2
0,05 ; 4, 4 0,95 ; 4, 4 0,05 ; 4, 4
n 5 x 85,20 s 57,7 / 2 0,05n 5 x 88,6 s 9,8 s /s 57,7 / 9,8 5,89F 6,3883 F 1 / F 1 / 6,3883 0,1565
2 20,90 1 2
5,89 5,89I ( ) ; 0,92 ; 37,646,3883 0,1565
El intervalo cubre el uno, y concluimos que las varianzas poblacionales son desconocidase iguales, con una fiabilidad del 90%.
b) Se trata de un intervalo de confianza para la diferencia de medias poblacionales1 2( ) con varianzas poblacionales desconocidas pero iguales, con muestras pequeñas
1 2n n 10 30 .
1 21 1 2 /2 , (n n 2) p1 2
1 1I ( ) (x y ) t . s .n n
Estadística Teórica: Intervalos Confianza 111
donde, 2ps media ponderada de las cuasivarianzas muestrales:
2 22 21 1 2 2
p p p1 2
(n 1)s (n 1)s 4 (57,7) 4 (9,8)s s 33,75 s 5,81n n 2 5 5 2
1 21 2 1 2 /2 , (n n 2) 0,05 ; 8n n 5 x 85,20 x 88,6 t t 1,860
0,90 1 21 1I ( ) (85,20 88,6) (1,860) (5,81) 10,23 ; 3,435 5
El intervalo de confianza cubre el cero, por lo que no existe diferencia significativaentre las producciones medias, con una fiabilidad del 90%.
9. Un equipo de investigación biológica está interesado en ver si una nueva drogareduce el colesterol en la sangre. Con tal fin toma una muestra de diez pacientes ydetermina el contenido de colesterol en la sangre antes y después del tratamiento. Losdatos muestrales expresados en miligramos por 100 mililitros son los siguientes:
Paciente 1 2 3 4 5 6 7 8 9 10Antes 217 252 229 200 209 213 215 260 232 216Después 209 241 230 208 206 211 209 228 224 203
Construir un intervalo de confianza del 95 por 100 para la diferencia del contenidomedio de colesterol en la sangre antes y después del tratamiento.
Solución:
Se trata de datos apareados, en los que no existe independencia entre las muestras.En este caso, como la muestra es pequeña (n 10 30) el intervalo de confianza es:
nn2
iid i 12i 1
/2 , (n 1) di i i
(d d)dsI d t sd x y d n 1n n
donde d es la media de las diferencias y ds la desviación estándar de estasdiferencias.
X = 'Antes' 217 252 229 200 209 213 215 260 232 216Y = 'Después' 209 241 230 208 206 211 209 228 224 203
i i id x y 8 11 - 1 - 8 3 2 6 32 8 13
2d d /2 , (n 1) 0,025 ; 9n 10 d 7,40 s 112,1481 s 10,59 t t 2,262