guÍa p valor - estadistica.net · de significación del 5%. por tanto, existe evidencia...
TRANSCRIPT
2
Una empresa de neumáticos afirma que una nueva gama en promedio dura al
menos 28.000 km. Las pruebas con 64 neumáticos dan como resultado una
duración media de 27.800 km, con una desviación e
stándar de 1.000 km.
Bajo la normalidad de los neumáticos, se pide:
a) Comprobar si hay evidencia suficiente para rechazar la afirmación de la
empresa, un nivel de significación del 5%
b) ¿Cuál es el p‐valor?
Solución:
a) Sobre la población de los neumáticos se define la variable aleatoria
X "duración en kilómetros" donde X N(28000, )
2Las hipótesis sobre la media poblacional con desconocida:
0 0 1 1H : 28000 H : 28000
Se trata de un contraste compuesto, unilateral por la izquierda.
Regla de decisión:
0
0
Si x k Se aceptaH (R.A)
Si x k Se rechaza H (R.C)
x
En el muestreo de una población normal con varianza desconocida, con muestras
sgrandes n 30 la media muestral x N ,
n
1000Bajo la hipótesis nula x N 28000, N 28000, 125
64
El valor crítico , bajo la hipótesis nula, se determina con el nivel de significación
0,05 : k
0 0 0 0P RechazarH H cierta P x k H cierta P x k 28000
3
x 28000 k 28000 k 28000P P z 0,05
125 125 125
k 28000 k 28000P z P z 0,05
125 125
k 280001,645 k 28000 125 1,645 27794,375
125
x
Siendo x 27800 27794,375 se acepta la hipótesis nula, por tanto, se
acepta la afirmación de la empresa con un nivel de confianza del 95%
pb) El p‐valor ( ) es el menor nivel de significación para el que se rechaza la
hipótesis nula, es decir:
p 0p valor P Rechazar el estadístico muestral / H es cierta ‐
p 0Si se acepta la hipótesis nula H
p 0P x 27800 H cierta P x 27800 N 28000,125
x 28000 27800 28000P P z 1,6 P z 1,6 0,0548
125 125
p
0
Para un nivel de significación 0,05 el p‐valor 0,0548 0,05
Se acepta H
Con una fiabilidad del 95% se acepta que la duración media de los neumáticos
es de 28.000 km.
4
El propietario de un autómovil sospecha que su vehículo tiene un consumo
medio de combustible en carretera superior a los 5,6 litros /100 km, que es
lo que el fabricante indica en su publicidad.
Para apoyar empíricamente su sospecha observa el consumo medio en 11
viajes seleccionados aleatoriamente entre todos los que realiza en el año,
obteniendo los siguientes resultados:
6,1 6,5 5,1 6 5,9 5,2 5,8 5,3 6,2 5,9 6,3
Se pide:
a) ¿Están fundadas las sospechas del propietario a un nivel de significacion
del 1%?
b) Calcula el p‐valor.
Solución:
a) Se supone que el consumo medio del autómovil sigue una distribución
normal N( , ), siendo ambos parámetros desconocidos.
n 1
En el muestreo de una población
normal con varianza desconocida,
con muestras pequeñas n 30 ,
la media muestral x t
0
1
El fabricante afirma que H : 5,6 y el propietario del vehículo cree
que H : 5,6
1Se trata, pues, de un contraste unilateral, donde H es compuesta
0
0
Si x k R.A : AceptarHRegla decisión:
Si x k R.C :RechazarH
x
10 10
Bajo la hipótesis nula, con los datos muestrales x 5,8454 , s 0,4612 ,
0,4612el muestreo sigue una distribución t 5,6; t (5,6 , 0,139)
11
El valor crítico , bajo la hipótesis nula, se calcula a partir del nivel de significación :k
5
0 0 0 0P RechazarH H cierta P x k H cierta P x k 5,6
10
x 5,6 k 5,6 k 5,6 k 5,6P P t 0,01 2,764
0,139 0,139 0,139 0,139
k 5,9842
0Siendo x 5,8454 5,9842 no se puede rechazar la hipótesis nula H ,
con lo que se acepta las afirmaciones del fabricante sobre el consumo
medio del autómovil.
p 0b) p valor P Rechazar el estadístico muestral / H es cierta
p 0Si se acepta la hipótesis nula H
p 0 10P x 5,8454 H cierta P x 27800 t (5,6 , 0,139)
10
x 5,6 5,8454 5,6P P t 1,765 0,055
0,139 0,139
Tabla de la t‐Student:1,372 1,812 1,765 1,812
x 0,0550,10 0,05 x 0,05
p 00,055 0,01 Se acepta H
Con un nivel de confianza del 99% se acepta que el consumo medio de
combustible en carretera superior es de 5,6 litros /100 km.
6
Un banco quiere analizar si las comisiones que cobra a sus clientes por
operaciones en el mercado bursátil difieren significativamente de las que cobra
la competencia, cuya media es de 12 euros mensuales con una desviación
estándar de 4,3 euros.
Este banco toma una muestra de 64 operaciones bursátiles y observa que la
comisión promedio es de 13,6 euros. Contrastar, al nivel de significación del 5%,
que este banco no difiere significativamente en el cobro de comisiones por
operaciones en la Bolsa con respecto a la competencia.
Solución:
Sea la v. a. X="Comisiones que se cobran por operaciones en el mercado bursátil",
donde X N , 4,3
7
1Como la hipótesis alternativa es H : 12 en la decisión deben ser válidos
valores de tanto mayores o menores que 12, por lo que el contraste debe
se bilateral o de dos colas.
0
0
Regla decisión :
Si se acepta H (R.A)
Si se rechaza H (R.C)
x k
x k
4,3Bajo la hipótesis nula: x N 12, N(12, 0,5375)
64
1 2
Con el nivel de significación 0,05 se calculan los valores
críticos k , k :
0 0 1 2P RechazarH H cierta P x k N(12, 0,5375) P (x k ) (x k
1 2P(x k ) P(x k ) 0,025 0,025 0,05
1 1 11
x 12 k 12 k 12 k 12P(x k ) P P z P z 0,025
0,5375 0,5375 0,5375 0,5375
11
k 121,96 k 10,9465
0,5375
2 22
x 12 k 12 k 12P(x k ) P P z 0,025
0,5375 0,5375 0,5375
22
k 121,96 k 13,0535
0,5375
En consecuencia, la región de aceptación: 10,9465 x 13,0535
Como el banco cobra una comisión promedio de 13,6 euros, no se encuentra
dentro de la región de aceptación, 13,6 (10,9465, 13,0535), en consecuencia
difiere significativamente de la competencia.
8
p P Rechazar media muestral H es cierta 0/p valor
pSi se acepta la hipótesis nula H 0
p P x 13,6 N(12, 0,5375) P (x 13,6) (x 13,6)
P(x 13,6) P(x 13,6) 2 P(x 13,6)
x 12 13,6 122 P 2 P(z 2,98) 2 0,00144 0,0029
0,5375 0,5375
x
pSiendo 0,0029 0,05 rechaza la hipótesis nula a un nivel
de significación del 5%. Por tanto, existe evidencia estadística de que la
comisión promedio que cobra este banco difiere significativame
nte
de la competencia.
9
4,3
La comisión promedio que cobra el banco: x N 12, N (12, 0,5375)64
Tipificando se obtiene el estadístico de contraste:
x 12 13,6 12z 2,98 2,98 ( 1,96 , 1,96)
0,5375 0,5375
El valor del estadístico de contraste está en la zona de rechazo, por lo que se
rechaza la hipótesis nula, afirmando que la comisión promedio que cobra este
banco difiere significativamente de la competencia.
10
Un supermercado tiene dos formas diferentes de venta: tradicional
o con caja rápida. En la tradicional, un operario registra cada artículo,
lo pone en bolsas y efectua el cobro. En la caja rápida, el cliente
registra cada artículo, lo introduce en bolsas y paga en una máquina
con tarjeta de crédito. La dirección del supermercado desea saber si
el tiempo medio que un cliente se encuentra en la fila del proceso con
el método tradicional es mayor que con la caja rápida, reuniendo la
información adjunta:
Tipo Media Tamaño Varianza
cliente muestral muestra p
2
2
oblacional
Tradicional 6,1 minutos 49 0,49 minutos
Caja rápida 5,6 minutos 72 0,36 minutos
Suponiendo que el tiempo en espera en el proceso sigue una ley
normal, con un nivel de confianza del 99%, ¿qué decisión debería
adoptar el supermercado para agilizar las ventas?
Solución:
t
cr
Sean las variables de respuesta: X "tiempo método tradicional" e
Y "tiempo caja rápida", que siguen respectivamente N( , 0,7)
y N( , 0,6)
0 t cr 1 t cr
El con los datos de la muestra facilita la decisión que debe
tomar la dirección del supermercado, estableciendo las hipótesis:
H : H :
p ‐valor
Tipificando se obtiene el estadístico de contraste:
11
2 2t cr
t cr
x y 6,1 5,6z 4,082
0,49 0,36
49 72n n
0,01estadístico teórico (valor crítico): z 2,326
El valor del estadístico de contraste z 4,082 ( , 2,326) por lo que
se rechaza la hipótesis nula, concluyendo que el supermercado debe
adoptar la caja rápida.
p 0P Rechazar estadístico muestral / H es cierta p ‐ valor
p
0
= 0,500 0,490 0,01
se rechaza la hipótesis nula H
p valor <
0
0
x y k se acepta H (RA) Regla Decisión
x y k se rechaza H (RC)
12
Se calcula el valor crítico k con el nivel de significación 0,01:
0 0P(Error Tipo I) P Rechazar H / H es cierta 0,01
0
0,49 0,36P x y k H cierta P x y k N 0,
49 72
x y 0 k 0 kP x y k N 0, 0,122 P P z 0,01
0,122 0,122 0,122
k2,326 k 0,284
0,122
0
0
x y 0,284 se acepta H (RA) Regla Decisión
x y 0,284 se rechaza H (RC)
0Siendo, x y 6,1 5,6 0,5 0,284 Se rechaza H
El supermercado debe adoptar la caja rápida.
13
La directora del departamento de personal de una corporación está buscando
empleados para un puesto en el extranjero. Durante el proceso de selección,
la administración le pregunta cómo va la incorporación de empleados, y
ella contesta que la puntuación promedio en la prueba de aptitudes será de
90 puntos. Cuando la administración revisa 19 de los resultados de la prueba,
encuentra que la puntuación media es de 83,25 puntos con una desviación
estándar de 11. Bajo el supuesto de normalidad, ¿lleva razón la directora,
con un nivel de confianza del 90%?
Solución:
Se supone que la población de resultados de todos los candidatos siguen
una distribución X N( , ) ,siendo ambos parámetros desconocidos.
10 n 1
x
En el muestreo de la población normal con varianza desconocida, con
xmuestras pequeñas n 11 30 , la media muestral x t con t
s / n
0 1Se establecen las hipótesis: H : 90 H : 90
Como la hipótesis alternativa es 90 en la decisión deberán ser
válidos valores de tanto mayores o menores que 90, por lo cual
el contraste debe ser bilateral o de dos colas.
0
0
x k se rechaza H (R.C.)Regla decisión:
x k se acepta H (R.A.)
Si
Si
p 0p valor P Rechazar estadístico muestral / H es cierta
p 18P x 83,25 t (90 ; 2,524)
18P (x 83,25) (x 83,25) t (90 ; 2,524)
14
18 18P x 83,25 t (90 ; 2,524) P x 83,25 t (90 ; 2,524)
18 18P x 83,25 t (90 ; 2,524) P x 83,25 t (90 ; 2,524)
18
x 90 83,25 902P x 83,25 t (90 ; 2,524) 2P
2,524 2,524
182P t 2,6774 2(0,008) 0,016
2,552 2,878 2,674 2,878
Tabla t‐Student: x 0,0080,01 0,005 x 0,005
pSiendo 0,016 0,10 Se rechaza la hipótesis nula.
En consecuencia, se rechaza la manifestación de la directora de la corporación.
15
0
0
Regla decisión:
x k se acepta H (R.A.)
x k se rechaza H (R.C.)
Si
Si
El valor crítico k se calcula con el nivel de significación 0,10 :
0 0 18 1 2P Rechazar H H cierta P x k t (90 ; 2,524) P (x k ) (x k
1 2P(x k ) P(x k ) 0,05 0,05 0,10
1 1 11 18 18
x 90 k 90 k 90 k 90P(x k ) P P t P t 0,05
2,524 2,524 2,524 2,524
11
k 901,734 k 85,62
2,524
2 22 18
x 90 k 90 k 90P(x k ) P P t 0,05
2,524 2,524 2,524
22
k 901,734 k 94,37
2,524
Para aceptar la hipótesis nula la media muestral se tiene que encontrar en
el intervalo 85,62 x 94,37
No encontrándose la media muestral observada x 83,25 en la región
de aceptación, con un nivel de significacion de 0,10 , se rechaza la
manifestación de la directora de la corporación.
16
x1 /2 , n 1 0,90 0,05 , 18
s 11I ( ) x t I ( ) 83,25 t
n 19
0,90
11I ( ) 83,25 1,734 83,25 4,376 78,874 , 87,626
19
En consecuencia, 78,874 87,626
0La puntuación promedio 90 que manifiesta la directora del
departamento de personal no se encuentra dentro del intervalo de
la media de la población con una fiabilidad del 90%, teniendo que
rechaza
r su afirmación.
17
Un portal e‐business sabe que el 60% de todos sus visitantes a la web están
interesados en adquirir sus productos pero son reacios al comercio electrónico
y no realizan finalmente la compra vía internet. Sin embargo, en la dirección
del portal se piensa que en el último año el porcentaje de gente que está
dispuesta a comprar por internet ha aumentado y esto se debe reflejar en
los resultados empresariales. En esta línea, se tomó una muestra de 500
visitantes para conocer su opinión y se observó que el 55% no estaba
dispuesta a realizar compras vía on‐line.
Contrastar con el 2% de significación si el último año se ha reducido el
porcentaje de personas que no está dispuesta a comprar vía internet.
Solución:
Sea p "Proporción personas compran on‐line"
1 2 500
Al realizar el contraste sobre la proporción, se parte de una muestra aleatoria
(x , x , , x ), donde X B(1, p)
500
i
i 1
xˆLa distribución del estadístico muestral p al ser el tamaño sufientemente
n
ˆgrande n 500 y estar p definido como suma de variables independientes entre
sí, según una distribución de Ber
500
i
i 1
nouilli X B(1,p), por el teorema central del límite
x pqˆ(TCL) se puede aproximar p N p,
n n
0 1Se establecen las hipótesis: H : p 0,6 H : p 0,6
x0,6 0,4ˆBajo la hipótesis nula, el estadístico muestral p N 0,6,
500
Contraste unilateral a la izquierda
(cola a la izquierda)
Región aceptación ( z , )
18
x0,6 0,4ˆSiendo que el estadístico p N 0,6, N 0,6, 0,022 ,
500
se obtiene el estadístico de contraste tipificando:
0
0 o
p̂ p 0,55 0,60z 2,27
0,022p .q
n
0 ,02
El estadístico de contraste z 2,27 no se encuentra en la región de
aceptación ( z , ) ( 2,05, ), rechazando la hipótesis nula.
En conclusión, existe evidencia empírica que la proporción de visitantes al
portal que están dispuestos a comprar on‐line ha disminuido, es decir, el
porcentaje de visitantes que son reacios a comprar por internet ha aumentado.
p 0p valor P Rechazar estadístico / H es cierta
p
p̂ 0,6 0,55 0,6ˆP p 0,55 N 0,6, 0,022 P P(z 2,27)
0,022 0,022
P(z 2,27) 0,0116
pComo 0,0116 0,02 se rechaza la hipótesis nula a un nivel de
significación del 2%.
19
Se determina el valor crítico k con el nivel de significación 0,02
0
0
Contraste unilateral por la izquierda
p̂ k se acepta Hregla de decisión:
p̂ k se rechaza H
0 0
p̂ 0,6 k 0,6ˆP Rechazar H H cierta P p k N 0,6, 0,022 P
0,022 0,022
k 0,6 k 0,6P z 0,02 2,05 k 0,645
0,022 0,022
ˆEl valor del estadístico muestral (evidencia empírica) p 0,55 0,642,
por lo que se rechaza la hipótesis nula. En definitiva, ha aumentado el
porcentaje de personas que son reacios a comprar por inter
net.
Con el intervalo de confianza unilateral a la izquierda para la proporción,
ˆverificando si el estadístico p 0,55 pertenece al intervalo:
0 00 0 1 0 0
p .qH : p p H : p p p z ,
n
20
0,6.0,40,6 2,05. , (0,56 , )
500
ˆSiendo p 0,55 (0,56 , ) se rechaza la hipótesis nula.
Los contrastes bilaterales corresponden a intervalos centrados,
mientras que los contrastes unilaterales derechos corresponden
a estimaciones unilaterales por exceso y los unilaterales izquierdos
a estimaciones por defecto.
0 0 0 00 0 1 0 0 /2 0 /2
0 0 0/2 0 /2
0 0
0
región rechazo
estadí
Se
stico con
acepta H
traste
p .q p .qH : p p H : p p p z , p z bilateral
n n
p̂ p p .qˆ o también: z z R.C p p z
np
n
.q
0 00 0 1 0 0
0 0 00
0 0
0
región rechazo
estadístico contraste
Se acepta H
p .qH : p p H : p p , p z unilateral derecho
n
p̂ p p .qˆ o también: z z R.C p p z
np .
q
n
0 00 0 1 0 0
0 0 01 0 1 1
0 0
0
región rechazo
estadístico
Se acepta H
contraste
p .qH : p p H : p p p z , unilateral izquierd o
n
p̂ p p .qˆ o también: z z R.C p p z z
np .q
n
z
21
Para estudiar si el consumo de tabaco tiende a provocar problemas de
trombosis debido a un aumento en la capacidad de coagulación, se extrajo
muestras de sangre en 10 individuos antes y después de que fumasen un
cigarrillo, midiendo la capacidad de agregación de las plaquetas:
Antes 25 27 44 30 67 53 53 52 60 28
Después 29 37 56 46 82 57 80 61 59 43
Bajo el supuesto de normalidad, ¿hay suficiente evidencia estadística
(con un nivel de significación 0,01) para afirmar que los fumadores
presentan la misma tendencia a la formación de coágulos?
Calcular el p‐valor
Solución:
Sean las variables aleatorias:
1 1 1X "coágulos obtenidos antes de fumar", donde X N( , ), donde
es el porcentaje medio de agregación de plaquetas antes de fumar.
2 2 2Y "coágulos obtenidos después de fumar", con Y N( , ), donde
es el porcentaje medio de agregación de plaquetas después de fumar.
Destacar que los datos obtenidos antes de fumar, y los obtenidos después
de fumar, no son independientes, dado que se obtienen de la misma persona.
No se puede llevar a cabo un contraste de igualdad de medias como se
realizó cuando las muestras eran independientes, se puede considerar
la variable aleatoria d X Y , y admitiendo que su distribució
1 2
n sea
N( , ), efectuar un contraste adecuado sobre
1 2Se desea probar estadísticamente que , o lo que es igual, que 0
por lo que se trata de un contraste bilateral (o de dos colas).
0 1Se establecen las hipótesis: H : 0 H : 0
22
0 1 0 1
En otros casos, se podría estar ante contrastes unilaterales:
H : 0 frente a H : 0 o bien H : 0 frente a H : 0
Si se tuviera la creencia de que fumar supone un aumento de forma
0 1 2 1
ción
de coágulos de 5 puntos, las hipótesis serían:
5H : 5 frente a H :
5
Para continuar es necesario conocer la tabla de diferencias:
i
Antes 25 27 44 30 67 53 53 52 60 28
Después 29 37 56 46 82 57 80 61 59 43
d 4 10 12 16 15 4 27 9 1 15
10 10
2 2i d i d
i 1 i 1
1 1d d 11,1 s (d d) 62,32 s 7,89
10 9
09 n 1
d
En el muestreo de la población normal con varianza desconocida, con
dmuestras pequeñas n 10 30 , la media muestral d t con t
s / n
como estadístico de contraste.
0n 1
d
dt
s / n
Región de aceptación:
/2 , n 1 /2 , n 1( t , t )
0n 1
d
n 1 n 1 /2 , (n 1)
dContraste bilateral, estadístico de contraste: t
s / n
Región de aceptación R.A t : t t
n 1 n 1 /2 , (n 1)Región crítica R.C t : t t
23
0o n 1 /2 , (n 1)
d
dLo que equivale a decir que H se acepta si t t
s / n
9
11,1 0Bajo la hipótesis nula, el estadístico contraste: t 4,449
7,89 / 10
/2 , n 1 0,005 , 9t t 3,25 Región aceptación: ( 3,25 , 3,25)
Siendo 4,449 ( 3,25 , 3,25) se rechaza la hipótesis nula, pudiendo decir
que los fumadores no presentan la misma tendencia a la formación de coágulos.
p 0 9 p valor P Rechazar estadístico H es cierta P t 4,449 0,00084
4,297 4,781 4,449 4,781Tabla t‐Student: x 0,00084
0,001 0,0005 x 0,0005
d1 /2 , n 1
s El intervalo de confianza es: I ( ) d t
n
0,99
7,89 I ( ) 11,1 3,25. 19,21 , 2,99
10
El intervalo no abarca el cero, 0 , concluyendo que los fumadores
no presentan la misma tendencia a la formación de coágulos.
24
1 2 1 2
Se desea probar estadísticamente
que o bien que 0
0 1Se contrasta: H : 0 frente a H : 0
, n 1Región de aceptación: ( t , )
0,01 , 9( t , ) ( 2,821 , )
0n 1
d
n 1 n 1 , n 1 1 , n 1
dContraste unilateral a la izquierda, estadístico de contraste: t
s / n
Región de aceptación R.A t : t t t
n 1 n 1 1 , n 1Región crítica R.C t : t t
9
11,1 0Bajo la hipótesis nula, el estadístico contraste: t 4,449
7,89 / 10
Como 4,449 ( 2,821 , ) se rechaza la hipótesis nula, aceptando
en consecuencia la hipótesis alternativa, concluyendo que los fumadores
presentan mayor tendencia a la formación de coágulos.
25
Intervalo de confianza para el parámetro λ de una distribución de Poisson :
Aproximación asintótica: Para valores del parámetro grandes, la distribución
de Poisson puede aproximarse a una distribución normal según P( ) N( , )
1 2 n
i
n
ii 1
Dada una muestra de n observaciones independientes X , X , , X , que siguen
una distribución de Poisson de parámetro , X P( ) , al ser la distribución de
Poisson aditiva en se verifica X N(n
, n )
aproximadamenteˆEn la muestra: X N ,n
ˆN(0,1)
n
/2 /2ˆn
ˆP z z 1
1 /2 /2 /2
ˆn
ˆI ( ) z R.A z , z
En caso de no ser aplicables las condiciones para utilizar la aproximación
asintótica, el intervalo exacto, que es válido siempre, viende dado:
n n
2 21 i 1 /2 i /2
i 1 i 1
1 1I ( ) 2 X ; 2 X 2
2n 2n
26
Contraste bilateral para el parámetro λ de una distribución de Poisson :
0 00 0 1 0 /2 /2
0 0
ˆ ˆH : H : R.A z R.C z
/n /n
Contraste unilateral a la derecha para el parámetro λ de una distribución
de Poisson :
0 0 1 0H : H :
0
0
ˆR.A z
/n
0
0
ˆR.C z
/n
Contraste unilateral a la izquierda para el parámetro λ de una distribución
de Poisson :
0 0 1 0H : H :
01
0
ˆR.A z
/n
01
0
ˆR.C z
/ n
27
Se quiere comprobar la efectividad de una vacuna contra una alergía. Para
ello se suministró la vacuna a cien personas y se les comparó con un grupo
testigo de cien pacientes afectados también por la alergía en épocas
pasadas. Entre los vacunados, ocho sufrieron alergía y entre los no
vacunados veinticinco volvieron a sufrir alergía.
¿Se puede concluir que la vacuna es eficaz en disminuir la alergía?.
Utilizar un nivel de significación de 0,05.
Solución:
Sean las variables aleatorias:
X "número pacientes vacunados afectados por la alergía"
Y "número pacientes no vacunados afectados por la alergía"
1 1 2 2donde, X B(p , n ) e Y B(p , n )
1 1 1
2 2 2
8ˆ ˆp 0,08 q 0,92 n 100
100En el muestreo:
25ˆ ˆp 0,25 q 0,75 n 100
100
1 2Las muestras n n 100 son grandes, en consecuencia, ambas
distribuciones se pueden aproximar a normales:
1 1 1 1 1 2 2 2 2 2X N n p , n p q , Y N n p , n p q
2 2 1 12 1 2 1
2 1
p q p qˆ ˆEn el muestreo: p p N p p ,
n n
2 1Para ver si la vacuna es eficaz hay que contrastar si p p
0 2 1 1 2 1H : p p H : p p
Región aceptación: ( , 1,65)
28
2 2 1 1
2 1
2 1
p q p qˆ ˆ Bajo la hipótesis nula p p N 0, , tipificando se obtiene
n n
el estadístico de contraste:
2 1
2 2 1 1
2 1
ˆ ˆp p 0,25 0,08z 3,4
p q p q 0,25. 0,75 0,08. 0,92
n n 100 100
2 1
El estadístico de contraste z 3,4 no se encuentra en la región de
aceptación ( , 1,65), rechazando la hipótesis nula y concluyendo
que la vacuna es eficaz (p p )
p 0 p valor P Rechazar estadístico H es cierta
p P(z 3,4) 0,00337
p0,00337 0,05 se rechaza la hipótesis nula a
un nivel de significación del 5%.
1 2 Intervalo de confianza para la diferencia de parámetros (p p ) de dos
distribuciones binomiales.
1 1 2 21 1 2 1 2 /2 0,025
1 2
ˆ ˆ ˆ ˆp q p qˆ ˆI (p p ) (p p ) z z 1,96
n n
1 1 2
0,08.0,92 0,75.0,25I (p p ) (0,08 0,25) 1,96
100 100
1 1 2 1 2I (p p ) 0,269 , 0,07 0,269 p p 0,07
1 2
1 2
Como el intervalo no cubre el cero (p p 0) se rechaza que la vacuna no
tenga eficacia. Por otra parte, ambos límites del intervalo de confianza son
negativos, lo que significa que p p
29
30
31
32
Se ha comprobado un micrómetro con una serie de piezas patrón. Bajo el
supuesto de normalidad, con un nivel de significación de 0,01, se desea
comprobar si el micrómetro tiene error en las lecturas realizadas:
Patrón 0,003 0,100 0,200 0,300 0,400 0,500 0,600 0,700 Lectura 0,002 0,09 0,198 0,297 0,403 0,498 0,602 0,698
Solución:
1 1
2 2
Se plantea el modelo: Sea que la variable de respuesta X "valor en el patrón"
sigue una normal N( , ) y la variable Y "valor en la lectura" sigue una
normal N( , )
1
11 1 n 1 2
1 1
xX N( , ) en la muestra: t
s / n
2
22 2 n 1 2
2 2
yY N( , ) en la muestra: t
s /n
2 21 2 1 1 1 2X Y N , con una muestra n + n 16 30 :
1 2
1 2n n 2 2 2
1 2
1 2
(x y) ( )t
s s
n n
Se trata de un contraste de hipótesis bilateral de igualdad de medias de
poblaciones normales. Hipótesis del contraste:
0 1 2 1 2 1 1 2 1 2 H : 0 H : 0
1 2n n 2 2 21 2
1 2
x yBajo la hipótesis nula: t
s s
n n
estadístico contraste
21 1 1
22 2 2
x 0,350 s 0,06 s 0,244 n 8Muestras
y 0,349 s 0,061 s 0,246 n 8
33
1 2n n 2 14
0,350 0,349 t t 0,081
0,06 0,061
8 8
p 14Como p valor P t 0,081 0,01 se admite la hipótesis
nula, pudiendo decir que el micrómetro no tiene error
1 2 1 2/2 ,n n 2 /2 ,n n 2R.A ( t , t )
1 2/2 ,n n 2 0,005 ,14t t 2,977
( 2,977 , 2,977)
Se observa que 0,081 ( 2,977 , 2,977) con lo que se admite la hipótesis nula,
pudiendo concluir que el micrómetro no tiene error y las diferencia que se
observan son debidas al azar o al observador.
La duración de una enfermedad sigue una ley normal. Para su curación se
emplean dos tipos de antiobióticos y se desea comprobar estadísticamente
cuál de los dos es más eficaz respecto a la duración de la enfermedad. A
tal fin se observan seis enfermos a los que se aplica el primer antibiótico
y cinco enferemos a los que se aplica el segundo antibiótico.
Los datos obtenidos han sido:
21 1
22 2
x 12 días s 16 n 6
y 15 días s 16 n 5
¿Cuál de los dos antibióticos es más eficaz a un nivel de significación 0,05?
Solución:
1 1
La variable de respuesta X "duración de la enfermedad con el primer
antibiótico" sigue una normal N( , ) y la variable Y "duración de la
enfermedad con el segundo antibiótico" sigue una normal N(
2 2, )
34
1
11 1 n 1 2
1 1
xX N( , ) en la muestra: t
s / n
2
22 2 n 1 2
2 2
yY N( , ) en la muestra: t
s /n
2 21 2 1 1 1 2X Y N , con una muestra n + n 11 30 :
1 2
1 2n n 2 2 2
1 2
1 2
(x y) ( )t
s s
n n
Se trata de un contraste de hipótesis unilateral a la derecha de igualdad
de medias de poblaciones normales. Hipótesis del contraste:
0 1 2 1 2 1 1 2 1 2 H : 0 H : 0
1 2n n 2 2 21 2
1 2
x yBajo la hipótesis nula: t
s s
n n
estadístico contraste
1 2n n 2 9
12 15 t t 1,24
16 16
6 5
p 9 9 9p valor P t 1,24 P t 1,24 1 P t 1,24
1 0,1286 0,8714
0,883 1,383 1,24 1,383Tabla t‐Student: x 0,1286
0,20 0,10 x 0,10
pComo p valor 0,8714 0,05 Se admite la hipótesis nula,
concluyendo que el primer antibiótico tiene una duración media
inferior en la curación de la enfermedad.
35
1 2, n n 2 R.A ( , t )
1 2, n n 2 0,05 , 9t t 1,833
R.A ( , 1,833)
0 1 2 1 2 1 1 2 1 2 H : 0 H : 0
1 2n n 2 9
12 15Bajo la hipótesis nula: t t 1,24
16 16
6 5
0 1 21,24 ( , 1,833) Se admite H :
El primer antibiótico tiene una duración media inferior en la curación
de la enfermedad.
2 21 2
Se trata de un contraste unilateral para las medias de dos poblaciones
normales con muestras pequeñas, varianzas desconocidas pero iguales
(debido a la información muestral s s ). Hipótesis del c
ontraste:
0 1 2 1 1 2 H : H :
1 2, n n 2
p
1 2
x y: t : t
1 1s
n n
Estadístico contraste Estadístico teórico
2 22 1 1 2 2p
1 2
(n 1)s (n 1)sVarianza muestral ponderada: s
n n 2
2p p
6 . 16 5 . 16 s 16 s 4
6 5 2
p
1 2
x y 12 15 3 t 1,24
2,421 1 1 1s 4
n n 6 5
0 0,05 , 9Se acepta la hipótesis H ya que t 1,24 1,833 t