estadÍstica teÓrica: contrates de hipÓtesis intervalos ... · intervalos de confianza. ... la...

Estadística Teórica: Contrastes 1

Gestión Aeronáutica: Estadística TeóricaFacultad Ciencias Económicas y EmpresarialesDepartamento de Economía Aplicada

Profesor: Santiago de la Fuente Fernández

ESTADÍSTICA TEÓRICA: CONTRATES DE HIPÓTESIS INTERVALOS DE CONFIANZA


RELACIÓN: INTERVALOS CONFIANZA - CONTRASTE HIPÓTESIS

Intervalo de confianza para la media de una distribuciónnormal ),(N de varianza conocida:

nzx

nzx

nz

nzx

nzx

nzx)(I

2

22

22muestralerror

2

muestralmedia

1

Hipótesis sobre la media de una población con 2 conocida : REGIÓN DE RECHAZO

00 :H 01 :H

nzxR 2/0 bilateral (compuesta)

00 :H 011 :H

nzxR 0 unilateral (simple)

00 :H 011 :H

nzxR 1

1zz

0 unilateral (simple)

Intervalo de confianza para la media de una distribución normal),(N de varianza desconocida con muestras pequeñas 30n

1n

txn

stx)(I x)1n(,

2

1n

2x

n

2xs

2xs)1n(2

xnmuestralerror

x)1n(,

2

muestralmedia

1

nstx

nst

nstx

nstx x

)1n(,2

x)1n(,

2

x)1n(,

2

x)1n(,

2

nstx x

)1n(,2

Hipótesis sobre la media de una población con 2 desconocida : REGIÓN DE RECHAZO

00 :H 01 :H

n

stxR x

)1n(;2/0 bilateral (compuesta)

00 :H 011 :H

n

stxR x

)1n(;0 unilateral (simple)

00 :H 011 :H

ns

txR x)1n(;1

n;1tn;t

0 unilateral (simple)


Intervalo de confianza para la diferencia de medias )( 21 de dos distribucionesnormales ),(N 11 , ),(N 22 con varianzas poblacionales conocidas:

muestralerror

2

22

1

21

2

muestraldiferencia

211 nnz)yx()(I

de donde,

2

22

1

21

221

2

22

1

21

221

2

22

1

21

2

nnz)()yx(

nnz)yx()(

nnz)yx(


Contraste de igualdad de medias de dos poblaciones normales con varianzas conocidas:REGIÓN DE RECHAZO

210 :H

2

22

1

21

2 nnz0)yx(R bilateral

k:H 210

2

22

1

21

2/ nnzkyxR bilateral

k:H 210

2

22

1

21

nnzkyxR unilateral

k:H 210

2

22

1

21

1 nnzkyxR unilateral

210 :H

2

22

1

21

nnzyxR unilateral

210 :H

2

22

1

21

1

1zz

nnzyxR unilateral

CONTRASTE HIPÓTESIS

Contraste de la media de una población normal ),(N con varianza 2 conocida:

a) CONTRASTE BILATERAL o DE DOS COLAS

Hipótesis nula: 00 :H Hipótesis alternativa: 01 :H

Como la hipótesis alternativa es 0 en la decisión que hayamos de tomar deberánser válidos los valores de mayores o menores que 0 , por lo cual el contraste debeser bilateral o de dos colas.

Regla de decisión

)chazoRegión(ReHnulahipótesislarechazasekxSi)Aceptacióngión(ReHnulahipótesislaaceptasekxSi

0

0

De otra parte, en la distribución del muestreo

n,Nx , que bajo la hipótesis nula

n,Nx 0 , con lo que la variable

nx 0

es N(0, 1).


El valor crítico k se calcula mediante el error de significación :

K

nx

Pn

,N/kxPciertaesH/HchazarReP 0000

22K

nx

PKn

xPK

nx

Kn

xP

)1,0(Nsimetría0000

La región crítica será

n

zxRzn

x202

0

En otras palabras,

Se acepta 0H si 20 zn

x

Se rechaza 0H si 20 zn

x

b) CONTRASTE UNILATERAL o DE UNA COLA

Hipótesis nula: 00 :H Hipótesis alternativa: 011 :H

Como la hipótesis alternativa es 01 en la decisión que hayamos de tomar solo sonválidos los valores de 1 mayores que 0 , por lo cual el contraste debe ser unilateral ode una cola.

Regla de decisión

)chazoRegión(ReHnulahipótesislarechazasekxSi)Aceptacióngión(ReHnulahipótesislaaceptasekxSi

0

0

De otra parte, en la distribución del muestreo

n,Nx

Bajo la hipótesis nula:

n,Nx 0

Bajo la hipótesis alternativa:

n,Nx 1


Para hallar el valor crítico K recurrimos al Error Tipo I:

K

nx

Pn

,N/kxPciertaesH/HchazarRePIETP 0000

La región crítica será

n

zxRzn

x0

0

En otras palabras,

Se acepta 0H si

z

nx 0

Se rechaza 0H si

z

nx 0

Contraste de igualdad de medias de dos poblaciones normales con varianzasconocidas

a) CONTRASTE BILATERAL o DE DOS COLAS

Hipótesis nula: 0:H 210 Hipótesis alternativa: 0:H 211

La regla de decisión será:

)RC(HrechazasekyxSi)RA(HrechazasenokyxSi

0

0

La región crítica de dos colas kyx es función de la diferencia de las mediasmuestrales. En esta línea, las distribuciones en el muestreo de las medias son:

1

11 n

,Nx ,

2

22 n

,Ny , con lo cual, la diferencia de medias muestrales,

bajo la hipótesis nula 0:H 210 , se distribuye:

2

22

1

21

nn,0Nyx

El valor crítico k se determina mediante el error tipo I:

0:H/kyxP)ciertaHHchazar(ReP)IET(P 21000


K

)n()n(

0)yx(P2

221

21

K

)n()n(

yxK)n()n(

yxP2

221

212

221

21

22

K)n()n(

yxPK)n()n(

yxP2

221

212

221

21

(simetría)

La región crítica es

22

221

21

z)n()n(

yx

2

22

1

21

2 nnz)yx(R

En otras palabras, se acepta la hipótesis nula 0H si: teórico

oestadístic

2

observadooestadístic

2221

21

z)n()n(

yx

se rechaza la hipótesis nula 0H si: teórico

oestadístic

2

observadooestadístic

2221

21

z)n()n(

yx

b) CONTRASTE UNILATERAL o DE UNA COLA

Hipótesis nula: o210 K:H Hipótesis alternativa: o211 K:H


)RC(Hrechazasek)yx(Si)RA(Hrechazasenok)yx(Si

0

0

La región crítica de una cola k)yx( es función de la diferencia de las mediasmuestrales. En esta línea, las distribuciones en el muestreo de las medias son:

1

11 n

,Nx ,

2

22 n


2

22

1

21

21 nn,)(Nyx , bajo la hipótesis nula o210 K:H ,

2

22

1

21

o nn,KNyx


El valor crítico K se determina mediante el nivel de significación :

o21000 K:H/k)yx(P)ciertaHHchazar(ReP)IET(P

)n()n(

KkzP)n()n(

Kk

)n()n(

K)yx(P2

221

21

o

2221

21

o

2221

21

o

con lo cual, el valor crítico se despeja

z)n()n(

Kk

2221

21

o .

Comprobando después si se verifica o no la evidencia empírica k)yx(

De otra parte, la región crítica

z)n()n(

K)yx(

2221

21

o

por tanto, la región de rechazo:

)n()n(zK)yx(R 2

221

21o


CÁLCULO DEL ERROR TIPO I, DEL TIPO II Y POTENCIA, DADAS LAS HIPÓTESIS SIMPLES

)ContrastePotencia(falsasiendoHnulahipótesislarechazardeadprobabilid

)IITipoError(falsasiendoHnulahipótesislaaceptardeadprobabilid

)ITipoError(ciertasiendoHnulahipótesislarechazardeadprobabilid

0

0

0

1

Los errores están relacionados, al disminuir el uno aumenta el otro:

1)ITipoError(HsiemprechazarRe0)IITipoError(

1)IITipoError(HsiemprechazarRe0)ITipoError(

PP

PP

0

1

Un contraste debería buscar simultáneamente el nivel de significación más bajoposible y la potencia 1 más alta posible.Fijado el nivel de significación, se determina la región de rechazo cuya potencia esmayor entre todos los contrastes cuyo tamaño sea el fijado a priori.

La única posibilidad para conseguir que un contraste mejore su potencia 1 , sinaumentar el nivel de significación , es incrementar el tamaño de la muestra.Al aumentar el tamaño de la muestra, varía la ley de distribución del estadístico decontraste, y generalmente disminuye la varianza. Generalmente, las propiedades delcontraste mejoran.

Antes de la universalización del ordenador se utilizaban como más representativos losvalores del 1%, 5%, y 10%. La metodología más razonable es tomar un nivel designificación de acuerdo con la experiencia y después obtener el llamado p-valor.


0

0

0

HrechazaSevalorp

HaceptaSevalorp

.actualmuestralaconHnulahipótesislarechazaríasetodavíaqueelpara,escogerpuedesequeposiblepequeñomásiónsignificacdenivel

SiSi

valorp

El p-valor es el menor que permite aceptar la hipótesis alternativa 1H .

El p-valor tiene la ventaja de permitir que se decida que hipótesis se acepta, esto no esposible cuando se indica sólo el resultado del contraste (si se acepta o se rechaza 0H

con un fijo.

En otras palabras, los CRITERIOS GENERALES para los CONTRASTES:

Calcular una cantidad experimental expQ a partir de los datos Calcular una cantidad teórica Q a partir de las tablas

Si QQexp Se acepta 0H Si QQexp Se rechaza 0H

EL NIVEL MÍNIMO DE SIGNIFICACIÓN (P-valor) es el error de la primeraregión crítica de rechazo. Es decir, el área que deja a la derecha la cantidadexperimental expQ


CÁLCULO DEL NIVEL DE SIGNIFICACIÓN. POTENCIA DEL CONTRASTE.

1. - La edición de un libro se considera buena si el número medio de erratas por páginano supera el 0,1 ( 0H ). Dadas las pruebas de imprenta, se eligen 10 páginas al azar, y serechazan las pruebas si se observan 2 ó más erratas. Se supone que el número deerratas por página sigue una distribución de Poisson.¿Qué nivel de significación tiene el contraste? ¿Con qué probabilidad se aceptara unlibro si realmente tiene una media de 0,2 erratas por página?

Solución:

Se tiene una muestra aleatoria )X,,X,X( n21 , de tamaño 10, donde X = ‘número de

erratas por página’, con ).(PX

Nos interesa el número medio de erratas por página )páginaporerratasNúmero(E.)X(E

La región de rechazo de la hipótesis nula:

10

1ii 2X2páginasdiezenerratasdetotalNúmeroR

El nivel de significación:

1,0:H2XP 0

10

1ii

Considerando que se verifica la hipótesis nula ( 1,0:H0 ), tenemos que

)11,0.10(PX10

1ii

, con lo cual:

2642,03679,03679,01

)1X(P)0X(P12XP112XP10

1i

10

1ii1i1

10

1ii1

10

1ii

Por otra parte, un libro que tiene generalmente una media de 0,2 erratas por página, es

un libro para el que 2,0 , con lo que )22,0.10(PX10

1ii

, por tanto la

probabilidad de aceptar un libro en estas condiciones es:

4060,02707,01353,0)1X(P)0X(P21XP10

1i

10

1ii2i2

10

1ii


CÁLCULO DEL NIVEL DE SIGNIFICACIÓN. POTENCIA DEL CONTRASTE.

2.- En una piscifactoría se desea contrastar la hipótesis nula de que el porcentaje depeces adultos que miden menos de 20 cm es, como máximo, del 10%. Para ello, se tomauna muestra de 7 peces, rechazando la hipótesis nula si se encuentra más de un pez conlongitud inferior a 20 cm. Se pide:

1. Nivel de significación del contraste.2. Calcular la potencia del contraste si en realidad hay un 20% de peces que miden

menos de 20 cm.

Solución:

1) Sea el parámetro p = ‘Proporción de peces adultos que miden menos de 20 cm’, enuna muestra aleatoria )X,,X,X( 721 , con )p,1(BX

La región de rechazo de la hipótesis nula:

17entre,cm20aeriorinflongitudconpecesdeNúmeroR

Considerando que se verifica la hipótesis nula ( 1,0p:H0 ), tenemos que la muestra

sigue una distribución binomial )1,0p,7n(B , con que el nivel de significación:

1497,03720,04783,011)1,0p,7n(BP0)1,0p,7n(BP1

1)1,0p,7n(BP11)1,0p,7n(BP

2) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000

La potencia del contraste, cuando 20,0p , donde la muestra sigue una distribuciónbinomial )2,0p,7n(B , viene dada por:

4233,03670,02097,011)2,0p,7n(BP0)2,0p,7n(BP1

1)2,0p,7n(BP11)2,0p,7n(BPoP


CÁLCULO DEL ERROR TIPO I, DEL TIPO II Y POTENCIA.

3.- Sea una variable aleatoria X procedente de una población con densidad deprobabilidad ).5,(N Efectuadas dos hipótesis sobre el valor de

15:H12:H 1100

mediante un muestreo aleatorio simple de tamaño 25, se contrasta la hipótesis 0H

respecto de la hipótesis 1H , estableciéndose que si la media muestral es menor que 14

se aceptaría la hipótesis nula. Determinar:a) La probabilidad de cometer el error tipo Ib) La probabilidad de cometer el error tipo IIc) La potencia del contraste

Solución:

Sea la variable aleatoria X )5,(N

Las hipótesis sobre la media poblacional (contraste unilateral):

15:H12:H

11

00

Regla de decisión

.)C.R(críticaregiónHaceptaseno14x.)A.R(aceptaciónregiónHaceptase14x

0

0

La distribución de la media muestral x , de tamaño 25, con la varianza poblacional252 conocida:

)1,15(N)255,15(N)

n,(Nx:H

)1,12(N)255,12(N)

n,(Nx:H

11

00

a) Error Tipo I: )ciertaH/Hchazar(ReP)IET(P 00

0228,0)2z(P)1

1214z(P)12:H14x(P)IET(P 00

0H se rechaza cuando es cierta el 2,28% de los casos


b) Error Tipo II: )falsaH/HAceptar(P)IIET(P 00

1587,0)1z(P)1z(P)1

1514z(P)15:H14x(P)IIET(P 11

0H se acepta cuando es falsa el 15,87% de los casos

c) Potencia del Contraste: 1)falsaHHchazar(RePPotencia 00

8413,01587,01)falsaHHchazar(ReP1 00

0H se rechaza cuando es falsa el 84,13% de los casos

Resaltar que es más grave cometer un Error Tipo I )( que un Error Tipo II )( .


4.- Las latas de mejillones de una determinada marca indican que el peso escurrido dedicho producto es de 250 gr. No obstante, un consumidor está convencido de que elpeso escurrido medio de dicho producto es menor que el que indican las latas. Si el pesoescurrido sigue una ley normal con desviación típica 9 gr.

a) Determinar, si existe, la mejor región crítica para contrastar la mejor regióncrítica, con un nivel de significación del 5% y muestras aleatorias simples detamaño 100.

b) Tomar una decisión acerca del rechazo o no de la hipótesis nula a partir de unamuestra aleatoria simple de tamaño 100 en la cual se ha observado un pesoescurrido promedio de 245 gr.

c) Determinar la función de potencia del contraste.

Solución:

a) Sea la variable aleatoria X = "peso escurrido de las latas de mejillones"

Se trata de un contraste unilateral:

250:H0 250:H1

La regla de decisión del muestreo:

.)C.R(Hrechazasekx.)A.R(Haceptasekx

0

0

La variable aleatoria X en el muestreo, bajo la hipótesis nula, sigue una distribución

1009,250N

El valor crítico k, bajo la hipótesis nula, se determina con el nivel de significación :

05,09,0250kzP

9,0250k

9,0250xP)9,0;250(N/kxP

)ciertaH/kx(P)ciertaH/Hchazar(ReP)IET(P 000

observando las tablas de la N(0,1), y considerando que 1zz , se tiene:

52,248k96,19,0250k

La región crítica más potente, para muestras de tamaño 100, es 52,248x


b) Dado que 52,248245x , el pesoescurrido promedio se encuentra en laregión de rechazo de la hipótesis nula.

c) La función potencia del contraste se establece como:

9,052,248

9,0xP)

1009;(N/kxP)52,248x(P)(P

2509,0

52,248zP


5.- Sea una variable aleatoria X procedente de una población con densidad deprobabilidad ).4,(N Se quiere contrastar la hipótesis nula 10:H 00 frente ala hipótesis alternativa 12:H 11 , con un nivel de significación 05,0 , con unmuestreo simple de tamaño 25.Determinar:a) La probabilidad de cometer el error tipo IIb) La potencia del contraste

Solución:

Sea la variable aleatoria X )4,(N

Las hipótesis sobre la media poblacional (contraste unilateral):

12:H10:H

11

00

Regla de decisión

.)C.R(críticaregiónHaceptasenokx.)A.R(aceptaciónregiónHaceptasekx

0

0

La distribución de la media muestral x , de tamaño 25, con la varianza poblacional162 conocida:

)8,0;12(N)254,12(N)

n,(Nx:H

)8,0;10(N)254,10(N)

n,(Nx:H

11

00

a) Para hallar el valor crítico 'k' recurrimos al Error Tipo I:

05,0)ciertaH/Hchazar(ReP)IET(P 00

05,0)8,010kz(P

)10:Hkx(P)IET(P 00

316,11K645,18,010k


Error Tipo II: )falsaH/HAceptar(P)IIET(P 00

)855,0z(P)8,0

12316,11z(P)12:H316,11x(P)IIET(P 11

1963,0)855,0z(P

b) Potencia del Contraste: 1)falsaHHchazar(RePPotencia 00

8037,01963,01)falsaHHchazar(ReP1 00


6.- Un agricultor sabe que el peso en kg. de las patatas sigue una distribución)1,(N . Una muestra de patatas dio un peso medio de 330 gramos. Con la muestra se

realizó un contraste, con un nivel de significación del 5% y una potencia de 0,6406, enel que la hipótesis nula era 4,0 Kg y la alternativa 3,0 Kg. Se pide:

a) ¿Cuál es el tamaño de la muestra utilizada por el agricultor?.b) Qué hipótesis fue aceptada

Solución:

a) Sea la variable aleatoria X = 'peso en kg. de las patatas". )1;(NX

Hipótesis sobre :

3,0:H4,0:H

11

00

Regla de decisión:

0

0

HchazoRe:C.RkxSiHAcepto:A.RkxSi

La distribución de la media muestral, bajo la hipótesis nula, sigue una ley

n1;4,0N

A partir del nivel de significación, se tiene:

)4,0kx(P)ciertaHkx(P)ciertaHHchazar(ReP 000

05,0n14,0k

n14,0xP

64,1

n14,0k)1;0(N

Por otro lado, como la potencia del contraste es 0,6406:

)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000

La media muestral, bajo la hipótesis alternativa, sigue una ley

n1;3,0N , con lo cual,

36,0n13,0k3594,0

n13,0kzP

n13,0k

n13,0xPPotencia )1;0(N


Resolviendo el sistema:

n36,03,0k

400n1,02nn

64,14,0k

Con el tamaño muestral 400n , es decir, el tamaño de la muestra de patatas utilizadapor el agricultor es de 400 patatas.

Se determina el valor crítico k: 318,0k64,14001

4,0k

b) La región crítica es de la forma 318,0x , lo que significa que se rechazará lahipótesis nula cuando el peso medio de la muestra de patatas sea igual o inferior a 318gramos. En consecuencia, se acepta la hipótesis nula de que el peso medio de las patatases de 400 gramos.


CONTRASTE UNILATERAL DE LA PROPORCIÓN. HIPÓTESIS SIMPLES.

7.- Un laboratorio farmacéutico quiere lanzar un nuevo medicamento para lahipertensión, llamado Hipotensil. El director de dicho laboratorio cree que la eficaciadel medicamento sería de un 95%, medida ésta como la proporción de pacientes a losque se les suministra y que experimentan una mejoría. Sin embargo, el inspector desanidad del Ministerio no es tan optimista y opina que la eficacia es sólo del 85%. Paraanalizar la eficacia del medicamento antes de su comercialización, se selecciona unamuestra aleatoria de 500 pacientes, a los que se les administra Hipotensil, de los cualesmejoran 467. ¿Tiene razón el director del laboratorio?.Suponga un nivel de significación del 5%.

Solución:

Sea la variable aleatoria X =’eficacia Hipotensil’ )p,1(B

Las hipótesis sobre la proporción (contraste unilateral):

85,0p:H95,0p:H

11

00

Regla de decisión para el valor crítico k

.)C.R(HrechazaSekp̂.)A.R(HrechazaseNokp̂

0

0

La distribución en el muestreo del estadístico

nq.p,pN

n

xp̂

.L.C.Tn

1ii

, en

consecuencia:

Bajo la hipótesis )00974,0;95,0(N500

05,0.95,0;95,0Np̂:H 00

Bajo la hipótesis )01597,0;85,0(N500

15,0.85,0;85,0Np̂:H 11

Se determina el valor crítico k a partir del nivel de significación :


05,0)00974,0

k95,0z(P

05,0)00974,0

95,0kz(P)kp̂(P)ciertaHHchazar(ReP)IET(P 00

Observando en las tablas de la normal ),1;0(N resulta:

9339,0)645,1.00974,0(95,0k645,100974,0

k95,0

Comparando el valor crítico 9339,0k con el valor del estadístico muestral p̂

(evidencia empírica), 934,0500467p̂ , se tiene:

9339,0934,0p̂ , por lo que no existe evidencia empírica suficiente para rechazar lahipótesis 0H . Es decir, se acepta la hipótesis 0H concluyendo que el Hipotensil es

eficaz en un 95% de los casos.


8.- Se trata de determinar si en una ciudad el 20% o el 30% de las familias disponede lavavajillas; para dilucidarlo se toma al azar una muestra de 400 familias de lamencionada ciudad y se adopta el criterio de si en la muestra hay menos de 100 familiascon lavavajillas, se rechaza que el 20% de las familias poseen el mencionadoelectrodoméstico. Se pide:

a) Nivel de significación del test.b) Potencia del test.

Solución:

a) Sea el parámetro p = "proporción de familias con lavavajillas"

Al realizar un contraste sobre una proporción, partimos de una muestra aleatoria)X,,X,X( n21 de tamaño 400n , donde )p;1(BX .

Para calcular la probabilidad interesa conocer la distribución del parámetro muestral

n

xp̂

n

1ii

donde

aslavavajilltienenofamilialasi0

aslavavajilltienefamilialasi1x i

Al ser el tamaño suficientemente grande (N = 400) y estar definido p̂ como suma devariables independientes según una distribución de Bernouilli )p;1(B , se puedeaproximar la distribución muestral de p̂ como :

nq.p,pN

n

xp̂x

.L.C.Tn

1ii

En el contraste: La hipótesis nula 2,0p:H 0 y la hipótesis alternativa 3,0p:H1

Por el lema de Neyman-Pearson, la regla de decisión del muestreo ( 25,0400100p̂ ):

.)C.R(Hrechazase25,0p̂.)A.R(Haceptase25,0p̂

0

0

Con la hipótesis nula 2,0p:H 0 : )02,0;2,0(N400

8,0.2,0,2,0Np̂

El nivel de significación , bajo la hipótesis nula, se determina, mediante el valorcrítico k = 0,25:


00621,05,2zP02,0

2,025,002,0

2,0p̂P)02,0;2,0(N/25,0p̂P

)ciertaH/25,0p̂(P)ciertaH/Hchazar(ReP)IET(P 000

b) Potencia del Contraste: 1)falsaHHchazar(RePPotencia 00


Con la hipótesis alternativa 3,0p:H1 : )0229,0;3,0(N400

7,0.3,0,3,0Np̂

1822,2zP

0229,03,025,0

0229,03,0p̂P)0229,0;3,0(N/25,0p̂P)IIET(P

0144,01822,2zP

En consecuencia, 9856,00144,01)falsaHHchazar(ReP1Pot 00


CONTRASTE UNILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL CONOCIDA.

9.- Las especificaciones de un tipo de báscula aseguran que los errores de los pesajessiguen una distribución ).,0(N Se quiere contrastar la afirmación sobre la dispersiónque es igual a la unidad, frente a una hipótesis alternativa de que es el doble. Para ellose realizan 5 pesajes en las que el error cometido resultó ser:

1 0,9 - 0,2 1,4 - 0,7

Para un nivel de significación del 5% se pide enunciar una regla de decisión (obtener laregión crítica) e indicar que hipótesis resulta aceptada.

Solución:

Sea la variable aleatoria X = ‘Errores en el peso’ ),0(NX

Hipótesis sobre :2

4:H1:H

211

200

Regla de decisión:

02x

02x

HAcepto:A.RkSiHchazoRe:C.RkSi

Por el Lema de Fisher: 21n2

2x

2

2x s)1n(n

con lo cual,

0H

24

21n

202

x 5n.

La determinación del valor crítico k a partir de (Error Tipo I):

)1k(P)ciertaHk(P)ciertaHHchazar(ReP 22x0

2x00

05,0)k5(Pk5

P 24

24

898,1k488,9k5Pearson2Tablas

Comparamos el valor crítico )898,1k( con la evidencia muestral, siendo:ix 1 0,9 - 0,2 1,4 - 0,7 48,05xx i 2ix 1 0,81 0,04 1,96 0,49 86,05x2

i 6296,0)5x()5x( 2

i2i

2x


Como 898,16296,O2x nos situamos en la región de

aceptación (R.A), no pudiendo rechazar la hipótesis de que ladispersión sea 1, con un nivel de confianza del 95%.

II Método

Regla de decisión

.)A.R(Haceptasek)x(Si

.)C.R(Hrechazasek)x(Si

0

5

1i

2i

0

5

1i

2i

Para calcular el valor de la constante k, determinando la región crítica de forma óptima,se parte del nivel de significación :

ciertaH/k)x(P)ciertaH/HchazarRe(P 0

5

1i

2i00

El estadístico

5

1i

2i )x( en el muestreo, bajo la hipótesis nula, donde las variables

aleatorias independientes ).,(Nx 0i En consecuencia, 0

ix

sigue una )1,0(N

2n

n

1i

2

0

ix

Recuerda que 2n 2

n22

21 XXX variables aleatorias

N(0, 1) independientes entre si

A partir del nivel de significación (Error Tipo I):

05,0kPciertaH/kxP)ciertaH/HchazarRe(P 2

5020

5

1i

2

20

i00

07,11k 25;05,0

El valor muestral del estadístico 3,4)0x(5

1i

2i

verifica que

k07,113,4)0x(5

1i

2i

, lo que conduce a no rechazar la hipótesis nula de que la

población sigue una )1,0(N , advirtiendo que se halla en la región de aceptación.


CONTRASTE UNILATERAL DE LA VARIANZA CON LA MEDIA POBLACIONAL CONOCIDA.POTENCIA DEL CONTRASTE.

10.- En una población ),5(N se quiere contrastar la hipótesis nula 2:H 20

20

frente a la hipótesis alternativa 3:H 21

21 , con un nivel de significación

025,0 , con una muestra aleatoria simple de tamaño 10:

5,1 6,2 4 2,8 2,9 5,6 3,7 3,4 2,5 5,2

Hallar la potencia del contraste.

Solución:

Hipótesis sobre :2

3:H2:H

211

200 2

021

Regla de decisión



0

10

1i

2i

0

10

1i

2i


ciertaH/k)x(P)ciertaH/HchazarRe(P 0

10

1i

2i00

El estadístico

10

1i


aleatorias independientes ix siguen una ley )2,5(N .

En consecuencia, 2

5xi sigue una )1,0(N . Por tanto, 210

10

1i

2i

25x

(Recuerda que 2n 2

n22

21 XXX variables aleatorias N(0, 1) independientes

entre si)

A partir del nivel de significación (Error Tipo I), calculamos el valor crítico k:

025,02kP

2k

25x

P)ciertaH/HchazarRe(P 210

10

1i

2i

00


966,40k483,202k 2

10;025,0

Por otra parte, el valor muestral del estadístico 6,22)5x(10

1i

2i

Siendo k966,406,22)5x(10

1i

2i

no se rechaza la hipótesis nula de que la

población sigue una )2,5(N .

La potencia del contraste:

)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000

267,0655,13P3966,40PciertaH/kP1 2

1021012

1

210

Abscisas Áreas

987,15665,13

987,15865,4

10,0x

10,090,0

267,0

122,11

80,0.322,210,0x

II Método

Hipótesis sobre :2

3:H2:H

211

200 2

021

Regla de decisión:

02x

02x



2x

2

2x s)1n(n

con lo cual,

n. 2

1n202

x

En el muestreo, bajo la hipótesis nula 220 , con tamaño muestral ,10n se tiene:

0H

29

21n

202

x 10.2

n.



2x00


025,0)k5(Pk10

.2P 2

9

29

8046,3k023,19k5Pearson2Tablas

Comparamos el valor crítico )8046,3k( con la evidencia muestral 5204,12x

Como 8046,35204,12x nos situamos en la región de aceptación (R.A), aceptando

la hipótesis de que la varianza es 2, con un nivel de confianza del 97,5%.

De otra parte, la potencia del contraste será:


En el muestreo, bajo la hipótesis alternativa 320 , con tamaño muestral ,10n se

tiene:

1H

29

21n

202

x 10.3

n.

252,0682,12PciertaH/8046,310

.3PPotencia 2

91

29

Abscisas Áreas

684,14682,12

684,14168,4

10,0x

10,090,0

252,0

516,10

80,0.002,210,0x


CONTRASTE UNILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL DESCONOCIDA.POTENCIA DEL CONTRASTE.

11.- En una población con distribución ),(N , con un nivel de significación del 1%,para contrastar la hipótesis nula 25:H 2

00 frente a la hipótesis alternativa

36:H 211 , se toma una muestra aleatoria de tamaño 16, con varianza igual a 27.

Hallar la potencia del contraste.

Solución:

Hipótesis simple sobre :2

36:H25:H

211

200 2

021

Regla de decisión

.)A.R(Haceptasek)xx(Si

.)C.R(Hrechazasek)xx(Si

0

16

1i

2i

0

16

1i

2i

Por el Lema de Fisher-Cochran:

21n2

2i

2

2i

2

2x

2

2x )xx(n

)xx(nns.)1n(

bajo la hipótesis nula, se tiene: 2152

0

16

1i

2i )xx(


ciertaH/k)xx(P)ciertaH/HchazarRe(P 0

16

1i

2i00

025,025kPciertaH/k)xx(


020

16

1i

2i

00

2,687k488,2725k 2

15;025,0

Por otra parte, el valor muestral 432)xx(2716

)xx( 16

1i

2i

16

1i

2i

2x


Siendo 2,687432 conduce a no rechazar la hipótesis nula de que la población sigueuna )5,(N , advirtiendo que se halla en la región de aceptación.

La potencia del contraste:

)ciertaH/Hchazar(ReP)falsaH/Hchazar(RePPotencia1 1000

287,009,19P36

2,687PciertaH/k)xx(P1 215

2151

16

1i

2i

Áreas Abscisas

10,0x

10,090,0

307,2209,19

307,22547,8

287,0

76,13

80,0.217,310,0x

II Método

Hipótesis sobre :2

36:H25:H

211

200 2

021

Regla de decisión:

02x

02x



2x

2

2x s)1n(n

con lo cual,

n. 2

1n202

x

En el muestreo, bajo la hipótesis nula 2520 , con tamaño muestral ,16n se tiene:

0H

215

21n

202

x 16.25

n.



2x00

01,0)k2516(Pk

16

.25P 2

15

215

778,47k578,30k

2516Pearson2

Comparamos el valor crítico )778,47k( con la evidencia muestral 272x

Como 778,47272x nos situamos en la región de aceptación (R.A), aceptando la

hipótesis de que la varianza es 25, con un nivel de confianza del 99%.


De otra parte, la potencia del contraste será:


En el muestreo, bajo la hipótesis alternativa 3620 , con tamaño muestral ,16n se

tiene:

1H

215

21n

202

x 16.36

n.

162,0235,21PciertaH/778,4716

.36PPotencia 2

151

215

Abscisas Áreas

307,22235,21

307,22547,8

10,0x

10,090,0

162,0

76,13

80,0.072,110,0x


CONTRASTE UNILATERAL DE LA VARIANZA DE UNA POBLACIÓN CON MEDIA POBLACIONALCONOCIDA Y DESCONOCIDA. POTENCIA DEL CONTRASTE.

12.- El retraso de salidas de vuelos sigue un normal ),(N . Los responsables de unaeropuerto afirman que el retraso medio es de 30 minutos con una desviación típica de5 minutos. A pesar de ello, una organización de consumidores manifiesta que se muestrade acuerdo de que los retrasos sigue una ley normal con media 30 minutos, pero que ladesviación típica es de 15 minutos. Se pide:

1. Contrastar con un nivel de significación del 5%, la hipótesis nulautosmin5:H0 frente a la alternativa utosmin15:H1 , a partir de una

muestra aleatoria simple de vuelos cuyos retrasos se adjuntan:32,3 36,4 35,2 38,9 39,3 38,4 51,5 36,429,3 39,2 43,4 30,2 37,4 42,6 40,1

2. Calcular la potencia del contraste anterior.3. ¿Cambia la decisión tomada en el apartado (1) si el retraso medio hubiera sido

desconocido?

Solución:

1. Hipótesis sobre :2

225:H25:H

211

200 2

021

Las hipótesis nula y alternativa son simples, con media poblacional conocida. El lema deNeyman-Pearson conduce a la regla de decisión:

Regla de decisión



0

15

1i

2i

0

15

1i

2i


cierta25:H/k)x(P)ciertaH/HchazarRe(P 2

00

15

1i

2i00

El estadístico

15

1i


aleatorias independientes ix siguen una ley )5,30(N .


En consecuencia, 5

30xi sigue una )1,0(N . Por tanto, 215

15

1i

2i

25x

A partir del nivel de significación (Error Tipo I):

05,025kPciertaH/

25k

530x


15

1i

2i

00

9,624k996,2425k 2

15;05,0

Por otra parte, el valor muestral del estadístico 02,1393)30x(15

1i

2i

Siendo k9,62402,1393)30x(15

1i

2i

se rechaza la hipótesis nula, el retraso

medio de la salida de los vuelos no sigue una )5,30(N .

Adviértase que la región de rechazo de la hipótesis nula:

2n;2

0

2n

1ii )x(

R

en este caso,

996,2472,55

25

)30x(R 2

15;05,0

215

1ii

la región de rechazo se

verifica, con lo que no se acepta la hipótesis nula, esto es, el retraso medio de salida delos vuelos no sigue una ley normal )5,30(N .

2. La potencia del contraste:

1)cierta225:HHchazar(ReP)falsaHHchazar(RePPotencia 211000

1777,2P225

9,624PciertaH/kP1 215

21512

1

215

3. Como se desconoce el valor de la media poblacional las hipótesis son compuestas, nopudiéndose aplicar el lema de Neyman-Pearson.En consecuencia, para obtener la región crítica es necesario utilizar el test de razón deverosimilitud, que conduce a la regla de decisión:


Regla de decisión

.)A.R(Haceptasek)xx(Si

.)C.R(Hrechazasek)xx(Si

0

15

1i

2i

0

15

1i

2i

Por el Lema de Fisher-Cochran 21n2

2xn

, bajo la hipótesis nula: 2

14

15

1i

2i

25

)xx(


25:H/k)xx(P)ciertaH/HchazarRe(P 2

00

15

1i

2i00

125,592k685,2325k05,0

25kP

25k

25

)xx(P 2

14

15

1i

2i

De otro lado, el valor muestral 396,423)xx(2264,2815

)xx( 15

1i

2i

15

1i

2i

2x

Siendo k125,592396,423)xx(15

1i

2i

no se rechaza la hipótesis nula, por

tanto, se cambia la decisión que se tomó en el apartado (1).

Adviértase que la región de rechazo de la hipótesis nula:

2)1n(;2

0

2n

1ii )xx(

R ,

en este caso,

685,2394,16

25

)xx(R 2

14;05,0

215

1ii

la región de rechazo no

se verifica, con lo que se acepta la hipótesis nula, esto es, el retraso medio de salida delos vuelos sigue una ley normal )5,30(N .


CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA DESCONOCIDA. CALCULAR YREPRESENTAR LA FUNCIÓN DE POTENCIA.

13.- El directorio de uno de los grandes operadores de Internet está considerando laposibilidad de ofrecer tarifa plana a sus clientes. Según sus conocimientos sobre eltema, sabe que está trabajando con una variable aleatoria que se distribuye como unanormal. Mantiene la hipótesis de que los hogares que tienen Internet se conectan conuna media de 5 horas mensuales. No obstante, existen otros estudios que sostienen queel tiempo de conexión es más alto. Para evaluar, a un 10% de significación, dichahipótesis, el directorio decide encuestar a una muestra aleatoria de 30 hogares,obteniendo una media de 5,34 horas de conexión, con una dispersión de 7,24 horas.

a) Formular el contraste a realizar.b) Determinar la mejor región crítica del contraste.c) ¿Se puede rechazar la hipótesis nula?d) Calcular y representar la función de potencia. ¿Qué representa la función depotencia?. Para facilitar los cálculos, suponer que el tamaño muestral es 300hogares.

Solución:

Sea la variable aleatoria X = ’conexión a Internet por hogares’ ),5(NX

a) Las hipótesis sobre la media poblacional con 2 desconocida:

Hipótesis sobre :

5:H5:H

11

00

Se trata de un contraste unilateral, siendo 1H compuesta.

b) Regla de decisión:

0

0

HAcepto:A.RkxSiHchazoRe:C.RkxSi

En el muestreo de una población normal con varianza desconocida, y desviación típica

muestral x , la variable: 1nx

t

1n

x

1n

tx x1n

c) Determinación de k a partir del nivel de significación :

)5kx(P)ciertaHkx(P)ciertaHHchazar(ReP 0000

10,024,7

29.)5k(tPk130

24,7t5P5k1n

tP 291300x

1n0


En las tablas de la t de Student: 311,1t 29;10,0 , con lo cual,

76,629

24,7.311,15k311,124,7

29.)5k(

Comparando k con el valor del estadístico muestral 34,5x0

El valor 76,634,5x0 , no pudiendo rechazar 0H , porlo que tiene razón el Directivo, el tiempo medio deconexión es de 5 horas.

Alternativamente, con el estadístico de contraste (valor experimental), la regiónde rechazo R viene dada por la expresión:

1ntx

n

stxR x

)1n(;0x

)1n(;0

763,134,02924,7311,1534,5R

29;10,0t

, no cumpliéndose la región de

rechazo, no existe evidencia significativa de rechazar la hipótesis 0H con un nivel deconfianza del 90%.

Una forma análoga de enfocar el problema consistiría en aceptar la hipótesis 0H cuando

el estadístico experimental fuera menor o igual que el estadístico teórico, es decir:

Se acepta 0H cuando se verifica: teóricooestadístic

1n;

erimentalexpoestadístic

x1n t

1n

xt

En este caso, 29;10,029 t311,12537,02924,7534,5t

, se acepta la hipótesis 0H

d) Potencia )falsaHHchazarRe(P)1( 00

La hipótesis 1H es compuesta (existen infinitos valores tal que > 5), se construye una

función, es decir:

5:H 11 1

Distintos valores

)Hkx(P)falsaHHAceptar(P)ciertaHHchazar(ReP)IIET(P 1

DecisióngiónRe

0011



muestral x , la variable: 1nx t

1n)x(

, siendo la muestra 300n , la

distribución se aproxima a una )1,0(N

76,6k

30nx

11n1

x1n11

1n.)k(tPHk

1ntP)Hkx(P

x

1 1n.)76,6(zP , en consecuencia:

5,5:H 11

9986,03zP24,7

299.)5,576,6(zP1n.)76,6(

zPx

1

6:H 11

9656,082,1zP24,7

299.)676,6(zP

7:H 11

2843,057,0zP24,7

299.)776,6(zP

8:H 11

00154,096,2zP24,7

299.)876,6(zP

5:H 11 1

5,5 0,9986 0,00146 0,9656 0,00347 0,2843 0,71578 0,0015 0,9985

A medida que se alejan las hipótesis 0H y 1H aumenta la potencia del contraste. Es

decir, cuanto más alejadas se encuentren las hipótesis para contrastar, mayor será laprobabilidad de que se rechace 0H cuando sea falsa, algo deseable (constante y k).


14.- El propietario de un automóvil sospecha que su vehículo tiene un consumo mediode combustible en carretera superior a los 5,6 litros /100 Km., que es lo que elfabricante indica en su publicidad. Para apoyar empíricamente su sospecha observa elconsumo medio en 11 viajes seleccionados aleatoriamente entre todos los que realiza enel año, obteniendo los siguientes resultados:

6,1 6,5 5,1 6 5,9 5,2 5,8 5,3 6,2 5,9 6,3Se pide:

a) ¿Están fundadas las sospechas del propietario a un nivel de significación del 1%?b) ¿En cuántas ocasiones debería observarse el consumo medio para que con un nivel

de confianza del 99% se detectase un consumo medio de 5,9 litros/100 km.?

Solución:

a) Suponemos que el consumo medio del automóvil sigue una distribución normal ),(N , ambos parámetros desconocidos, y mientras el fabricante afirma que 6,5:H 0 el propietario del vehículo cree que 6,5:H1 . Se trata, pues, de un contraste unilateral, donde 1H es compuesta.

Regla de decisión:

0

0

HchazoRe:C.RkxSiHAcepto:A.RkxSi

En el muestreo de una población normal con varianza desconocida, desviación típica

muestral ( x ), cuasidesviación típica ( xs ), la variable: 1nxx

t1n

xns

x

Bajo la hipótesis nula, con los datos muestrales ( 8454,5x , 4612,0s x ), el

muestreo sigue una distribución )1390,0;6,5(t11

4612,0;6,5t 1010

El valor crítico k, bajo la hipótesis nula, se calcula a partir del nivel de significación :

)6,5kx(P)ciertaHkx(P)ciertaHHchazar(ReP 0000

764,21390,0

6,5k01,01390,0

6,5ktP1390,0

6,5k1390,0

6,5xP 10

de donde, 9842,5k . Siendo 9842,58454,5x no se puede rechazar la hipótesisnula 0H , con lo que se acepta las afirmaciones del fabricante sobre el consumo mediodel automóvil.b) En esta ocasión se plantea la cuestión )9,5/kx(P


Donde el tamaño muestral es desconocido, y donde el estadístico 10x

tns9,5x

no

sigue un t-Student con 10 grados de libertad.

Por tanto, recurrimos a la siguiente estrategia:

764,2

ns3,09,5xP9,5/764,2

ns6,5xP)9,5/kx(P

xx

99,0ns

3,0764,2ns9,5xP764,2

ns3,0

ns9,5xP

xxxx

o bien, 01,0ns

3,0764,2ns9,5xP

xx

Nos encontramos en un punto donde no se pueden utilizar las tablas de la t-Sudentporque no conocemos el tamaño de la muestra. Para ello, suponemos que el tamaño essuficientemente grande para que pueda ser aceptable la aproximación de la t mediantela distribución normal.Con la aproximación normal, y con la simetría de la N(0, 1):

327,2ns

3,0764,201,0ns

3,0764,2zPxx

2x

x 3,0s.)091,5(

n091,5ns

3,0

Otra vez en un callejón sin salida, aún es necesario conocer la cuasidesviación típica deuna muestra sin saber su tamaño. Podemos dar una salida, suponiendo que lacuasidesviación típica de esta nueva muestra es igual a la obtenida en la muestraanterior 4612,0s x . En este caso,

255,613,0

)4612,0(.)091,5(n2

Para mayor seguridad en el logro de nuestro objetivo, redondeamos con el enteroinmediato superior, esto es, el tamaño de la muestra es 62.


CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA CONOCIDA.

15.- El número de averías de un determinado tipo de avión se considera una variablealeatoria con distribución de Poisson de media 2 averías al mes. El equipo demantenimiento intenta reducir esta media incorporando algunas mejoras. Paracomprobar si con estas medidas se reduce el número medio de averías, se decideobservar el número medio de averías en los 25 meses siguientes a la introducción de lasmejoras. Si el número medio de averías en esos 25 meses fue de 1,5. ¿Qué decisióndebe adoptar el servicio técnico a un nivel de significación del 1%?. ¿Y si el serviciotécnico relaja su nivel de exigencia al 85% de confianza?. ¿Cambiaría su decisión?.

Solución:

Sea la variable aleatoria X = ‘Número de averías al mes’

)2,2(N)2(PXn

En la muestra de tamaño 25n meses 5,1xˆ averías. La distribución en el

muestreo, bajo la hipótesis nula 0H ,

252,2N

n,Nx

Es un contraste unilateral, donde se plantean las hipótesis:

)compuesta(2:H2:H

1

0 ,

donde la regla de decisión, existe

)RC(HrechazasekxSi)RA(HrechazasenokxSi

k0

0

Se determina el valor de k considerando el nivel de significación :

34,1kz32,225/2k201,0

25/2k2zP

01,025/22kzP)2:H/kx(P)ciertaHHchazar(ReP

01,0

000

Se advierte que ( 34,15,1 ), cae en la región de aceptación, con lo cual se acepta lahipótesis nula, esto es, con un nivel de significación del 1% se afirma que las averíasmensuales se mantienen siendo 2, y en consecuencia, las mejorías no son operativas.

Si 15,0 se replantean los cálculos: 71,1kz04,125/2k2

15,0

Como 34,171,1 , cae en la región de rechazo, con lo que no se acepta la hipótesis nula,y se concluye que las mejoras son operativas.


CONTRASTE UNILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL DESCONOCIDA.

16.- La concentración media de dióxido de carbono en el aire en una determinada zonano es habitualmente mayor que 355 p.p.m.v (partes por millón en volumen). Se sospechaque esta concentración es mayor en la capa de aire más próxima a la superficie.Para contrastar esta hipótesis se analiza aire en 20 puntos elegidos aleatoriamente auna misma altura del suelo. Los datos recogidos tienen una media muestral de 580p.p.m.v y una cuasidesviación típica muestral de 180.Suponiendo que las mediciones siguen una distribución normal, ¿podemos afirmar a unnivel de 0,01, que los datos proporcionan suficiente evidencia estadística a favor de lahipótesis de que la concentración es mayor cerca del suelo?.Indicar razonadamente si el p-valor es mayor o menor que 0,01

Solución:

Tenemos una muestra aleatoria )X,,X,X( n21 de tamaño 20n , donde lavariable aleatoria X = "concentración de dióxido de carbono en puntos cercanos alsuelo" sigue una distribución normal );(NX con varianza poblacional desconocida.

Deseamos comprobar si hay suficiente evidencia estadística a favor de que335 . Para ello, planteamos un contraste con la hipótesis nula 335:H0 frente a

la hipótesis alternativa 335:H1 , con un nivel de significación 01,0

En esta línea, nos encontramos ante un contraste unilateral (una cola) para la mediapoblacional con varianza poblacional desconocida.

Se rechaza la hipótesis nula si se verifica la región de rechazo:

ns

txR x)1n(;0

donde, 225355580x 0

19,10220

180539,2

ns

tt x19;01,0)1n(;

Como 19,102225R SI se verifica la condición de rechazo, por tanto,RECHAMOS la hipótesis nula 0H .En consecuencia, existe suficiencia estadística (con un nivel de significación 0,01) paraconcluir que la concentración media de dióxido de carbono es superior a 355 cerca delsuelo.


Por otra parte, el p-valor se interpreta como el apoyo que los datos proporcionan a lahipótesis nula 0H .

En otras palabras, Cuando el p-valor < SE RECHAZA 0H

Como hemos rechazado 0H con 01,0 , el p-valor < 0,01


CONTRASTE BILATERAL DE LA PROPORCIÓN.

17.- Un dentista afirma que el 40% de los niños de 10 años presentan indicios de cariesdental. Tomada una muestra de 100 niños, se observó que 36 presentaban indicios decaries.Contrastar la hipótesis del dentista para un nivel de confianza del 90%.

Solución:

Sea el parámetro p = "proporción de niños que presentan indicios de caries dental".

Como siempre que queremos hacer un contraste sobre una proporción, partimosde una muestra aleatoria )X,,X,X( n21 de tamaño 100n , donde )p;1(BX .

La distribución en el muestreo del estadístico

nq.p,pN

n

xp̂x

.L.C.Tn

1ii

Recurrimos al contraste de la hipótesis nula 40,0p:H 0 frente a la hipótesisalternativa 40,0p:H1 , con un nivel de significación 10,0

La Hipótesis nula se rechaza cuando se verifica la región de rechazo:

n)p1(p

zpxR 0020

donde,

04,040,01003640,0p̂px 0

08,0)0489898,0(.)64,1(100

)40,01(40,0zn

)p1(pz 05,0

002

por tanto, 08,004,0R NO se verifica la condición de rechazo y aceptamos lahipótesis nula 0H . En consecuencia, con un nivel de significación de 0,10, se puedeafirmar que el 40% de los niños presenta indicios de caries dental.


18.- En los días previos a unas elecciones municipales, el candidato de un partidopolítico está convencido de obtener el 60% de los votos electorales. No obstante, supartido encarga una encuesta entre 100 votantes potenciales, resultando que el 52% deellos dijeron tener intención de votar a dicho candidato. Con un nivel de significacióndel 5%, se pide contrastar:

a) 60,0p:H 0 frente a 50,0p:H1

b) 60,0p:H 0 frente a 60,0p:H1

c) Potencia del contraste efectuado en el apartado (a).

Solución:

a) Sea la variable X ="% de votos al candidato"

Nos encontramos ante un contraste de hipótesis nula simple frente a una hipótesisalternativa simple: 60,0p:H 0 frente a 50,0p:H1

Regla de decisión:

.)C.R(HrechazaSekp̂.)A.R(HaceptaSekp̂

0

0

La distribución en el muestreo de

100

1iix

1001p̂ siendo

Novota0Sivota1

xi

donde se conoce p)p̂(E y que n

)p1(p)p̂(V .

Al ser el tamaño suficientemente grande 100n y estar definido p̂ como suma devariables aleatorias independientes, según una distribución de Bernouilli )p,1(B sepuede aproximar la distribución exacta de n)p1(.p,pNp̂

Bajo la hipótesis nula: )049,0;60,0(N100

)60,01(.60,0,60,0Np̂

El valor crítico K se determina, bajo la hipótesis nula, por el nivel de significación:


05,0049,0

60,0kzP049,0

60,0k049,0

60,0p̂P)6,0p:Hkp̂(P)IET(P 0

5186,0k645,1049,0

60,0k


En consecuencia, como la proporciónmuestral fue 52,010052xp̂ ,se encuentra dentro de la región deaceptación de la hipótesis nula.

b) En este caso, se trata de un contraste bilateral con hipótesis nula simple frente a una hipótesis alternativa compuesta: 60,0p:H 0 frente a 60,0p:H1

Regla de decisión:

.)C.R(HrechazaSekp̂.)A.R(HaceptaSekp̂

0

0

Bajo la hipótesis nula: )049,0;60,0(Np̂

Para determinar el crítico K, bajo la hipótesis nula, nos apoyamos en el nivel designificación:


05,0049,0

60,0K049,0

60,0p̂P)6,0p:HKp̂(P)IET(P 0

La región crítica: 504,0)96,1()049,0(60,0p̂

696,0)96,1()049,0(60,0p̂z96,1

049,060,0p̂

025,0

Como 52,010052xp̂ se encuentraen la región de aceptación, se acepta lahipótesis nula.

c) Potencia del Contraste: 1)falsaHHchazar(RePPotencia 00


Con la hipótesis alternativa 50,0p:H1 : )05,0;5,0(N100

5,0.5,0;5,0Np̂

35496,0)372,0z(P

05,05,05186,0

05,05,0p̂P)05,0;5,0(N/5186,0p̂P)IIET(P


Abscisas Areas0,37 - 0,38 0,3557 - 0,3520

0,372 - 0,38 x - 0,352035496,0

01,0)0037,0()008,0(3520,0x

6450,035496,011Potencia

También se podía haber realizado por la definición de potencia de un contraste:

6450,0)372,0z(P1)372,0z(P05,0

5,05186,005,0

5,0p̂P

)05,0;5,0(N/5186,0p̂P)falsaHHchazar(RePPotencia 00


19.- El dueño de los cines CINEFILÓN considera que, dado el aforo de la sala, unaafluencia diaria a la misma del 85% sería óptima, en el sentido de que los clientes sesientan cómodos y para que a la vez no haya pérdidas económicas. Durante un período detiempo, se analiza la afluencia a los cines, observándose que, en media, se ocupan 171 delas 200 butacas. ¿Con qué confianza podrá afirmar el dueño de CINEFILÓN que laasistencia a sus cines es óptima? ¿Qué pasaría si el dueño quisiera estar más seguro desu decisión, y ampliar el nivel de confianza al 99%?

Nota: La regla de la decisión adoptada es que si hay una desviación inferior al 5% de lacantidad óptima, se aceptaría la hipótesis de que la afluencia es, efectivamente, óptima.

Solución:

Sea la variable aleatoria X = '% asistencia diaria a los cines CINEFILÓN' , )p,1(BX .

- En el contraste bilateral se establecen las hipótesis:

85,0p:H85,0p:H 1100

- En el muestreo, la proporción que acude a los cines (200 butacas) en un día (nXp̂ ),

bajo la hipótesis nula, por el TCL (Teorema Central Límite), sigue una distribución

)025,0;85,0(N200

15,0.85,0,85,0Nnq.p,pN

- Se determina )1( a partir de los valores críticos, considerando que una desviacióninferior al 5% de la cantidad óptima significa que 90,0p̂80,0

0456,0028,0.22zPz2P025,0

85,090,0zz025,0

85,080,0P

)ciertaH/Hchazar(ReP 00

El nivel de confianza: 9544,00456,011

Si el nivel de confianza %1%991 (mayor exigencia).

El valor crítico k se determina a partir del nivel de significación 01,0


01,0025,0

85,0kzz

025,085,0k

P)ciertaH/Hchazar(ReP 2100

786,0k914,0k

z57,2025,0

85,0k2

1005,0

Comparando los valores críticos k con el valor del estadístico muestral (evidencia

empírica) 855,0200171p̂ , se observa que cae dentro de la región de aceptación (R.A.),

concluyendo que se acepta la hipótesis nula siendo óptima la afluencia a los cinesCINEFILÓN.


CONTRASTE BILATERAL DE LA VARIANZA CON MEDIA POBLACIONAL CONOCIDA.

20.- En una población ),10(N se desea contrastar la hipótesis nula 3:H 20

frente a la hipótesis alternativa 3:H 21 con un nivel de significación del 5%. En una

muestra aleatoria simple de tamaño 4 se obtuvieron los resultados:

10 8 12 14

Solución:

Hipótesis compuesta sobre :2

3:H3:H

21

20

Como la hipótesis alternativa es 32 en la decisión que tomemos deberán ser válidosvalores de 2 tanto mayores o menores que 3, por lo que el contraste debe serbilateral o de dos colas.

Regla de decisión:

02

4

1ii

02

4

1ii

HAcepto:A.Rk)x(Si

HchazoRe:C.Rk)x(Si

En la distribución en el muestreo del estadístico 24

1ii )x(

, las variables aleatorias

independientes ix se distribuyen ),10(N ; bajo la hipótesis nula )3,10(N :

4

1i

24

2i

4

1i

2

0

i

310xx

(suma de 4 variables aleatorias )1,0(N , independientes entre sí)

Fijado el nivel de significación (Error Tipo I), se halla el valor de la constante k:

05,0kPkP)k(kP

kPciertaH/k310x

PciertaH/HchazarReP

212241

242

241

24

240

4

1i

2i

00

)(

143,11k025,0kP

484,0k975,01kP1kP2

4;025,022224

24;975,0111

241

24


Región de rechazo:)143,11(484,0 2

424 )( ,

con lo que la región de aceptación esel intervalo 143,11;484,0 .

El estadístico muestral, bajo la hipótesis nula, 83

)10x( 24

1ii

, pertenece a la

región de aceptación, concluyendo que la varianza de la distribución es 3.

Análogamente,

Considerando la región de rechazo:

2n;2/

2n;2/12

0

2n

1ii

;)x(

R

El valor del estadístico muestral 24)x( 24

1ii

, bajo la hipótesis nula resulta:

83

24)x(

20

24

1ii

. Los valores tabulares son

143,11484,0

24;025,0

2n;2/

24;975,0

2n;2/1

La región de aceptación de la hipótesis nula es el intervalo 143,11;484,0 .

Al pertenecer el valor muestral del estadístico 8)x(

20

24

1ii

a la región de

aceptación, se concluye que la varianza de la distribución es 3.


CONTRASTE BILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL CONOCIDA.

21.- En una población )5,(N se quiere contrastar la hipótesis nula 18:H0 frentea la hipótesis alternativa 18:H1 , con un nivel de significación 01,0 , con unamuestra de tamaño 10:

16 12 15 16 20 25 14 18 17 22

Solución:

En el contraste se establecen las hipótesis:

18:H18:H

1

0 Como la hipótesis alternativa

es 18 en la decisión que hayamos de tomar deberán ser válidos valores de tantomayores o menores que 18, por lo cual el contraste debe ser bilateral o de dos colas.

Regla de decisión

.)A.R(HaceptasekxSi.)C.R(HrechazasekxSi

0

0

La muestra de tamaño 10, con media 5,17x 10

10

1iix

siendo la varianza poblacional

conocida 252 , bajo la hipótesis nula sigue una distribución )105,18(N , con lo que

la variable

105

18x es )1,0(N .

El valor de k se calcula mediante el nivel de significación 01,0 :

01,0K

10518xPK

10518xPK

10518xK

10518xP

K

10518xP)kx(P)ciertaHHchazar(ReP 00

La región crítica será:


93,13)575,2(10518x

07,22)575,2(10518x

zz575,2

10518x

005,02/

En consecuencia, la región de aceptación: 07,22x93,13

Como la media muestral 5,17x 10

10

1iix

está contenida en la región de aceptación, nose rechaza la hipótesis nula 18 , con un nivel de significación de 0,01.

Análogamente, la región de rechazo:

n.zxR 20rechazo

071,45,0105).575,2(185,17

105.z185,17R 05,0rechazo

No se verifica la región de rechazo, en consecuencia se admite la hipótesis nula 18 ,con un nivel de significación de 0,01.


CONTRASTE BILATERAL DE LA MEDIA CON VARIANZA POBLACIONAL DESCONOCIDA.

22.- En una población ),(N se quiere contrastar la hipótesis nula 2:H0 frentea la hipótesis alternativa 2:H1 , con un nivel de significación 01,0 , con unamuestra aleatoria simple de tamaño 15:

2,1 2,25 3,01 2,92 2,98 3,08 3,8 3,952,75 2,74 3,16 2,56 3,15 2,65 3,12

Solución:

En la muestra se obtiene:

948,215

xx

15

1ii

2264,0

15

)xx(15

1i

2i

2x

2426,0

14

)xx(s

15

1i

2i

2x

476,0x 493,0sx 15n

Como la hipótesis alternativa es 2 en la decisión que hayamos de tomar deberán serválidos valores de bien sean mayores o menores que 2, por lo cual el contraste debeser bilateral o de dos colas.

Regla de decisión:

.)A.R(HaceptasekxSi.)C.R(HrechazasekxSi

0

0


muestral x , la variable 1nxx

t

ns

x

1n

x

Con el nivel de significación 01,0 se determina la región crítica:

2/K1n

xP)H/kx(P)ciertaHHchazar(RePx

000

K14476,0

2xK14476,0

2xPK14476,0

2xP

14t


01,022

K14476,0

2xPK14476,0

2xP

1414 tt

La región crítica es: 14;005,0)1n(;2/ tt977,214476,0

2x

, con lo cual,

622,1)14476,0(.977,22x378,2)14476,0(.977,22x

977,214476,0

2x

La región de aceptación será: 378,2x622,1

Se observa que el valor del estadístico muestral 948,2x no se encuentra en laregión de aceptación, por tanto, se rechaza la hipótesis nula y se acepta que la mediade la distribución poblacional es distinta de 2.

Adviértase que rechazamos la hipótesis nula si se verifica la región de rechazo:

379,0948,015493,0977,22948,2

ns

txR14;005,0t

x)1n(;2/0

verificándose la región de rechazo, con lo cual no se acepta la hipótesis nula,concluyendo que se acepta la hipótesis alternativa de que la media de la distribuciónpoblacional es distinta de 2.

Una forma análoga de enfocar la cuestión consiste en aceptar la hipótesis nula2:H0 cuando el estadístico experimental fuera menor o igual que el estadístico

teórico, esto es:

teóricooestadístic

)1n(;2/

erimentalexpoestadístic

x

01n t

ns

xt

El estadístico de contraste: 447,715/493,02948,2

ns

xt

x

01n

El valor tabular del estadístico teórico: 977,2tt 14;005,0)1n(;2/

Como 14;005,01n t977,2447,7t se rechaza la hipótesis nula, concluyendo que lamedia de la distribución poblacional es distinta de 2.


23.- Se recibe un envío de latas de conserva de las que se afirma que el peso medioson 1.000 gr. Examinada una muestra de 5 latas se obtiene un peso medio de 995 gr. conuna cuasivarianza 6,19s2

x . Al nivel de confianza del 95%, ¿se puede aceptar que elpeso medio son 1.000 gr.?

Solución:

Tenemos una muestra aleatoria )X,,X,X( n21 de tamaño 5n , donde la variablealeatoria X = "peso de una lata de conserva", suponemos que sigue una distribuciónnormal );(NX con varianza poblacional desconocida.

Deseamos ver si resulta aceptable que 1000 . Para ello, planteamos un contrastecon la hipótesis nula 1000:H0 frente a la hipótesis alternativa 1000:H1 , conun nivel de significación 05,0

Adviértase que como la hipótesis alternativa 1000:H1 , en la decisión que hayamosde tomar deberán ser válidos valores de tanto mayores o menores que 1000, por loque el contraste debe ser BILATERAL o de dos colas.En esta línea, se rechaza la hipótesis nula si se verifica la región de rechazo:

ns

txR x)1n(;2/0

donde, 51000995x 0

50,55

6,19776,2

ns

tn

st x

4;025,0x

)1n(;2/

Como 5,55R NO se verifica la condición de rechazo, ACEPTAMOS la hipótesisnula 0H . En consecuencia, con un nivel de significación de 0,05, se puede afirmar que elpeso medio son 1000 gramos.


CONTRASTE BILATERAL DE LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALESCONOCIDAS.

24.- El análisis laboral que la U.E ha realizado para toda Europa, señala que en España,el salario mensual de los varones, en algunos sectores económicos, supera en más de 100euros el salario de las mujeres que desempeñan las mismas tareas.El Ministerio de Trabajo español decide considerar el salario mensual como una variablealeatoria normalmente distribuida con desviación típica de 39,6 euros para lostrabajadores masculinos y de 36 euros para las trabajadoras de dichos sectores, siendoel salario de cada población independiente del de la otra. Para tratar de verificar lopublicado, se elige una muestra aleatoria simple de 500 trabajadores y de 700trabajadoras, obteniéndose unos salarios medios mensuales de 1.500 y 1.370 eurosrespectivamente.¿Está fundamentada las conclusiones de la U.E al 1% de significación?

Solución:

Sean las variables aleatorias, respectivamente, X = ‘Salario mensual de los varones’ eY = ‘Salario mensual de las mujeres’, donde )6,39,(NX x e )36,(NY y .

En las muestras se obtuvieron los resultados:

700n€370.1y

500n€500.1x

y

x

- En el contraste se establecen las hipótesis:

)compuesta(100:H100:H yx1yx0


)RA(Hrechazasenok)yx(Si)RC(Hrechazasek)yx(Si

0

0

- La diferencia de medias muestrales )yx( , siendo las varianzas muestralesconocidas, bajo la hipótesis nula, sigue una distribución:

)23,2;100(N70036

5006,39;100N

nn;)(N

22

y

2y

x

2x

yx

- Se determina el valor de k mediante el nivel de significación :


€2,105kz32,223,2100k

01,023,2100kzP)100:H/kyx(P)ciertaHHchazar(ReP

01,0

yx000

La evidencia empírica €130370.1500.1yx . Se advierte que 2,105130 ,cae en la región de rechazo, con lo cual no se acepta la hipótesis nula, esto es, con unnivel de significación del 1%, se afirma que con el mismo trabajo las diferencias salariasentre hombres y mujeres en algunos sectores económicos españoles son superiores a100 euros mensuales.


25.- Con un nivel de significación del 4,72%, se desea contrastar la hipótesis nula deigualdad de medias de dos poblaciones )4,(N 1 y )5,4,(N 2 . Para ello, se hantomado dos muestras aleatorias simples e independientes, respectivamente,obteniéndose los siguientes valores:

ix 20,4 10,2 7,3 12,8 13,4 9,4jy 19,8 9,7 14,6 15.7 8,4

Solución:

En el contraste bilateral se establecen las hipótesis

0:H0:H

211

210

Regla de decisión

0

0

HaceptasekyxSiHrechazasekyxSi

Para analizar el contraste, se realizan los cálculos muestrales:

5n6n64,135

yy25,12

6

xx 21

5

1jj

6

1ii

La región crítica de dos colas kyx es función de la diferencia de las mediasmuestrales. En esta línea, las distribuciones en el muestreo de las medias son:

1

11 n

,Nx ,

2

22 n


bajo la hipótesis nula 0:H 210 , se distribuye:

59,2,0N55,4

64,0N

nn,0Nyx

22

2

22

1

21

Se determina el valor de k mediante el nivel de significación :

0:H/kyxP)ciertaHHchazar(ReP 21000

)1,0(Nsimetríapor05,022

K59,2

yxPK59,2

yxP

K59,2

yxK59,2

yxPK59,2

0)yx(P


La región crítica es 17,5yx

17,5yxz995,1

59,2yx

0236,0

En consecuencia, la región de aceptación: 17,5yx17,5

La evidencia empírica 39,164,1325,12yx , valor que no se encuentra en laregión de rechazo, por lo que se acepta la hipótesis nula de igualdad de medias, con unnivel de significación del 4,72%.

Análogamente, la región de rechazo de la hipótesis nula 0H :

55,4

64)995,1(64,1325,12R

nnzyxR

22

2

22

1

21

2

La región de rechazo de la hipótesis nula no se cumple, 17,539,1R , se concluyeque existe igualdad entre las medias poblacionales.

Cálculo de 0236,0z :

Abscisas Áreas

99,1x

99,198,1

0233,00236,0

0233,00239,0

995,1

0006,00003,0.01,0

99,1x


26.- Una empresa dedicada a la fabricación de artículos deportivos dispone de dosmáquinas para el inflado de balones. La presión en kg a la que son inflados los balones esuna variable aleatoria X con distribución )25,0;(N .Se desea contrastar con un nivel de significación del 5%, la hipótesis de que los balonesinflados con las dos máquinas tienen igual presión media. Para ello, se toman dosmuestras aleatorias simples de balones con las siguientes presiones de inflado:

Máquina 1 3 5 6 4 3 5Máquina 2 5 4 3 7 6 5 4 7 4

¿Cuál es el resultado del contraste?

Solución:

Sean las variables aleatorias X = ‘presión en kg que son inflados los balones en lamáquina 1’ e Y = ‘presión en kg que son inflados los balones en la máquina 2’,respectivamente, las variables aleatorias siguen distribuciones )25,0;(N 1 e

)25,0;(N 2 .La presión media con que son inflados los balones en las máquinas respectivas se

distribuyen con parámetros:

625,0;Nx 1 e

925,0;Ny 2

Se desea contrastar la hipótesis nula de que las presiones medias de inflado con ambasmáquinas son iguales: 210 :H frente a la hipótesis alternativa 211 :H

Como la hipótesis alternativa es 21 en la decisión que tengamos que tomar debenser válidos valores mayores o menores que 2 , con lo que el contraste debe serbilateral o de dos colas.


)RA(HrechazasenokyxSi)RC(HrechazasekyxSi

0

0

Para analizar el contraste se realizan los cálculos:

9n6n59

y

y33,46

xx 21

9

1jj

6

1ii

- En las distribuciones del muestreo

625,0,Nx 1 ,

925,0,Ny 2 , con lo cual,

la diferencia de medias muestrales, bajo la hipótesis nula 210 :H , se distribuye:


)13,0;0(N925,0

625,0;0N

nn,0Nyx

22

2

22

1

21

- Se determina el valor de k mediante el nivel de significación :

0:H/kyxP)ciertaHHchazar(ReP yx000

)1,0(Nsimetríapor05,022

K13,0

yxPK13,0

yxPK13,0

yxK13,0

yxPK13,0

0)yx(P

La región crítica es 255,0yx

255,0yxz96,1

13,0yx

025,0

En consecuencia, la región de aceptación: 255,0yx255,0

La evidencia empírica 67,0533,4yx , valor que se encuentra en la región derechazo, por lo que no se acepta la hipótesis de que los balones inflados con las dosmáquinas tienen igual presión media.

Análogamente, la región de rechazo de la hipótesis nula 0H :

925,0

625,0)96,1(533,4R

nnzyxR

22

2

22

1

21

2

Se verifica la región de rechazo de la hipótesis nula, 255,067,0R , concluyendoque los balones inflados con las dos máquinas no tienen igual presión media.


CONTRASTE BILATERAL – UNILATERAL DE DIFERENCIA DE MEDIAS CON VARIANZASPOBLACIONALES CONOCIDAS.

27.- Una empresa ubicada en Madrid tiene dos conductores para trasladar a losempleados a Segovia. Los conductores deben anotar la duración de cada trayecto. Enuna muestra aleatoria simple de 50 partes de incidencias por conductor, el conductor Aregistra un tiempo medio de trayecto de 62,30 minutos con una desviación típica de10,325 minutos, mientras que el conductor B tiene un tiempo medio de trayecto de60,02 minutos con una desviación típica de 8,625 minutos.El tiempo medio empleado por el conductor A en el trayecto sigue una ley normal

)9,(N 1 y el empleado por el conductor B se distribuye según una ley )8,(N 2 . Con unnivel de significación del 5%, se pide contrastar:1. 210:H frente a 211:H

2. 2:H 210 frente a 2:H 210

Solución:

1. Para realizar el contraste bilateral planteado ( 0 1 2H : ) se recurre al test razónde verosimilitud, ya que, en este caso el lema de Neyman-Pearson no proporciona unaregión crítica óptima.

La regla de decisión que proporciona el test de razón de verosimilitud es:

Regla de decisión: 0

0

x y k se acepta H (R.A.)

x y k se rechaza H (R.C.)

La región crítica de dos colas x y k es función de la diferencia de las mediasmuestrales. En esta línea, las distribuciones en el muestreo de las medias son:

11

1

x N ,n

, 22

2

y N ,n

Con lo cual, la diferencia de medias muestrales, bajo la hipótesis nula, se distribuye:

2 2 2 21 2

1 2

9 8x y N 0, N 0, N 0 , 1,7n n 50 50

El valor de k se determina a partir del nivel de significación 0,05

0 0 0 1 2P(Rechazar H H cierta) P x y k/H : 0


1 2k kk 0P z P z z1,7 1,7 1,7

1 2k k P z P z 0,05

1,7 1,7

por simetría

10, 025 1

20, 025 2

k 1,96 z k 3,331,7k 1,96 z k 3,33 1,7

Región de aceptación: 3,33 x y 3,33

La evidencia empírica x y 62,30 60,02 2,28 , valor que se encuentra en laregión de aceptación, por lo que se acepta la hipótesis nula de igualdad de medias, con loque los dos conductores emplean en promedio el mismo tiempo en el trayecto Madrid-Segovia, con una fiabilidad del 95%.

Se podía haber decidido con otros métodos:

Se formulan las hipótesis: 1 2 1 20 1H : 0 H : 0

Se trata de un contraste bilateral o de doscolas, con 0,05

La región de aceptación se encuentraen el intervalo /2 /2( z , z )

Se acepta la hipótesis nula cuando,

p p/2 /2 /22 21 2

1 2

x y 2,28z z z 1,34 1,961,7

n n

Se acepta que los dos conductores emplean en promedio el mismo tiempo en el trayectoMadrid-Segovia.

El intervalo de confianza para la diferencia de medias de dos distribucionesnormales con varianza poblacionales 2

1 y 22 conocidas


2 21 2

1 1 2 /21 2

I ( ) (x y) zn n

con lo cual, 0,95 1 2I ( ) 2,28 1,96 x 1,7 1,05 , 5,61

Como el intervalo cubre el cero no existe diferencia significativa entre el tiempoempleado por los dos conductores en el trayecto Madrid-Segovia.

2. La hipótesis nula planteada es 0 1 2H : 2 0 . Adviértase que se trata de uncontraste unilateral con cola a la izquierda 1 1 2(H : 2 0)

La regla de decisión que proporciona el test de razón de verosimilitud:


0

x y 2 k se acepta H (R.A.)x y 2 k se rechaza H (R.C.)

La región de aceptación se encuentraen el intervalo ( z , )

Se acepta la hipótesis nula cuando p 2 2

1 2

1 2

x y kz z

n n

O bien, Región de aceptación: 2 21 2

1 2

R.A (x y k) zn n

En este caso, p 2 2

62,30 60,02 2z 0,164 1,6459 850 50

2 29 8R.A (62,30 60,02 2) 1,645 0,28 2,80

50 50

Se acepta la hipótesis nula formulada.


CONTRASTE BILATERAL DE LA DIFERENCIA DE PROPORCIONES.

28.- Muebles Quintana realiza un estudio sobre la satisfacción de sus empleados endistintas secciones. En una muestra aleatoria simple de 100 trabajadores de barnizado60 se encuentran satisfechos y de otra de 200 trabajadores de cortado semanifestaron satisfechos 125. ¿Existen diferencias en los porcentajes de trabajadoressatisfechos de ambas secciones, con un nivel de significación del 5%?

Solución:

Sean las variables aleatorias X = ‘trabajador de la sección de barnizado’ e Y =‘trabajador de la sección de cortado’, respectivamente, las variables aleatorias toman elvalor uno si el trabajador está satisfecho, y el valor cero en caso contrario.Las dos variables aleatorias siguen una distribución de Bernouilli de parámetro pdesconocido.

Las proporciones muestrales obtenidas son: 625,0200125p̂6,0

10060p̂ yx

Se contrasta la hipótesis nula de que no existen diferencias entre las proporciones detrabajadores satisfechos en ambas secciones, es decir, yx0 pp:H ; frente a la

hipótesis alternativa de que si existen diferencias, esto es, yx1 pp:H . El contraste

debe ser bilateral o de dos colas.


)RA(HrechazasenokppSi)RC(HrechazasekppSi

0yx

0yx

La diferencia de las proporciones muestrales )p̂p̂( yx , teniendo en cuenta el tamaño delas muestras (TCL), bajo la hipótesis nula, podemos considerar que siguen una

distribución 06,0;0N200

375,0.625,0100

4,0.6,0,0Nn

q̂.p̂n

q̂.p̂,0N

y

yy

x

xx

Se determina el valor de k mediante el nivel de significación :

K

06,00)p̂p̂(

P0pp:H/kp̂p̂P)ciertaHHchazar(ReP yxyx0yx00

05,022

K06,0

p̂p̂PK

06,0p̂p̂

PK06,0

p̂p̂K

06,0p̂p̂

P yxyxyxyx

La región crítica es

1176,0p̂p̂1176,0p̂p̂

z96,106,0

p̂p̂

yx

yx025,0

yx


Región de aceptación de la hipótesis nula: 1176,0p̂p̂1176,0 yx

La evidencia empírica (estadístico observado)025,0625,06,0p̂p̂ yx se encuentra en la

región de aceptación, por lo que se admite lahipótesis nula, es decir, no aparecen diferenciassignificativas en los porcentajes de trabajadoressatisfechos en las secciones de Muebles Quintana, con una fiabilidad del 95%.

Análogamente, analizando la región de rechazo:

025,0625,06,0p̂p̂ yx 96,1z 025,0

1176,0200

375,0.625,0100

4,0.6,0.96,1

y

yy

x

xx2yx n

q̂.p̂n

q̂.p̂zp̂p̂R

1176,0025,0 , por lo que no se cumple la región de rechazo, aceptándose la hipótesisnula con un nivel de significación del 5%.


CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS CON MEDIAS POBLACIONALESDESCONOCIDAS.

29.- Una empresa productora de cemento ensaya productos químicos para mejorar laresistencia de las piezas de hormigón. Para ello, desea contrastar con un nivel designificación del 5% la resistencia de dos muestras aleatorias simples, la muestra A noes tratada con productos químicos mientras que la muestra B se encuentra tratada.En la tabla adjunta se muestra la resistencia de las piezas ensayadas en kg/cm2:

Muestra A 350 370 340 355 365 347Muestra B 348 363 372 360 359 365 361

Suponiendo que las dos muestras siguen una distribución normal, indicar si eltratamiento con productos químicos consiguió una mejora en la resistencia de las piezasde hormigón.

Solución:

Sea la variable aleatoria X que representa la resistencia de las piezas de hormigón sintratar con productos químicos, suponemos que X es una variable aleatoria normal demedia poblacional 1 desconocida y desviación típica poblacional 1 tambiéndesconocida. Análogamente, la variable aleatoria Y representa la resistencia de laspiezas de hormigón tratadas con media poblacional 2 y desviación típica poblacional

2 , ambas desconocidas.

Deseamos contrastar la hipótesis nula de que las resistencias esperadas son iguales,210 :H , frente a la hipótesis alternativa de que las resistencias esperadas de las

piezas sin tratar es menor que las tratadas, es decir, 211 :H .

Como se trata de muestras pequeñas necesitamos comprobar estadísticamente si lasvarianzas poblacionales 2

1 y 22 son iguales, planteando primero el siguiente contraste:

CONTRASTE BILATERAL DE IGUALDAD DE VARIANZAS POBLACIONALES CON MEDIASPOBLACIONALES DESCONOCIDAS:

22

211

22

210 :H:H

Región de rechazo de la hipótesis nula:

)12n(),11n(;2)12n(),11n(;2122

21 F;F

ss

R

análogamente, región de aceptación: )12n(),11n(;222

21

)12n(),11n(;21 Fss

F

ó el equivalente,


región aceptación 0H : )12n(),11n(;2m

1j

2j

n

1i

2i

)12n(),11n(;21 F)yy()1n(

)xx()1m(F

En nuestro caso, con los datos muestrales:

1432,0

99,5F98,61

F1F

43,2ssF

476,526

)yy(s14,361y7n

5,1275

)xx(s5,354x6n

6,5;025,0

5,6;025,06,5;975,0

22

216,5

7

1j

2j

222

6

1i

2i

211

Se observa que el estadístico experimentalde contraste 43,2F 6,5 se encuentra en la

región de aceptación de la hipótesis nula,6,5;025,06,5;975,0 F99,543,21432,0F ,

con lo que concluimos que, con un nivel designificación del 5%, no hay evidencias deque la resistencia de las piezas tratadas conproductos químicos presente una varianza distinta de aquellas piezas que no fuerontratadas.

CONTRASTE UNILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZASPOBLACIONALES DESCONOCIDAS PERO IGUALES:

Planteamos la hipótesis nula 210 :H frente a la hipótesis alternativa 211 :H


21

p)22n1n(; n1

n1st)yx(R ,

o lo que es igual, se acepta 0H si

teóricooestadístic

)22n1n(;

contrasteoestadístic

21p

tn1

n1s

)yx(t

muestralianzavarcuasi

21

222

2112

p 2nns)1n(s)1n(

s

En nuestro caso,


796,1tt

2832,1

71

6158,86

14,3615,354t

58,8611

476,52.65,127.5s

476,52s14,361y7n

5,127s5,354x6n

11;05,0)22n1n(;2p

222

211

El estadístico empírico (contraste) es menor que el estadístico teórico,11;05,0t796,12832,1t , con un nivel de significación del 5% se acepta la

hipótesis nula, concluyendo que no se aprecia en la primera muestra una resistenciamedia significativa menor que en la segunda muestra tratada. Esto es, el tratamientoquímico no presenta mayor resistencia en las piezas de hormigón.


CONTRASTE BILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZASPOBLACIONALES DESCONOCIDAS.

30.- Un instituto de alimentación animal quiere comparar estadísticamente dos tiposde dietas. Selecciona al azar una muestra de quince animales de una población deanimales comparables. A nueve de ellos se les suministra la dieta primera y a los seisrestantes la dieta segunda. Los resultados del aumento de peso en kg en una semana sonlos siguientes:

Dieta primera 3,75 4,2 4,6 3,95 4,1 3,9 4,3 3,9 4Dieta segunda 3,6 4,5 4,4 3,2 4 3

Con un nivel de significación del 10%, ¿puede afirmarse que la dieta primera es mejorque la segunda?

Solución:

Suponiendo que la variable de respuesta (X, Y) para cada una de las dietas (aumentosemanal de peso en kg) es una variable que, respectivamente, se distribuye normal

),(N 11 y ),(N 22 , donde 1 y 2 son desconocidas, al tratarse de muestraspequeñas antes de realizar el contraste para la igualdad de medias poblacionalesnecesitamos comprobar estadísticamente si las varianzas poblacionales desconocidas

21 y 2

2 son iguales o distintas.Por ello, primeramente se plantea:


22

211

22

210 :H:H

Región Rechazo de Hipótesis nula:

)1n(),1n(;2)1n(),1n(;2122

21

2121F;F

s

sR

Análogamente, la Región de Aceptación: )1n(),1n(;2)1n(),1n(;21 2122

21

21F

ss

F

Para hallar el estadístico de contraste, según los datos muestrales:

2711,0

8183,4F6875,31

F1F

1735,0ssF

386,05

)yy(s78,3y6n

067,08

)xx(s08,4x9n

5,8;05,0

8,5;05,05,8;95,0

22

215,8

6

1j

2j

222

9

1i

2i

211

Región de rechazo: 8183,4;2711,01735,0R


Se observa que el estadístico experimentalde contraste 1735,0F 5,8 verifica laregión de rechazo de la hipótesis nula, conlo que concluimos que, con un nivel designificación del 10%, hay evidencias deque las varianzas poblacionales sondesconocidas y distintas.

CONTRASTE UNILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZASPOBLACIONALES DESCONOCIDAS Y DISTINTAS:

Basándonos en la comprobación estadística que hemos realizado, planteamos la hipótesisnula 210 :H frente a la hipótesis alternativa 211 :H


2

22

1

21

f; ns

ns

t)yx(R , o lo que es

igual, se acepta 0H si

teórico

oestadístic

f;

contrasteoestadístic

2

22

1

21

t

ns

ns

)yx(t

Welchdeónaproximaci

2

22

22

1

21

21

2

2

22

1

21

2

1n)n/s(

1n)n/s(

ns

ns

f

En nuestro caso,

386,0s78,3y6n

067,0s08,4x9n

222

211

266,06386,0

9067,0

ns

ns

128,1

6386,0

9067,0

)78,308,4(t2

22

1

21

886,1tt2125,22

7)6/386,0(

10)9/067,0(

9386,0

9067,0

f 2;01,0f;22

2

En consecuencia, la región de rechazo de la hipótesis nula no se verifica:


5,03,0266,0.886,13,0ns

ns

t)yx(R2

22

1

21

f;

Análogamente, el estadístico empírico (contraste) es menor que el estadístico teórico,2;10,0t886,1128,1t , por tanto, con un nivel de significación del 10%, se acepta

la hipótesis nula, concluyendo que no existe evidencia estadística de que la primeradieta sea mejor que la segunda.


31.- Una empresa que se dedica a fabricar zapatillas de deporte dispone de dosproveedores de suelas de goma. Para analizar el desgaste de las suelas se ha tomadouna muestra al azar de cada proveedor, obteniéndose los siguientes resultados:

Proveedor Tamaño muestral Desgaste medio Cuasivarianza desgaste1 n = 10 6,0x 068,0s2

x

2 m = 14 62,0y 054,0s2y

Suponiendo que el desgaste de las suelas sigue una distribución normal, ¿se puede decir,para un nivel de confianza del 95%, que ambos proveedores proporcionan un productode semejante resistencia media al desgaste?.

Solución:

Se tiene que realizar un contraste bilateral de igualdad de medias:

211

210

:H:H

con varianzas poblacionales desconocidas, con muestras pequeñas 30mn

Dependiendo de que se suponga que las varianzas son iguales o no el contraste variará.Por ello, es necesario realizar primero un contraste relativo a la igualdad de varianzas.


22

211

22

210 :H:H

Como la hipótesis alternativa es 22

21 en la decisión que se elija deberán ser válidos

valores de 22

21 ó 2

221 , por lo cual el contraste debe ser bilateral o de dos colas.

Una distribución F de Fisher-Snedecor,con dos variables 2

n y 2m , independientes

entre si, es una variable mn

F 2m

2n

m,n

.

Estadístico de contraste: )1m(,)1n(22

21 F

ss

La regla de decisión será: kF0 13,9

El valor crítico de k se determina mediante el nivel de significación 05,0 :

05,0FkPkFP 13,92113,933

3

)Fk()kF0(PH/kF0)ciertaH/HchazarRe(P

1,9211,9

01,900


213,9213,9213,9

213,913,913,92

113,913,9113,9113,9

kFPkFP11kFP1

kFPFPFkP

kFP0FPkFPkF0P

se tiene:

31,3Fk025,0FkP

2611,083,31

F1Fk025,0kFP

13,9;025,0213,92

9,13;025,013,9;025,011113,9

La región crítica es:

)31,3F()2611,0F0( 13,913,9

Se observa que el estadístico muestral 259,1054,0068,0

ss

F 22

21

13,9 no se encuentra en

la región de rechazo. En consecuencia, con un nivel de confianza del 95%, se acepta quelas varianzas son desconocidas pero iguales.

Otra forma rápida de contrastar la hipótesis es haber utilizado la Región deRechazo de la Hipótesis nula:

)1m(),1n(;2)1m(),1n(;2122

21 F;F

ss

R

)F31,3;F2611,0(259,1R 13,9;025,013,9;975,0

CONTRASTE BILATERAL DE IGUALDAD DE MEDIAS POBLACIONALES CON VARIANZASPOBLACIONALES DESCONOCIDAS PERO IGUALES:

La hipótesis nula 210 :H frente a la hipótesis alternativa 211 :H

Como la hipótesis alternativa es 21 en la decisión que tengamos que tomar debenser válidos valores mayores o menores que 2 , con lo que el contraste debe serbilateral o de dos colas.



)RA(HrechazasekyxSi)RA(HaceptasekyxSi

0

0

En el muestreo de las dos poblaciones normales con varianzas desconocidas pero iguales,

las variables X e Y, respectivamente: 1101

1 tns

x

e 114

2

2 tms

y

Bajo la hipótesis nula )( 21 : )ms

ns

;0(t)yx(2p

2p

139 , donde:

0597,021410

)054,0()114()068,0()110(s

2mn

22s

1m21s

1n

2p

(cuasivarianza muestral ponderada)

es decir, )101,0;0(t)140597,0

100597,0;0(t)yx( 22139

El valor crítico k, bajo la hipótesis nula, )101,0;0(t)yx( 22 , se calcula a partir delnivel de significación :

)ciertaHkyx(P)ciertaHHchazar(ReP 000

05,0101,0k

101,0yxP

La región crítica: 209,0yxt074,2101,0

yx22;025,0

La región de rechazo de la hipótesis nula es: 209,0yxR . La evidenciaempírica muestra que 02,062,06,0yx , valor que no se encuentra en laregión de rechazo, por lo que se acepta la hipótesis nula.Así pues, no existe diferencia entre las resistencias medias al desgaste de losproductos proporcionados por los dos proveedores, con una confianza del 95%.

Otra forma rápida de contrastar la hipótesis es haber utilizado la Región deRechazo de la Hipótesis nula:

m1

n1styxR p)2mn(;2

2443,00597,0s p , 074,2t 22;025,0

141

101)2443,0()074,2(62,06,0R 209,002,0R


La evidencia muestra que no se verifica la región de rechazo, por lo que se acepta lahipótesis nula, con un nivel de confianza del 95%. Esto es, no existe diferencia entrelas resistencias medias al desgaste de los productos proporcionados por los dosproveedores.


32.- En un informa presentado por un reportero a una revista feminista se afirma queel número medio de horas semanales de conexión a Internet es el mismo para hombresque para mujeres. Sin embargo no parece prudente publicar estos datos sincontrastarlos estadísticamente. Se selecciona para ello una muestra de 75 hombres y50 mujeres. Los resultados muestrales se recogen en la siguiente tabla:

Hombres MujeresTamaño muestral 75 50Número medio de horas/semana 7,42 5,34Dispersión en la conexión 9,08 7,24

a) Formular el contraste a realizar y señalar los supuestos que se deben realizar pararesolver el ejercicio.

b) Determinar la región crítica del contraste.c) Calcular el estadístico del contraste.d) ¿Existe evidencia para rechazar la hipótesis nula a un nivel de significación del 5%?

Solución:

a) Sean las variables aleatorias, respectivamente, X = 'Tiempo conexión a Internet delos hombres' e Y = 'Tiempo conexión a Internet de las mujeres', donde 1 1X N( , )

e 2 2Y N( , ) .

En las muestras se obtuvieron los resultados:

1 1

2 2

x 7,42 s 9,08 n 75y 5,34 s 7,24 n 50

Si la dispersión muestral se refiriese a la desviación típica, habría que considerar larelación 2 2n (n 1)s . En este caso, se tendría 1s 9,14 y 2s 7,31

Se establecen las hipótesis: 1 2 1 20 1H : 0 H : 0

Como la hipótesis alternativa es 1 2 0 en la decisión que se elija deberán serválidos valores de 1 2 o 1 2 , por lo cual el contraste debe ser bilateral o de doscolas.


0

x y k se acepta H (R.A.)

x y k se rechaza H (R.C.)

Es decir, la región de aceptación: 1 2k x y k

Supuestos: Varianzas poblacionales desconocidas con muestras grandesIndependencia de la selección muestral


b) En el muestreo de las dos poblaciones normales con varianzas desconocidas, conmuestras grandes 1 2(n n 30) .

Las variables X e Y, respectivamente, siguen distribuciones: 11

1

sN ,

n

, 22

2

sN ,

n

,

con lo que la diferencia de medias muestrales

2 21 2

1 21 2

s s(x y) N ( ),

n n

La diferencia de medias muestrales, bajo la hipótesis nula 0 1 2H : 0 , sedistribuye:

2 2(9,08) (7,24)(x y) N 0, N(0 ; 1,465)75 50

El valor crítico k se determina medianteel nivel de significación

/2 0,025z 1,960,05 z

0 0 0 1 2P(Rechazar H H cierta) P x y k/H : 0

1 2 1 2P (x y) k (x y) k P (x y) k (x y) k

1 2k kx y x y P1,465 1,465 1,465 1,465

1 2k kP z P z 0,05

1,465 1,465 2 2por simetría N(0,1)

1 11

k kP z 0,025 1,96 k 2,87

1,465 1,465

2 22

k kP z 0,025 1,96 k 2,87

1,465 1,465

La evidencia muestral x y 7, 42 5,34 2, 08


Siendo 2,87 2,08 2,87 se acepta la hipótesis nula de igualdad de medias, esdecir, con un nivel de significación del 5%, el número medio de horas conectados ainternet es el mismo para hombres que para mujeres.

Se podía haber decidido con otros métodos:

Se formulan las hipótesis: 0 11 2 1 2H : 0 H : 0

Se trata de un contraste bilateral o de doscolas, con 0,05

La región de aceptación se encuentraen el intervalo /2 /2( z , z )

Se acepta la hipótesis nula cuando,

p p/2 /2 /22 21 2

1 2

x y 2,08z z z 1,42 1,961,465s s

n n

Se acepta que el número medio de hombres y mujeres conectados a internet es elmismo.

El intervalo de confianza para la diferencia de medias de dos distribucionesnormales con varianza poblacionales 2

1 y 22 desconocidas, con muestras grandes

1 2(n n 30)

2 21 2

1 1 2 /21 2

s sI ( ) (x y) z

n n

con lo cual, 0,95 1 2I ( ) 2,08 1,96 x 1,465 0,79 , 4,95

Como el intervalo cubre el cero no existe diferencia significativa entre el número mediode horas conectados a internet es el mismo para hombres que para mujeres.


33.- En dos poblaciones ),2(N 1 y ),3(N 2 , con un nivel de significación del 10%, se

quiere contrastar la hipótesis de igualdad de varianzas, habiendo tomado,respectivamente, dos muestras independientes, con los datos que se reflejan en la tablaadjunta:

ix 2 7 5 9jy 4 10 7 8 5 9

Solución:

Las variables aleatorias X e Y siguen, respectivamente, distribuciones ),2(N 1 e

),3(N 2 .

En el contraste bilateral se establecen las hipótesis:

22

21

22

21

:H:H

1

0

Sabemos que la variable 2n2

n

1i

2i )x(

por ser la suma de n variables aleatorias

)1,0(N , independientes entre sí. Por otro lado, la variable mn

F 2m

2n

m,n

se distribuye

como una F de Fisher-Snedecor con n y m grados de libertad.

Bajo la hipótesis nula 222

21 , las variables 2

421

4

1i

2i )2x(

e 2

622

6

1j

2j )3y(

, y

la variable

6

1j

2j

4

1i

2i

2

6

1j

2j

2

4

1i

2i

26

24

6,4)3y(

)2x(

46

6

)3y(

4

)2x(

64

F

Como la hipótesis alternativa es 22

21 en la

decisión que se elija deberán ser válidos valoresde 2

221 ó 2

221 , por lo cual el contraste

debe ser bilateral o de dos colas.

La regla de decisión será: kF0 6,4

El valor de k se determina mediante el nivel de significación 10,0 :


100,)Fk()kF0(PH/kF0)ciertaH/HchazarRe(P 6,4216,406,400

100,FkPkFP 6,4216,4

26,426,426,426,46,46,42

16,46,416,416,4

kFPkFP11kFP1kFPFPFkP

kFP0FPkFPkF0P

se tiene:

53,4Fk05,0FkP

162,016,61

F1Fk05,0kFP

6,4;05,026,42

4,6;05,06,4;05,01116,4

La región crítica es: )53,4F()162,0F0( 6,46,4

De otra parte, para conocer el valor muestral del estadístico F, es necesario calcular:

83)2x(4

1i

2i

131)3y(6

1j

2j

95,0131.483.6

)3y(

)2x(

46F 6

1j

2j

4

1i

2i

6,4

Se observa que el estadístico muestral 95,0F 6,4 no pertenece a ninguno de los dos

intervalos, encontrándose en la región de aceptación, en consecuencia, aceptamos lahipótesis nula de igualdad de varianzas, a un nivel de significación del 10%.

Análogamente, la región de rechazo:

)12n(),11n(;2)12n(),11n(;212y

2x F;F

ss

R

En el muestreo: 66,1ss

37,51n

)yy(s92,8

1n

)xx(s 2

y

2x

y

6

1j

2ji

2y

x

4

1i

2i

2x

4095,5FF11,00135,91

F1FF 5,3;05,0)12n(),11n(;2/

3,5;05,05,3;95,0)12n(),11n(;2/1

El estadístico muestral 4095,5;11,066,1)s/s( 2y

2x , por lo que aceptamos la

hipótesis nula de igualdad de varianzas, con un nivel de significación del 10%.


CONTRASTE DE HIPÓTESIS. TEOREMA DE NEYMAN-PEARSON.

34.- Un experto cree que el número medio de errores por página que comete es dos.Por otra parte, el editor defiende que el número medio es de cuatro. Para una muestraaleatoria simple de 100 páginas, con un nivel de significación del 5%, se pide:

1. Obtener la región crítica.2. Hallar la potencia del contraste.3. Si en la muestra aleatoria de 100 páginas se encontraron 250 errores, ¿qué

hipótesis se acepta?Nota.- Se supone que el número de errores por página sigue una distribución de Poisson.

Solución:

1) La variable aleatoria X = ’número de errores por página’ sigue una distribución dePoisson de parámetro (número medio de errores por página).

Sobre el parámetro se establecen las hipótesis nula y alternativa:

4:H2:H

1

0

La función de verosimilitud para una muestra aleatoria simple de tamaño n:

n

n

1ii

n

1iix

n

nx

2

2x

1

1x

n21 e!x

e!x

e!x

e!x

),x,,x,x(L

Para obtener la mejor región crítica se aplica el teorema de Neyman-Pearson:

0021

100

1iix

1002

100

1iix

400n

1ii

002n

1ii

n21

n21

ek

21ke

21

e!x

x4

e!x

x2

)4,x,,x,x(L)2,x,,x,x(L

100

1ii

100

1ii

0021100

1ii002

1100

1ii002

1

100

1iix

ek

ln2lnxek

ln21lnx

ek

21

k

2lnekln

x002

1100

1ii

. La mejor región crítica es de la forma kx

100

1ii

El valor de k se obtiene considerando que el nivel de significación es del 5%, y teniendoen cuenta que

100

1iix , bajo la hipótesis nula, sigue una distribución de Poisson de


parámetro 2002.100 , es decir, )200(Px100

1ii

. Por otra parte,

100

1iix se puede

aproximar mediante la distribución normal )200,200(N . En consecuencia:

3,223k645,1200200k05,0

200200k

200

200xPkxP

100

1ii100

1ii

La mejor región crítica es 3,223x100

1ii

. En otras palabras, si la suma de observaciones

muestrales es mayor que 223,3 se rechaza la hipótesis nula.

2) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000

Considerando, de una parte, que bajo la hipótesis alternativa 4:H1 , el

100

1iix sigue

una distribución de Poisson de parámetro 4004.100 , es decir, )400(Px100

1ii

.

Teniendo en cuenta su aproximación a la distribución normal )400,400(N , resulta:

185,8zP400

400223400

400xP223xP

100

1ii100

1iiP

La potencia del contraste es prácticamente la unidad.

3) En la muestra aleatoria simple de 100 páginas se encontraron 250 errores, como laregión crítica es 3,223x

100

1ii

, con un nivel de significación del 5% se rechaza la

hipótesis nula del experto que aseguraba que el número medio de errores por página erade dos.


35.- En una distribución de Poisson se establece sobre el parámetro la hipótesis nula,1,0:H0 , y la alternativa, 4,0:H1 . En muestras aleatorias simples de tamaño

100, siendo el nivel de significación 0,1, se desea conocer:a) La mejor región crítica.b) La potencia del contraste.

Solución.-

a) Una variable aleatoria X sigue una distribución de Poisson de parámetro cuando:

e

!k)kX(P

k

Aplicando el lema de Neyman-Pearson, el cociente de las funciones de verosimilitud:

4,0

100

100x4,0

2

2x4,0

1

1x

1,0

100

100x1,0

2

2x1,0

1

1x

10021

10021

e!x

4,0e!x

4,0e!x

4,0

e!x

1,0e!x

1,0e!x

1,0

)4,0;x,,x,x(L)1,0;x,,x,x(L

130

100

1iix

30

100

1iix

30

100

1iix

40

100

1iix

10

100

1iix

ke.4e.1,04,0e.

4,01,0

e4,0

e1,0

de donde,

)k.e(ln4lnk.e4ke.4 130

100

1iix

130

100

1iix

130

100

1iix

kx4ln

)k.e(lnx

100

1ii

130100

1ii

. La mejor región crítica es kx

100

1ii

- Bajo la hipótesis nula,

100

1iix es una variable aleatoria, suma de cien variables

aleatorias independientes, que sigue una distribución de Poisson de parámetro)10(P)1,0.100(P .

Por otra parte, como el tamaño muestral es lo suficientemente grande se puede utilizar

la aproximación normal (teorema central del límite): )10,10(Nx100

1ii

El valor crítico k se determina mediante el nivel de significación 1,0


05,14k2817,11010k1,0

1010k

10

10xPH/kxP

100

1ii

0

100

1ii

Como los valores que toma una variable de Poisson son enteros, la mejor región crítica

es 15x100

1ii

. Es decir, cuando la suma de los valores muestrales sea mayor que 15,

rechazaremos la hipótesis nula.

b) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000

Considerando, de una parte, que bajo la hipótesis alternativa 4,0:H1 , el

100

1iix sigue

una distribución de Poisson de parámetro 404,0.100 : )40(Px100

1ii

Teniendo en cuenta su aproximación a la distribución normal )40,40(N , resulta:

99996,095,3zP40

401540

40xPciertaH/15xPo

100

1ii

1

100

1iiP

La potencia del contraste es prácticamente la unidad.


36.- Las patatas cultivadas en la parcela A siguen una distribución )144,(N 1 ;

mientras que las cultivadas en la parcela B siguen una distribución )225,(N 2 . Unagricultor quiere contrastar que el peso medio de las patatas cultivadas en ambasparcelas es el mismo, 0:H 210 , frente a la hipótesis alternativa de que el peso

medio de las patatas cultivadas en la parcela A es de 80 gramos mayor que el de lascultivadas en la parcela B, 80:H 211 . Para ello, selecciona una muestra aleatoria

de 100 patatas de la primera parcela con un peso medio de 400 gramos; y otra de 81patatas de la segunda parcela con un peso medio de 324 gramos. Se pide:

1. Hallar la mejor región crítica.2. Calcular la potencia del contraste.3. ¿Se acepta la hipótesis de que las patatas cultivadas en ambas parcelas tienen el

mismo peso medio?

Solución:

Sean la variable aleatoria X = ’peso medio de las patatas en la parcela A’, que sigue unadistribución )144,(N 1 . Análogamente, sea la variable aleatoria Y = ’peso medio de las

patatas en la parcela B’, con una distribución )225,(N 2 . Sean, respectivamente, x ey , las dos medias muestrales de las dos muestras aleatorias simples de patatascorrespondientes a las dos parcelas.

x se distribuye según una

1

11 n,N , es decir, )4,14;(N

100144,N 11

y se distribuye según una

2

22 n,N , es decir, )25;(N

81225,N 22

La diferencia de las medias muestrales )yx( se distribuye según una normal:

85,28;N)yx(254,14;N)yx( 2122

21

Para hallar la mejor región crítica se aplica el teorema de Neyman-Pearson:

280)yx(2)yx(285,28.21

285,28.2

280)yx(

285,28.2

20)yx(22)x(

21

e2

1)x(f

21

21 e

e285,281

e285,281)80,x(L)0,x(L

1

)6400)yx(160(285,28.21

ke


k)yx(6400kln64,1664)yx(160

kln)6400)yx(160(85,28.2

1ke

1

121

)6400)yx(160(285,28.21

Para hallar el valor de k se considera que el nivel de significación es 0,05, severifica la hipótesis nula 0:H 210 , y por tanto )85,28;0(N)yx( , entonces:

05,00:H/k)yx(P 210

46,47k645,185,28

k05,085,28

kzP85,28

k85,28

)yx(P

Si la diferencia entre las medias de las dos muestras es superior a 47,46 gramos serechaza la hipótesis nula de igualdad de medias poblacionales.

2) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia 1000

Si se verifica la hipótesis alternativa 80:H 211 , se tiene )85,28;80(N)yx(

Con lo cual,

8708,013,1zP85,28

8046,4785,28

80)yx(PoP

2) La diferencia entre el peso medio de las muestras tomadas en ambas parcelas es:

gramos76324400

Como la diferencia es mayor que 47,46 gramos, se rechaza la hipótesis nula de queambas parcelas producen patatas con igual peso medio.


37.- El gasto diario, en miles de euros, en electricidad de una empresa es una variablealeatoria con distribución ).1;(N Se desea contrastar con un nivel de significación del5%, la hipótesis nula de que el gasto medio diario es de 30 euros frente a la hipótesisalternativa de que dicho gasto es menor que la citada cifra.Para ello se toma una muestra aleatoria simple de diez días en los que el gasto enelectricidad en euros fue:

29,50 29,30 30,50 31,50 29,10 29,90 30,10 31 31,50 30

Se pide:

1. ¿Cuál es la hipótesis aceptada?2. ¿Cuál habría sido la probabilidad de aceptar que el gasto diario medio es de 30

euros, si el gasto medio diario fuese un 2% superior a la cifra supuesta en lahipótesis nula?

Solución:

1) La variable aleatoria X = ‘gasto diario en facturas de electricidad’ ).1;(NX

La hipótesis nula 30:H0 frente a la hipótesis alternativa 30:H1

Para una muestra aleatoria simple de tamaño n, de una población ),1;(N la función deverosimilitud es:

n

1i

2)ix(21n

2)nx(212)2x(

212)1x(

21

n21 e21e

21e

21e

21),x,,x,x(L

Para obtener la región crítica, aplicando el teorema de Neyman-Pearson:

1

ixn

1i)62()29(n

21

ixn

1i22n2

ixn

1iix

n

1i6n92

ixn

1i21

n

1i

n

1i

2)ix(212)3ix(

21

n

1i

2)ix(21n

n

1i

2)3ix(21n

n21

n21

kee

e

e21

e21

)3,x,,x,x(L)3,x,,x,x(L

1i

n

1i

21

ixn

1i)62()29(n

21

klnx)62()9(n21ke

)9(nkln2x)62(klnx)62()9(n21 2

1i

n

1i1i

n

1i

2


)62()9(nkln2

x2

1i

n

1i

dividiendo por n, resulta k

n

xx

i

n

1i

con lo que la forma de la región crítica es kx .

Siendo el nivel de significación del 5%: 05,030:HkxP 0

Si la hipótesis nula es cierta, considerando que la muestra es de tamaño 10, la media

muestral se distribuye según una normal

101,30Nx , por tanto,

05,010130kzP

10130k

10130xP30:HkxP 0

observando las tablas de la )1,0(N se tiene que 48,29K645,110130k

La región crítica es: 48,29x

Por otra parte, la media muestral es: 24,3010

xx

10

1ii

Siendo 48,2942,30x se acepta la hipótesis nula, siendo el gasto medio diario enelectricidad de 30 euros, con una fiabilidad del 95%.

2) Si el gasto medio diario fuera un 2% superior a 30 euros, sería de 30,6 euros, esdecir .6,30 En este caso, la media muestral se distribuye según una normal

101;6,30Nx , por tanto, la probabilidad pedida sería:

9998,054,3zP101

6,3048,29101

6,30xP6,30siendoHAceptarP 0


38.- Las especificaciones de un tipo de báscula aseguran que los errores en laspesadas siguen una distribución normal con esperanza nula y varianza unidad. Se deseacontrastar la afirmación sobre la varianza frente a la hipótesis alternativa de que lavarianza es 4. En este sentido, se realizan cinco pesadas en las que el error cometidoresultó ser

1 0,9 - 0,2 1,4 - 0,7

Para un nivel de significación del 5%, se pide:1. Obtener la mejor región crítica.2. Obtener la potencia del contraste.3. Indicar qué hipótesis resultada aceptada.

Solución:

1) Sea la variable aleatoria X = ‘error cometido en la báscula’ ).;0(NX

Se tiene la hipótesis nula 1:H 20 frente a la hipótesis alternativa 4:H 2

1

La función de verosimilitud para una muestra aleatoria simple de tamaño 5 es:

5

1i

2ix22

1525x22

121x22

12

521 e2

1e2

1e2

1),x,,x,x(L

La región crítica óptima se obtiene aplicando el teorema de Neyman-Pearson:

1

5

1i

2ix

83

5

5

1i

2ix

815

1i

2ix

21

55

1i

2ix

4.215

5

1i

2ix

215

2521

2521 ke2e2

e22

1

e21

)4,x,,x,x(L)1,x,,x,x(L

)32k(lnx8332keke2 1

5

1i

2i1

5

1i

2ix

83

1

5

1i

2ix

83

5

kx83

)32k(lnx

83)32k(ln

x5

1i

2i

15

1i

2i

15

1i

2i

La forma de la mejor región crítica es kx5

1i

2i

El valor de k se obtiene apoyándonos en que el nivel de significación es del 5%:


05,01:HkxP 20

5

1i

2i

Si la hipótesis nula es cierta, la variable aleatoria se distribuye según una normal)1;0(N , siendo

5

1i

2ix una variable aleatoria suma de cinco variables aleatorias

independientes y con distribución )1;0(N . En consecuencia,

5

1i

2ix se distribuye como

una 25 (chi-cuadrado con cinco grados de libertad).

En este sentido, observando en las tablas: 07,11K05,0kxP5

1i

2i

La región crítica es: 07,11x5

1i

2i

En otras palabras, se aceptará la hipótesis nula cuando la suma de los cuadrados de lasobservaciones muestrales sea menor que 11,07

2) La potencia del contraste es la probabilidad de rechazar la hipótesis nula cuando escierta la hipótesis alternativa, esto es:

4:H07,11xPPotencia 2

1

5

1i

2i

Observemos que si la hipótesis alternativa es cierta, la variable aleatoria X sedistribuye según una normal )2;0(N , con lo que dividiendo cada ix por la desviación

típica 2 , se tiene que

5

1i

2i )2x( se distribuye según una 2

5 , en consecuencia:

75,07675,2)2x(P4:H07,11xPPotencia 25

1ii

21

5

1i

2i

3) El contraste se realiza hallando el

5

1i

2ix de la muestra aleatoria simple, siendo:

07,113,4)7,0(4,1)2,0(9,01x 222225

1i

2i

por lo que se acepta la hipótesis nula.


39.- El precio de los productos vendidos por una empresa es una variable aleatoriacon función de densidad 1x)x(f , donde 0,1x0 , que depende delparámetro desconocido . Se quiere contrastar sobre el valor de dicho parámetro lahipótesis nula 1:H0 frente a la alternativa 2:H1 . Para ello, se toma una muestra

aleatoria simple de tamaño dos.Determinar el nivel de significación y la potencia del contraste, si se toma como regióncrítica 6,0xx 21

Solución:

El nivel de significación es la probabilidad de rechazar lahipótesis nula siendo cierta: )ciertaHHchazar(ReP 00 .

En la región crítica 6,0xx 21 , para 1 se tiene: 1)x(f ,

con lo cual:

2

11

6,01

16,02

02

12

6,01

01

12

02

1021 111:6,0 dxdxdxdxHxxP

x

x

xx

x

x

x

x

x

906,0)51,00(6,06,0)6,0ln1(ln6,06,0)ln()(

)6,0(1)()(

16,01

6,001

1

1

6,0

1

6,0

0

11

1

6,0

16,0021

6,0

0

102

xx

dxxdxdxxdxxx

La probabilidad de rechazar la hipótesis nula siendo cierta es alta, lo que indica que elcontraste es malo.

)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000 .

En la región crítica 6,0xx 21 , para 2 se tiene x2)x(f , la potencia será:

2

11

6,01

16,02

02

1212

6,01

01

12

02

121021 22222:6,0 dxdxxxdxdxxxHxxPPot

x

x

xx

x

x

x

x

x

7272,0)51,00(72,036,0)6,0ln1(ln72,036,0)xln(72,0)x(

dx)x/36,0(2dxx2dx)2x(x4dx)2x(x4

16,01

6,00

21

1

1

6,011

6,0

011

1x/6,00

22

1

6,011

10

22

6,0

01

La potencia del contraste no resulta excesivamente alta, el contraste no es bueno.


40.- El volumen diario de ventas de una empresa, en cien mil euros, es una variablealeatoria X sobre cuya función de densidad se establece la hipótesis nula

2x0,2x)x(f:H0 , frente a la hipótesis alternativa .2x0,21)x(f:H1

Para realizar el contraste se toma una muestra aleatoria simple de dos días en los quelos volúmenes de venta fueron de 50.000 euros y 100.000 euros. Con un nivel designificación del 5 por ciento, se pide:

1. Hallar la mejor región crítica.2. Calcular la potencia del contraste.3. Qué hipótesis se acepta.

Solución:

1) Para una muestra aleatoria simple de tamaño dos, lamejor región crítica aplicando el teorema de Neyman-Pearson, el cociente de las funciones de verosimilitud es:

kx.x21.21

x.x)21)x(f,x,x(L)2x)x(f,x,x(L

2121

21

21

Si la hipótesis nula es cierta )2x)x(f , con un nivel designificación del 5%, se tiene:

2

21x

2k1x

1xk2x

02x1

212

2k1x

01x

22x

02x1

21021 dxdx

4xx

dxdx4xx

2x)x(f:HkxxP05,0

3733,0kdondede40,0kln8633,1k05,0kln8633,18k

kln8633,18kkln2ln2

21

8k)2k(ln2ln

8k

16k)xln(

8k)x(

41

dxx8

kdx2x

dx)2/x(4x

dx)2/x(4x

22

22222

2k1

22k

021

2

2k1

1

22k

01

121x

2k1x1

1xk0

22

12k1x

01x1

20

22

1

La regla de decisión es 3733,0x.x 21 .

Es decir, se rechaza la hipótesis nula si durante los días el producto de los dosvolúmenes de ventas de la muestra es inferior a 37.330 euros.

2) )ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000 .

En la región crítica 3733,0xx 21 , con la función de densidad 21)x(f , la potencia:


2

21x

2/3733,01x

1x3733,0

012

2/3733,01x

01x

2

01121 dxdx

41dxdx

4121)x(f:H3733,0xxPP

3146,0)2/3733,0(ln2ln4

3733,04

3733,0)xln(4

3733,0)x(21

dxx1

43733,0dx

21dx)x(

41dx)x(

41

22/3733,01

2/3733,001

1

2

2/3733,0 1

2/3733,0

011

1x/3733,002

2

2/3733,01

202

2/3733,0

0

3) En la muestra aleatoria simple, los volúmenes de ventas fueron de 50.000 y 100.000euros, en consecuencia 5,0x1 y 1x2 , por tanto, 5,0x.x 21

Como la región crítica es 3733,0xx 21 , se acepta la hipótesis nula.

41.- Se sabe que las peras siguen una distribución )1,(N . En una muestra de peras,con peso medio de 300 gramos, se realizó un contraste con un nivel de significación del5% y una potencia de 0,6443, en donde la hipótesis nula era de 4,0:H0 kg frente a

la hipótesis alternativa de 3,0:H1 kg. Se desea saber:

1. Cuál es el tamaño de la muestra.2. Hallar la hipótesis aceptada.

Solución:

1) En una distribución )1,(N , en una muestra de tamaño n, la función de verosimilitudvendrá dada por la expresión:

n

1i

2)ix(21n2)nx(

212)2x(

212)1x(

21

n21 e21e

21e

21e

21),x,,x,x(L

Con las hipótesis del contraste, 4,0:H0 y 3,0:H1 . La región crítica óptima se

obtiene aplicando el teorema de Neyman-Pearson:

1

n

1iix2,0n7,0

21n

1i

n

1i

n

1iix6,0n09,02

ixn

1iix8,0n16,02

ix21

n

1i

n

1i

2)3,0ix(2)4,0ix(21

n

1i

2)3,0ix(21n

n

1i

2)4,0ix(21n

n21

n21

kee

e

e21

e21

)3,0,x,,x,x(L)4,0,x,,x,x(L

tomando logaritmos neperianos, resulta,


1

n

1ii1

n

1ii1

n

1iix2,0n7,0

21

kln2x2,0n7,0klnx2,0n7,021ke

n2,0kln2n7,0

n

x

2,0kln2n7,0

xkln2n7,0x2,0 1

n

1ii1n

1ii1

n

1ii

La forma de la mejor región crítica es: kx

Ahora bien, la hipótesis nula 4,0:H0 es cierta si )n1;4,0(Nx . Con un nivel designificación del 5%, se tiene:

645,1n1

4,0k05,0n1

4,0kzPn1

4,0kn1

4,0xP4,0:HkxP 0

n645,14,0k

De otra parte, sabemos que la potencia del contraste es 0,6443.

)ciertaHHchazar(ReP)falsaHHchazar(RePPotencia1 1000 .

Si se verifica la hipótesis alternativa 3,0:H1 se tiene que )n1;3,0(Nx

37,0n1

3,0k6443,0n1

3,0kzPn1

3,0kn1

3,0xP3,0:HkxP 1

n37,03,0k

Resolviendo el sistema: 3184,0k

406n

n015,21,0

n37,03,0k

n645,14,0k

El tamaño de la muestra es de 406 peras.

2) La mejor región crítica será 3184,0kx , rechazándose la hipótesis nula cuandoel peso medio de la muestra de peras sea inferior a 318,4 gramos.Como en la muestra se obtuvo un peso medio de 300 gramos ( 4,318300 ), se rechazala hipótesis nula de que el peso medio de las peras es de 0,4 kg.

Estadística Teórica: Intervalos Confianza 98

Gestión Aeronáutica: Estadística TeóricaFacultad Ciencias Económicas y EmpresarialesDepartamento de Economía AplicadaProfesor: Santiago de la Fuente Fernández

INTERVALOS DE CONFIANZA

a) Intervalo de confianza para la media de una distribución normal N( , ) devarianza conocida 2

1 2I ( ) x zn

b) Intervalo de confianza para la media de una distribución normal N( , ) devarianza desconocida 2

Muestras grandes n 30 x1 2

sI ( ) x z

n

Muestras pequeñas n 30 x1 /2 , (n 1)

sI ( ) x t

n

c) Intervalo de confianza para la varianza 2 de una distribución normal

2 2

2 x x1 2 2

/2 , (n 1) 1 /2 , (n 1)

(n 1)s (n 1)sI ( ) ;

d) Intervalo de confianza para la diferencia de medias de dos distribuciones normales

Las varianzas poblaciones 21 y 2

2 son conocidas

2 21 2

1 1 2 /21 2

I ( ) (x y ) zn n

En todos los intervalos de confianza

n2

ii 12

x

(x x)

sn 1

es la cuasivarianza muestral.

Las varianzas poblaciones 21 y 2

2 son desconocidas:

- Caso en que la suma 1 2(n n ) 30 con 1 2n n


2 21 2

1 1 2 /21 2

s sI ( ) (x y ) z

n n

- Caso en que los tamaños muestrales son pequeños 1 2(n n ) 30 y las varianzas sondesconocidas, pero iguales ( 2

2 21 )

1 21 1 2 /2 , (n n 2) p

1 2

1 1I ( ) (x y ) t . s .n n

2ps es la media ponderada de las cuasivarianzas muestrales:

2 22 1 1 2 2p

1 2

(n 1 )s (n 1)ss

n n 2

- Caso en que los tamaños muestrales son pequeños 1 2(n n ) 30 y las varianzas sondesconocidas y distintas ( 2

2 21 ):

2 21 2

1 1 2 2 ; f1 2

s sI ( ) (x y ) t

n n

f es la aproximación de Welch:

22 21 2

1 22222

2 21 1

1 2

s sn n

f 2(s n )(s n )

n 1 n 1

Cuando el intervalo cubre el 0 no hay diferencia significativa entre las mediaspoblacionales.

e) Intervalo de confianza para la razón de varianzas de dos poblaciones normales

1 2 1 2

2 2 2 22 2 1 2 1 2

1 1 1/2 ; ( n 1) , ( n 1) (1 /2) ; ( n 1) , ( n 1)

s s s sI ( ) ;

F F

Cuando el intervalo cubre el 1 no hay diferencia significativa entre las varianzaspoblacionales.

Hay que considerar la relación: 1 2

2 1

; n , n(1 ) ; n , n

1FF


f) Intervalo de confianza para el parámetro p de una distribución binomial deparámetros n, p, B(n, p)

1 /2

ˆ ˆp (1 p)Î (p) p zn

g) Intervalo de confianza para la diferencia de parámetros 1 2(p p ) de dosdistribuciones binomiales

1 1 2 21 1 2 1 2 /2

1 2

ˆ ˆ ˆ ˆp (1 p ) p (1 p )ˆ Î (p p ) (p p ) zn n

Cuando el intervalo cubre el 0 no hay diferencia significativa entre las proporcionespoblacionales.

h) Intervalo de confianza para el parámetro de una distribución de Poisson

1 /2

ˆÎ ( ) zn

i) Intervalo de confianza para la diferencia de datos apareados

Para muestras grandes n 30

d/2

sI d z

n

n n

22i i i i d i

i 1 i 1

1 1d d d s (d d )n n 1

Para muestras pequeñas n 30 d/2 , (n 1)

sI d t

n


1. El peso (en gramos) de las cajas de cereales de una determinada marca sigue unadistribución N( , 5). Se han tomado los pesos de 16 cajas seleccionadasaleatoriamente, y los resultados obtenidos han sido:

506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.

a) Obtener los intervalos de confianza del 90%, 95% y 99% para la media poblacional.

b) Determinar cuál sería el tamaño muestral necesario para conseguir, con un 95% deconfianza, un intervalo de longitud igual a 2 gramos.

c) Suponiendo ahora que es desconocida, calcular los intervalos de confianza para lamedia al 90%, 95% y 99%.

Solución:

a) Se trata de construir un intervalo de confianza para la media poblacional devarianza conocida 2 25 . El intervalo de confianza de nivel 1 viene dado por:

2 Errorestimaciónmedia 2muestral

1 2

1 2

2

2 zL 2 z n L longitud o amplitud

longitudnI ( ) x zn

Error muestral z n

16

ii 1

x

x 503,7516

0,05

0,025

0,005

1 0,90 0,10 / 2 0,05 z 1,645 1 0,95 0,05 / 2 0,025 z 1,96 1 0,99 0,01 / 2 0,005 z 2,575

A medida que el nivel deconfianza es mayor, aumentalongitud del intervalo.

2 2P x z x z 1n n

Los intervalos de confianza solicitados serán:

0,905 5 5I ( ) 503,75 1,645 503,75 1,645 , 503,75 1,645 501,69 ; 505,8116 16 16

0,955 5 5I ( ) 503,75 1,96 503,75 1,96 , 503,75 1,96 501,30 ; 506,2016 16 16


0,995 5 5I ( ) 503,75 2,575 503,75 2,575 , 503,75 2,575 500,53 ; 506,9716 16 16

La longitud de cada uno de los intervalos de confianza:º

0,90

0,95

0,99

L ( ) 505,81 501,69 4,12L ( ) 506,20 501,30 4,9L ( ) 506,97 500,53 6,44

b) La amplitud o longitud vendrá dado por la fórmula: x1 2

sI ( ) x z

n

2

/2/2 /2 /2

2 zamplitud ox z x z 2 z n

amplitudlongitud n n n

siendo, 2

x x2 1,96 5n 96 cajas de cereales2

c) Se trata de construir un intervalo de confianza para la media poblacional devarianza poblacional desconocida, con muestras pequeñas (n 30). El intervalo deconfianza de nivel (1 ) , viene dado por:

0,05;15x

1 /2 , (n 1) 0,025;15

0,005;15

1 0,90 0,10 t 1,753s

I ( ) x t 1 0,95 0,05 t 2,131n

1 0,99 0,01 t 2,947

Cuasivarianza muestral:

162

ii 12

x x

(x x )s 36,037 s 6

15

cuasidesviación típica

Los intervalos de confianza solicitados serán:

0,906I ( ) 503,75 1,753 501,12 ; 506,3816

0,956I ( ) 503,75 2,131 500,55 ; 506,9516

0,996I ( ) 503,75 2,947 499,33 ; 508,1716

Señalar que a mayor nivel de confianza (1 ) mayor es la amplitud del intervalo, y, enconsecuencia, los intervalos de confianza son mayores.


2. Una muestra aleatoria extraída de una población normal de varianza 100, presentauna media muestral x 160 . Con una muestra de tamaño 144, se pide:

a) Calcular un intervalo de confianza del 95 por ciento para la media poblacional.

b) Si se quiere tener una confianza del 95 por ciento de que su estimación se encuentra a una distancia de 1,2 cm más o menos de la verdadera media poblacional, ¿cuántas observaciones adicionales deben tomarse?

Solución:

a) 0,025

x 160 10 n 1441 0,95 / 2 0,025 z 1,96

0,9510 10I ( ) 160 1,96 ; 160 1,96 158,37 ; 161,6312 12

b) El error absoluto que se quiere cometer es de 1,2, aplicando la fórmula para ladeterminación de la muestra a un nivel de confianza del 95 por 100, se tiene:

2 22

2

z 1,96. 10z n n 2671,2n

Se debería tomar una muestra adicional de 267 144 123 elementos

3. La afluencia de visitantes al parque de Monfragüe durante un mes, medida a travésde una muestra aleatoria durante 10 días elegidos aleatoriamente, han sido lossiguientes:

682, 553, 555, 666, 657, 649, 522, 568, 700, 552

Suponiendo que los niveles de afluencia siguen una distribución normal, y que ladesviación típica muestral es de 56,99.

a) Se podría afirmar, con un 95 por ciento de confianza, que la afluencia media alparque es de 600 personas al mes.

b) Los adjudicatarios de la explotación al parque, en negociaciones con la Junta deExtremadura, afirmaron que la afluencia media era constante y que la dispersión seríade unas 15 personas. ¿Queda esta afirmación probada con los datos disponibles con un95% de confianza?

Solución:


a) Se trata intervalo de confianza para la media de una distribución normal devarianza poblacional desconocida siendo la muestra pequeña n 30

2x2 2 2

x x x

22x

1 /2 , (n 1) x x

2;(n 1) 0,025;9

nn (n 1)s s

(n 1)s 10. 56,99I ( ) x t s 3608,73 s 3608,73 60,07

9n

1 0,95 0,05 2 0,025 t t 2,262

10

ii 1

x

x

x 610,04 s 60,0710

0,9560,07 60,07 60,07I ( ) 610,04 2,262 610,04 2,262 , 610,04 2,262 567,07 ; 653,01

10 10 10

Como 567,07 600 653,01 se puede afirmar que con un 95 por ciento de confianzala afluencia media es de 600 personas al mes.

b) Intervalo de confianza para la varianza 2 de una distribución normal:

2x2 2

2 2 2x x1 /2 , (n 1) 0,025;92 2

/2 , (n 1) 1 /2 , (n 1) 2 21 /2 , (n 1) 0,975;9

s 3608,73(n 1)s (n 1)s

I ( ) ; 1 0,95 2 0,025 19,023

2,70

20,95

9.(3608,73) 9.(3608,73)I ( ) ; 1707,33 ; 12029,119,023 2,70

0,959.(3608,73) 9.(3608,73)I ( ) ; 1707,33 ; 12029,1 41,32 ; 109,68

19,023 2,70

15 41,32 ; 109,68 . El intervalo de la desviación típica no contiene el valor 15, con locual no se puede afirmar con una confianza del 95% que la dispersión de afluencia seade 15 personas.


4. El gasto diario en llamadas telefónicas de dos departamentos X e Y de una mismaempresa sigue una distribución normal, con gasto medio desconocido en ambos. Sinembargo, se conocen las desviaciones típicas, que son 100 y 110 céntimos de euro para Xe Y, respectivamente. La dirección ha observado que una muestra aleatoria de 20 días,el gasto medio diario en llamadas realizadas por el departamento X ha sido de 1100céntimos, y de 1400 en el departamento Y. Obtener un intervalo de confianza para ladiferencia de gastos medios entre ambos departamentos.

Solución:

La variables aleatorias siguen, respectivamente, las distribuciones normales 1N( , 100)

y 2N( , 110) . El intervalo de confianza para la diferencia de medias 1 2( ) con

varianzas poblacionales conocidas viene dado por la expresión:

2 22 22 2 1 21 2

1 1 2 /2 1 21 2

/2

100 110I ( ) (x y ) z x 1100 n 20 y 1400 n 20

n n1 0,90 / 2 0,05 z 1,645

2 2

0,90 1 2100 110I ( ) (1100 1400) (1,645) 354,68 ; 245,3220 20

El intervalo de confianza no cubre el 0 por 100, lo que indica que existe diferenciasignificativa en el gasto de llamadas telefónicas.

Como el intervalo de confianza es negativo, se deduce que el gasto medio en llamadastelefónicas del departamento Y es superior al del departamento X, con una confianzadel 90 por ciento.

5. Se selecciona una muestra aleatoria de 600 familias, a las que se pregunta si tienen ono ordenador en casa. Contestaron afirmativamente 240 familias. Obtener un intervalode confianza al nivel del 95% para la proporción real de familias que poseen ordenadoren casa.

Solución:

La característica en estudio es dicotómica, hay que construir un intervalo de confianzapara el parámetro p (proporción) de la variable aleatoria binomial asociada al estudio dela característica.

Como el tamaño de la muestra es suficientemente grande, n = 600, se puede utilizar laaproximación normal.


1 /2/2 0,025

ˆ ˆˆˆ ˆ p 240 600 0,4 q 1 p 0,6 n 600p (1 p)ˆI (p) p z 1 0,95 0,05 / 2 0,025 z z 1,96n

0,950,4 . 0,6I (p) 0,4 1,96 0,36 ; 0,44

600

Con una confianza del 95% se puede afirmar que las familias poseen ordenador entre el36% y el 44%.

6. Según los dirigentes del partido A, la intención de voto del partido rival B, enAndalucía, es la misma que la que tiene en Madrid. Se realiza una encuesta a 100personas en Andalucía de los que 25 mostraron su apoyo al partido B, y a otras 100personas en Madrid de las que 30 se inclinaron por el partido B.

a) Construir un intervalo de confianza del 90% para la proporción de personas quevotarían al partido B en Andalucía

b) ¿A cuántas personas habría que encuestar para obtener un margen de error o errorde estimación 2%, al nivel de confianza anterior?.

c) Construir un intervalo de confianza al 90% para la diferencia de proporciones en laestimación del voto del partido B en las dos comunidades. ¿Podemos afirmar que losdirigentes del partido A tienen razón?.

Solución:

a) La característica en estudio en ambas comunidades es dicotómica, tenemos queconstruir un intervalo de confianza para el parámetro 1p (proporción) de la variablealeatoria binomial asociada al estudio de la característica en la comunidad de Andalucía.Como el tamaño de la muestra es suficientemente grande, 1n 100 , se puede utilizar laaproximación normal.

1 1 1 11 /2

/2 0,05

ˆ ˆˆp 25 100 0,25 q 1 p 0,75 n 100ˆ ˆp (1 p)ˆI (p) p zn 1 0,90 0,10 / 2 0,05 z z 1,645

0,90 10,25 . 0,75I (p ) 0,25 (1,645) 0,179 ; 0,321

100

En Andalucía la intención de voto del partido B se encuentra entre el 17,9% y 32,1%,con un nivel de confianza del 90%.

b) La amplitud o longitud vendrá dado por la fórmula:


2

21 /2 /2

ˆ ˆ ˆ ˆproporción error p (1 p) p .qˆI I (p) p z zn nmuestral estimación

2/2

2

ˆ ˆ(z ) (p .q)de donde, n

El caso más desfavorable será cuando ˆ ˆp q 0,5 .

Siendo 2

2 2 (1,645) (0,5.0,5)( 0,02) 0,0004 n 16910,0004

c) Se trata de un intervalo de confianza para la diferencia de parámetros poblacionales1 2(p p ) de dos distribuciones binomiales, con el tamaño de las muestras

suficientemente grandes, 1 2n n 100, para utilizar la aproximación normal.

1 1 2 21 1 2 1 2 /2

1 2

ˆ ˆ ˆ ˆp (1 p ) p (1 p )ˆ ˆI (p p ) (p p ) zn n

1 1 1 1

2 2 2 2

/2 0,05

ˆ ˆˆp 25 100 0,25 q 1 p 0,75 n 100ˆ ˆˆp 30 100 0,3 q 1 p 0,70 n 100

1 0,90 0,10 2 0,05 z z 1,645

0,90 1 20,25 . 0,75 0,3 . 0,70I (p p ) (0,25 0,3) 1,645 0,153 ; 0,053

100 100

El intervalo de confianza cubre el cero, lo que indica que no existe diferenciasignificativa entre la intención de voto del partido B en ambas comunidades, con lo cuallos dirigentes del partido A tienen razón con una fiabilidad del 90%.


7. Un fabricante de televisores está desarrollando un nuevo modelo de televisor encolor, y para este fin se pueden utilizar dos tipos de esquemas transistorizados. Elfabricante selecciona una muestra de esquemas transistorizados del primer tipo detamaño 16, y otra del segundo tipo de tamaño 13. Los datos muestrales respecto a lavida media de cada esquema son los siguientes:

1 1 1

2 2 2

x 1400 horas s 30 horas n 16x 1500 horas s 17 horas n 13

Construir un intervalo de confianza del 90% para la diferencia de vida media de cadatipo de esquema.

Solución:

Sea la variable aleatoria X1 = 'vida media del primer esquema', que sigue unadistribución normal 1 1N( , ) . Análogamente, la variable aleatoria X2 = 'vida media delsegundo esquema', sigue una distribución normal 2 2N( , ) .

Hay que construir un intervalo de confianza para la diferencia de medias poblacionales1 2( ) con varianzas poblacionales desconocidas, y se desconoce si distintas o no,

siendo las muestras pequeñas 1 2n n 29 30 .

Para dilucidar si las varianzas poblacionales desconocidas son o no distintas, seconstruye primero un intervalo de confianza para el cociente de varianzas 2 2

1 2( ) , demodo que si el intervalo cubre al punto 1 se puede partir de que las varianzas sondesconocidas pero iguales.

Para construir un intervalo de confianza para el cociente de varianzas se emplea lafórmula:

1 2

1 2 1 2 2 1

2 2 2 22 2 1 2 1 2

1 1 1 (1 /2) ; ( n 1) , ( n 1)/2 ; ( n 1) , ( n 1) (1 /2) ; ( n 1) , ( n 1) /2 ; ( n 1) , ( n 1)

s s s s 1I ( ) ; siendo FF F F

2 22 2 2 21 1 2 2 1 2s 30 900 n 16 s 17 289 n 13 s / s 900 / 289 3,1141 0,90 / 2 0,05

0,05; 15,12 0,95; 15,12 0,05; 12,15F 2,6169 F 1 / F 1 / 2,4753 0,404

de donde, 2 20,90 1 2

3,114 3,114I ( ) ; 1,19 ; 7,712,6169 0,404

El intervalo no cubre el punto uno, y por tanto las varianzas poblacionales sondesconocidas y distintas, con una fiabilidad del 90%.


Nos situamos ante un intervalo de confianza para la diferencia de mediaspoblacionales 1 2( ) con varianzas poblacionales desconocidas y distintas o no, conmuestras pequeñas 1 2n n 29 30 .

/2 , f

22 2 2 21 2 1 1 2 2

1 1 2 /2 , f 22221 2 2 21 1

1 2

t donde f es la aproximación de Welch

s s s / n s / nI ( ) (x y ) t f 2 n n (s n )(s n )n 1 n 1

siendo,

222 2 21 1 1 1 1 1

222 2 22 2 2 2 2 2

2 2 22 2 2 21 1 2 2 1 2

1 2

s 30 900 n 16 s / n 900 / 16 56,25 s / n 3164,06

s 17 289 n 13 s / n 289 / 13 22,23 s / n 494,17

s / n s / n s s186,12 13,294 6159,11

17 14 n n

22 21 1 2 2

22222 21 1

1 2

s / n s / n 6159,11f 2 2 28,89 29186,12 13,294(s n )(s n )

n 1 n 1

1 2 /2 , f 0,05 ; 29x 1400 horas x 1500 horas t t 1,699

0,90 1 2900 289I ( ) (1400 1500) (1,699) 115,05 ; 84,9516 13

El intervalo no cubre el cero, concluyendo que existe diferencia significativa entre lavida media de cada esquema, siendo mayor la vida media del segundo esquema con unafiabilidad del 90%.


8. Un instituto de investigaciones agronómicas siembra, en cinco parcelas diferentes,dos tipos de maíz híbrido. Las producciones en quintales métricos por hectárea son:

1 2 3 4 5Híbrido I 90 85 95 76 80Híbrido II 84 87 90 92 90

a) Construir un intervalo de confianza para el cociente de varianzas con un error designificación de 0,10.

b) Construir un intervalo de confianza del 90% para la diferencia entre lasproducciones medias.

Solución:

a) Sea la variable aleatoria X1 = 'producción de maíz del híbrido I', que sigue unadistribución normal 1 1N( , ) . Análogamente, la variable aleatoria X2 = 'producción demaíz del híbrido II', sigue una distribución normal 2 2N( , ) .

Al construir un intervalo de confianza para el cociente de varianzas se puede concluir silas varianzas poblacionales desconocidas son o no distintas.

De modo que, si el intervalo de confianza para el cociente de varianzas 2 21 2( ) cubre

al punto 1 podremos partir de que las varianzas son desconocidas pero iguales.

1 2

1 2 1 2 2 1

2 2 2 22 2 1 2 1 2

1 1 2 (1 2) ; (n 1) ,(n 1)2;(n 1),(n 1) (1 2); (n 1),(n 1) 2 ; (n 1) ,(n 1)

s s s s 1I ( ) ; donde F

F F F

En el caso,

21 1 1

2 2 22 2 2 1 2

0,05 ; 4, 4 0,95 ; 4, 4 0,05 ; 4, 4

n 5 x 85,20 s 57,7 / 2 0,05n 5 x 88,6 s 9,8 s /s 57,7 / 9,8 5,89F 6,3883 F 1 / F 1 / 6,3883 0,1565

2 20,90 1 2

5,89 5,89I ( ) ; 0,92 ; 37,646,3883 0,1565

El intervalo cubre el uno, y concluimos que las varianzas poblacionales son desconocidase iguales, con una fiabilidad del 90%.

b) Se trata de un intervalo de confianza para la diferencia de medias poblacionales1 2( ) con varianzas poblacionales desconocidas pero iguales, con muestras pequeñas

1 2n n 10 30 .

1 21 1 2 /2 , (n n 2) p1 2

1 1I ( ) (x y ) t . s .n n


donde, 2ps media ponderada de las cuasivarianzas muestrales:

2 22 21 1 2 2

p p p1 2

(n 1)s (n 1)s 4 (57,7) 4 (9,8)s s 33,75 s 5,81n n 2 5 5 2

1 21 2 1 2 /2 , (n n 2) 0,05 ; 8n n 5 x 85,20 x 88,6 t t 1,860

0,90 1 21 1I ( ) (85,20 88,6) (1,860) (5,81) 10,23 ; 3,435 5

El intervalo de confianza cubre el cero, por lo que no existe diferencia significativaentre las producciones medias, con una fiabilidad del 90%.

9. Un equipo de investigación biológica está interesado en ver si una nueva drogareduce el colesterol en la sangre. Con tal fin toma una muestra de diez pacientes ydetermina el contenido de colesterol en la sangre antes y después del tratamiento. Losdatos muestrales expresados en miligramos por 100 mililitros son los siguientes:

Paciente 1 2 3 4 5 6 7 8 9 10Antes 217 252 229 200 209 213 215 260 232 216Después 209 241 230 208 206 211 209 228 224 203

Construir un intervalo de confianza del 95 por 100 para la diferencia del contenidomedio de colesterol en la sangre antes y después del tratamiento.

Solución:

Se trata de datos apareados, en los que no existe independencia entre las muestras.En este caso, como la muestra es pequeña (n 10 30) el intervalo de confianza es:

nn2

iid i 12i 1

/2 , (n 1) di i i

(d d)dsI d t sd x y d n 1n n

donde d es la media de las diferencias y ds la desviación estándar de estasdiferencias.

X = 'Antes' 217 252 229 200 209 213 215 260 232 216Y = 'Después' 209 241 230 208 206 211 209 228 224 203

i i id x y 8 11 - 1 - 8 3 2 6 32 8 13

2d d /2 , (n 1) 0,025 ; 9n 10 d 7,40 s 112,1481 s 10,59 t t 2,262


0,95 1 210,59I ( ) 7,40 (2,262) 0,17 ; 14,97

10

El intervalo abarca el cero, por lo que no existe diferencia significativa en la diferenciadel contenido medio del colesterol antes y después del tratamiento, con una fiabilidaddel 95%.

estadÍstica teÓrica: contrates de hipÓtesis intervalos ... · intervalos de confianza. ... la...

Documents