e.d - prob - inf - estim - hip - asoc - anova.pdf

62
Capítulo 1 Estadística Descriptiva 1.1. Cuestiones te óricas 1. Razonar si son verdad eras o fal sas cad a una de las sig uien tes a rmaciones: a ) Si la me dia es c ero, e nto nces todos los da tos so n cero . b ) Las me didas de d ispers ión toman siempre valore s positiv os. c ) Si la media es positiva, en tonces t odos los d atos so n positivos. d ) Si todos los datos son negativos, entonces la media es negativa. e ) La mediana se ve menos inuenciada que la media frente a datos extremos.  f  ) Si le sumamos 3 a todos los dat os, la nueva media es igual a la anterior. g ) Si le sumamos 3 a todos los dato s, la nue v a varianza es igual a la anterior. h ) Si dividimos todo s los dato s por 5, la nue v a media es l a ante rior di vidida por 5. i ) Si divid imos todos lo s datos por 5, la nue v a va rianz a es la ante rior div idida por 5.  j ) Si todos los datos s on nega tivo s, la med iana es n egati v a. k ) Si todos los datos son negativos, los cuartiles  Q 1  y  Q 3  son negativos. l ) Si todos los datos so n negativ os, el rango in tercu artíl ico es negativo. m ) El r ang o pue de s er ne ga tivo. n ) Siemp re se pue de calcular la recta de regre sión m uestr al. ñ ) Si una mu estra de da tos pre sen ta media 0, su de sviac ión típic a será pequeña. o ) Cuan to may or es el tamaño de la mue stra, may or es su var ianza . p ) Cuan to may or es el tama ño de la muestra, mayor es su media. 1

Upload: lsn-oeficialfb-vp

Post on 05-Jul-2018

229 views

Category:

Documents


0 download

TRANSCRIPT

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 1/62

Capítulo 1

Estadística Descriptiva

1.1. Cuestiones teóricas1. Razonar si son verdaderas o falsas cada una de las siguientes afirmaciones:

a ) Si la media es cero, entonces todos los datos son cero.

b) Las medidas de dispersión toman siempre valores positivos.

c ) Si la media es positiva, entonces todos los datos son positivos.

d ) Si todos los datos son negativos, entonces la media es negativa.

e ) La mediana se ve menos influenciada que la media frente a datos extremos.

 f  ) Si le sumamos 3 a todos los datos, la nueva media es igual a la anterior.g ) Si le sumamos 3 a todos los datos, la nueva varianza es igual a la anterior.

h ) Si dividimos todos los datos por 5, la nueva media es la anterior dividida por5.

i ) Si dividimos todos los datos por 5, la nueva varianza es la anterior divididapor 5.

 j ) Si todos los datos son negativos, la mediana es negativa.

k ) Si todos los datos son negativos, los cuartiles Q1 y  Q3 son negativos.

l ) Si todos los datos son negativos, el rango intercuartílico es negativo.

m ) El rango puede ser negativo.

n ) Siempre se puede calcular la recta de regresión muestral.

ñ ) Si una muestra de datos presenta media 0, su desviación típica será pequeña.

o) Cuanto mayor es el tamaño de la muestra, mayor es su varianza.

p) Cuanto mayor es el tamaño de la muestra, mayor es su media.

1

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 2/62

2   CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

2.

Cuando observes un gráfico o una tabla,particularmente como parte de un anun-cio, sé cauteloso. Como ejemplo clási-

co, mostramos la representación de lavariación del poder adquisitivo del dólarentre 1958 y 1978, aparecida en el Wash-ington Post, el 25 de Octubre de 1978, me-diante 5 billetes de dólar cuya longitud esproporcional al valor del dólar en cada mo-mento.En este caso, mientras que la variación delpoder adquisitivo es en una sola dimensión,el efecto visual que se percibe es el asoci-ado al área del billete y se varían dos di-

mensiones. Así el billete menor del gráfico,1 dólar de 1978, vale 44 centavos de dólarde 1958 y tiene una longitud que es, cor-rectamente, un 44 % del billete mayor querepresenta el dólar de 1958.Sin embargo su área es solamente un 19 %de la del billete mayor, lo que da la im-presión de una reducción drástica en elpoder adquisitivo. ¿Cómo podrían repre-sentase  fidelignamente estos datos?

3. Para cada uno de los siguientes histogramas de frecuencias, determinar su simetríay calcular cuál es su media, mediana, moda, varianza y cuartiles.

(a)

4,03,02,01,00,0-1,0-2,0-3,0-4,0

6

5

4

3

2

1

0

(b)

2,01,00,0-1,0-2,0-3,0-4,0-5,0

6

5

4

3

2

1

0

(c)

5,04,03,02,01,00,0-1,0-2,0-3,0-4,0-5,0

5

4

3

2

1

0

4. Se tienen 30 datos numéricos correspondientes a la medición del peso en kg de 30individuos. ¿En qué dimensiones se expresarán la media aritmética, la varianza, ladesviación típica y el coeficiente de variación? ¿Cómo quedarían modificadas estasmedidas si expresáramos dichos datos en gramos?

5. ¿Crees que la varianza es una medida adecuada para comparar la dispersión entre

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 3/62

1.1. CUESTIONES TEÓRICAS    3

varias variables que posean diferente magnitud o diferente unidad de medida? ¿Cuáles la más adecuada?

6. Considera los dos grupos de datos siguientes:a) 1,80 1,79 1,77 1,83 1,52b) 180 179 177 183 152

¿Tienen la misma media? ¿la misma desviación típica? ¿Tienen en común algúnparámetro descriptivo de los considerados en el capítulo?

7. Demostrar que Pn

i=1(xi − x) = 0.

8. ¿Qué transformaciones sufren la media aritmética y la varianza de una variableestadística X  cuando se aumentan sus valores en  k  unidades?

9. ¿Qué transformaciones sufren la media aritmética y la desviación típica de unavariable estadística X  cuando se multiplican sus valores por un factor  k?

10. Se expresan a continuación las longitudes de 7 objetos, medidas en cm

7,0 7,4 8,9 9,6 10,5 11,7 12,5

Calcula la media y desviación típica de los 7 datos.

Determinar, utilizando únicamente las medidas calculadas en el apartado an-terior, la media, la desviación típica, la varianza, y el coeficiente de variaciónde los mismos datos expresados en  mm.

11. Se mide cierta variable sobre una muestra de 10 individuos, obteniéndose los sigu-ientes datos:

4 5 4,5 3,9 5,2 4 5,2 5,3 23 4,1

Dar una medida de centralización y otra de dispersión adecuadas.

12. Escribir, si es posible, un conjunto de 10 datos que tenga:

a ) La media cero y la varianza la unidad

b) La media cero y todos los valores sean positivos

c ) La media y la varianza negativas

d ) La media positiva y la varianza negativa

e ) La media negativa y la varianza positiva

 f  ) La varianza nula, siendo al menos dos de los 10 valores diferentes

g ) Un rango intercuartílico negativo

h ) La media, mediana y moda iguales

i ) La media sea menor que la mediana y ésta menor que la moda

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 4/62

4   CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

 j ) La media sea mayor que la mediana y ésta mayor que la moda

k ) Un coeficiente de asimetría negativo

l ) Un coefi

ciente de asimetría positivom ) Un coeficiente de aplastamiento negativo

n ) Un coeficiente de aplastamiento positivo

13. Escribir, si es posible, dos conjuntos de 10 datos cada uno, que presenten:

a ) Igual media pero distinta desviación típica.

b) Igual desviación típica pero distinta media.

c ) Igual media y distinta mediana.

d ) Igual mediana y distinta media.

e ) Igual media y varianza pero distinto coeficiente de variación.

 f  ) Distinta media y varianza pero igual coeficiente de variación.

14. Considera el siguiente grupo de datos:

3,1 2,7 4,3 5,3 0,1 3,7 7,3 1,8 4,3 3,0 3,6 8,2 2,6 6,1 7,8 1,4 5,0

a ) Calcula la media, la desviación típica, la mediana y el rango intercuartílico.

b) Construye otro grupo de 17 datos con la misma media y desviación típica 8.

c ) Construye otro grupo de 17 datos con la misma mediana y rango intercuar-

tílico 5.

15. Tenemos un conjunto con 10 elementos para los cuales hemos calculado distintasmedidas descriptivas. Marcar qué ocurrirá con cada una de las siguientes medidasdel nuevo conjunto de datos, tras hacer las siguientes modificaciones:

Medida Aumenta  Permanece

constante  Disminuye

  No se puededeterminar

MediaRangoMediana

Rango intercuartílicoDesviación típicaCoeficiente de variación

a ) Modificamos el dato menor.

b) Modificamos el dato menor, transformándolo en uno más pequeño aun.

c ) Modificamos el dato mayor, transformándolo en uno más pequeño.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 5/62

1.2. EJERCICIOS Y PROBLEMAS    5

16. Calcular la medida de centralización y de dispersión que mejor resuma la informa-ción que contienen los siguientes datos:

a) 1,7 2,3 1,5 3,0 2,5 1,9 18 2,3 1,8 2,1

b) 4 5 4,5 3,9 5,2 4 5,2 5,3 2,3 4,1

17. Una muestra de temperaturas para iniciar cierta reacción química dio una mediamuestral (en   oC) de 87.3 y una desviación estándar de 1.04   oC. ¿Cuáles son lamedia muestral y la desviación entándar, medidas en   oF?1

1.2. Ejercicios y Problemas

1. Los siguientes datos de octanaje de varias mezclas de gasolina fueron tomados deuna revista dedicada a aplicaciones estadísticas en ciencias físicas e ingeniería:

88.5 87.7 83.4 86.7 87.5 91.5 88.6 100.395.6 93.3 94.7 91.1 91.0 94.2 87.8 89.988.3 87.6 84.3 86.7 88.2 90.8 88.3 98.894.2 92.7 93.2 93.2 91.0 90.3 88.3 90.189.2 88.3 85.3 85.3 87.9 88.6 89.0 96.193.3 91.8 91.8 92.3 90.4 90.1 88.7 89.989.8 89.6 89.6 87.4 88.9 91.2 94.4 92.791.8 91.6 89.8 90.4 91.1 92.6 90.6 91.1

90.4 89.3 89.7 90.3 91.6 90.5 93.7 92.792.2 92.2 91.2 91.0 92.2 90.0 90.7 90.3

a ) Representar un diagrama de tallo y hojas para estos datos.

b) ¿Revela el diagrama algunas propiedades importantes de los datos?

c ) Agrupar los datos en intervalos y calcular la tabla de frecuencias.

d ) Representar el histograma de frecuencias absolutas.

e ) ¿Revela más o menos información que el diagrama de tallo y hojas?

 f  ) Calcular la media, la mediana, la moda, el rango, la desviación típica, el rango

intercuartílico, el coeficiente de variación, y los coeficientes de simetría y decurtosis.

2. Actualmente se realizan esfuerzos para elaborar textiles de   fibra de turba. Estocreará una fuente de materiales económicos para la industria textil y papelera.Una variable estudiada es   X   :  “tanto por ciento de contenido en ceniza de una 

1 Sugerencia  F   =  9

5C  + 32.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 6/62

6   CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

determinada turbera ”. En una muestra de 50 turberas se obtuvieron los siguientesresultados:

0,5 1,8 4,0 1,0 2,0 1,1 1,6 2,3 3,5 2,2

2,0 3,8 3,0 2,3 1,8 3,6 2,4 0,8 3,4 1,41,9 2,3 1,2 1,9 2,3 2,6 3,1 2,5 1,7 5,01,3 3,0 2,7 1,2 1,5 3,2 2,4 2,5 1,9 3,12,4 2,8 2,7 4,5 2,1 1,5 0,7 3,7 1,8 1,7

a ) Agrupar los datos en 6 intervalos y representar los histogramas de frecuenciasabsolutas y relativas acumuladas, así como los correspondientes polígonos defrecuencias.

b) Representar el diagrama de tallo y hojas.

c ) Calcular la media, la mediana, la moda, el rango y la desviación típica.

d ) Calcular el coeficiente de simetría y de apuntamiento.

3. Un fabricante de componentes electrónicos se interesa en determinar el tiempo devida de cierto tipo de baterías. Para ello, toma una muestra de 26 baterías, elegidasal azar, y hace un seguimiento de su duración, obteniendo las siguientes horas devida:

30 70 100 100 60 50 45 120 110 100150 105 60 20 100 90 100 80 150 130140 120 70 100 60 80

a ) Agrupar en intervalos.

b) Construir la tabla de frecuencias.

c ) Calcular las dos medidas estadísticas que resuman mejor la información quecontienen los datos.

4. Completar la siguiente tabla de frecuencias:

xi   ni   N i   f i   F i3   6

6   11 0.125

9   0.500

12   7

13   0.250

14 1

5. El polígono de frecuencias siguiente, nos da las puntuaciones obtenidas en Estadís-tica por un grupo de 20 alumnos

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 7/62

1.2. EJERCICIOS Y PROBLEMAS    7

 

20 40 50 60 80 100

0.15

0.45

0.75

0.90

1

 F i

 Puntuaciones 

a ) Construir la tabla de frecuencias.

b) ¿Cuántos alumnos obtuvieron puntuaciones entre 40 y 70?

c ) Encontrar gráficamente la mediana y la moda.Si se le hace otra prueba al mismo grupo de alumnos, y se obtienen las pun-tuaciones:

50 55 100 25 50 40 55 60 25 4570 55 15 45 55 60 55 40 45 55

d ) Construir la tabla de frecuencias y calcular la mediana.

e ) ¿Qué datos están más dispersos, los obtenidos en la primera prueba o en la

segunda?

6. Se midió una variable en 200 individuos. La información recogida en dicha muestrase ha agrupado en 6 clases de la misma amplitud, resultando la siguiente tabla:

Altura  (cm)   ni   N i   f i   F i2

(100,120]   0.06

10

35

0.6

0.115

a) Completar la tabla de frecuencias.

b) Representar el histograma de frecuencias relativas acumuladas, e indicar enqué intervalo se encuentra la mediana.

7. Dadas las seis observaciones: −10,  3,  x,  10,  1,  0, se sabe que su desviación típicaes igual a su coeficiente de variación. Se pide:

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 8/62

8   CAPÍTULO 1. ESTADÍSTICA DESCRIPTIVA

a ) Calcular el valor de  x

b) Hallar la media y la varianza de la distribución

c ) ¿Es simétrica?d ) ¿Qué transformación sufre el coeficiente de variación si multiplicamos los val-

ores de las observaciones por  k? ¿Y si los dividimos por  k?

8. Se mide el pH sobre una muestra de 10 disoluciones acuosas, obteniéndose lossiguientes datos:

(a) 4 5 4,5 3,9 5,2 4 5,2 5,3 3 4,1

(b) 4 5 4,5 3,9 5,2 4 5,2 5,3 23 4,1

Calcular la medida de centralización y la de dispersión adecuada, en cada caso.

9. Se han medido los pesos y las alturas de diez personas, obteniéndose los datossiguientes:

Peso   58 80 75 65 60 65 63 68 68 70Altura    1 .55 1.80 1.75 1.70 1.50 1.60 1.60 1.70 1.75 1.80

¿Qué medidas están más dispersas, los pesos o las alturas?

10. Una empresa de butano quiere colocar en una red viaria un depósito para abastecera los pueblos que están en los kilómetros 10, 50, 80, 140, 290 y 450. Se pide:

a ) Suponiendo que todos los pueblos consumen la misma cantidad de butano, ¿enqué kilómetro deben colocar el depósito de forma que los gastos de abastec-imiento sean mínimos?

b) Si se sabe que los pueblos que están situados en los lilómetros 140 y 290consumen el doble que los otros, ¿en qué lugar se debería colocar ahora eldepósito?

11. Dos distribuidores de productos químicos tienen los siguientes registros de ventasdurante un periodo de tiempo:

Vendedor 1 Vendedor 2Media mensual 4000  €   5000  €Desviación típica 300  €   400  €

¿Cuál de los dos vendedores parece más constante en el volumen de ventas?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 9/62

Capítulo 2

Probabilidad

2.1. Cuestiones teóricas1. Encontrar los errores en cada una de las siguientes afirmaciones:

a ) Las probabilidades de que un vendedor de automóviles venda exactamente 0,1, 2 ó 3 automóviles un día determinado son 0.19, 0.38, 0.29 y 0.15, respecti-vamente.

b) La probabilidad de que llueva mañana es 0.4 y la probabilidad de que nollueva es 0.52.

c ) Las probabilidades de que una impresora cometa 0, 1, 2, 3 ó 4 errores alimprimir un documento son 0.19, 0.34, -0.25, 0.43 y 0.29, respectivamente.

d ) Al sacar una carta de una baraja en un único intento, la probabilidad deseleccionar corazones es 1/4, la probabilidad de seleccionar una carta negraes 1/2, y la probabilidad de seleccionar una carta negra de corazones es 1/8,puesto que se trata de sucesos independientes.

2. Sean A  y  B  dos sucesos tales que:

P  (A ∩B) = 1

6, P 

¡ B¢

 = 1

2  y P  (B ∪A) =

 2

3

Encontrar  P  (A) y  P  (B) .

3. Si A  y  B  son dos sucesos independientes, entonces  A y  B  también lo son.

4. Si dos sucesos son incompatibles, ¿podrían ser también independientes?

5. Calcula la probabilidad de obtener dos caras tras cinco lanzamientos de una mon-eda no trucada. ¿Coincide con la probabilidad de obtener 20 caras tras 50 lanza-mientos de la misma moneda?

9

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 10/62

10   CAPÍTULO 2. PROBABILIDAD

6. Se extrae una bola de un bombo que cuenta con 999 bolas iguales numeradas del 1al 999. Calcular la probabilidad de que la bola extraída sea la  no1. Supongamos quetras cada extracción se repone la bola extraída. Calcula entonces la probabilidad

de que, tras diez extracciones, las bolas seleccionadas sean las números 1, 2, 3, 4,5, 6, 7, 8, 9 y 10 (en este mismo orden).

7. Se lanzan dos veces un par de dados. ¿Cuál es la probabilidad de obtener totalesde 7 y 11?

8. De acuerdo con el teorema de Chebyschev, la probabilidad de que cualquier vari-able aleatoria tome un valor dentro de tres desviaciones estándar de la mediaes al menos 8/9. Si se sabe que la distribución de probabilidad de una variablealeatoria   X   es normal, con media   µ,  y varianza   σ2,  ¿cuál es el valor exacto deP  (µ− 3σ < X < µ + 3σ)?

9. Se estudia una cierta variable bioquímica  X  (medida en gramos) sobre una deter-minada población. Se conoce que el valor de la media es  µ  = 1 y el de la varianzaes  σ2 = 0. ¿Cómo se interpretan estos datos?

10. Ordenar las medias y las desviaciones típicas de las curvas de las distribucionesnormales representadas en la  figura:

-6 -4 -2 2 4 6 8

0.2

0.4

0.6

0.8

11. Representar las funciones de densidad de tres variables aleatorias con distribucionesde probabilidad:

a ) Normal con la misma desviación estándar (por ejemplo 1), pero con diferentemedia (por ejemplo 0, 2 y 5).

b) Normal con la misma media (por ejemplo 0) y con diferentes desviacionesestándar por (por ejemplo 1, 2 y 5).

c ) Binomiales con  p  = 0,3, pero diferente valor de  n  (por ejemplo 5, 10 y 20).

d ) Binomiales con  n = 20 pero con diferente valor para  p (por ejemplo 0.1, 0.5y 0.9).

e ) Analizar las gráficas y extraer las conclusiones oportunas.

12. Demostrar que si X  es una variable aleatoria continua, entonces  P  (X  =  k) = 0,para cualquier valor de la constante  k.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 11/62

2.1. CUESTIONES TEÓRICAS    11

13. Una variable aleatoria, X,  sigue un modelo de distribución normal, con  σ  = 10. SiP  (X < 82,5) = 0,8212, ¿cuanto valdría  P  (X > 58,3)?

14. Se estudia determinado carácter cuantitativo sobre una población. La correspon-diente variable X  resulta seguir un modelo de distribución Normal, con media 20y varianza 25.

a ) Calcular la proporción de individuos cuyo valor de la variable es inferior a31.2.

b) Calcular la proporción de individuos cuyo valor de la variable está compren-dido entre 30 y 20.

c ) Calcular aproximadamente la proporción de individuos cuyo valor de la vari-able es superior a 50.

d ) Calcula la proporción de individuos cuyo valor de la variable es igual exacta-mente a 25.

e ) ¿Qué valor de la variable es superado por el 97.93% de la población?

15. Se tienen dos variables X  ∼  N (12, 4) e  Y  ∼ N (12, 2). Razonar (sin necesidad dehacer cálculos) si son verdaderas o falsas cada una de las siguientes afirmaciones:

a )   P (X > 11)   > P (Y > 11)

b)   P (X  ≤ 12)   < P (Y  ≥ 12)

c )   P  (8 ≤ X  ≤ 16) = P  (10 ≤ Y  ≤ 14)

d )   P  (X  ≤

16) = P  (Y  ≥

10)

16. Si X  ∼ N (0, 1), calcula el número positivo  z  tal que  P (−z ≤ X  ≤ z) = 0,95.

17. Consideremos una variable bioquímica   X  que sigue un modelo de distribuciónNormal, con media 3, presentando el 51.60% de la población un valor de la variableinferior a 3.5. ¿Qué valor de la variable es superado por el 15.87 % de la población?

18. Se está estudiando un procedimiento para medir la glucosa en la sangre. Se com-prueba que el método no es exacto, pues el contenido de glucosa medido en unadeterminada porción de sangre difiere de su verdadero valor. Más aún, distintasmediciones de una misma porción de sangre aportaron distintos resultados. Se

comprobó además que los distintos errores obtenidos se agrupan formando unaCampana de Gauss, por lo que podemos considerar que la variable   X   : “errorcometido tras medir glucosa en sangre” sigue un modelo de distribución Normal.

a ) ¿Que hemos de hacer para averiguar lo posible acerca de la media y ladesviación típica de dicha variable?

b) Supongamos conocidos los valores de µ y σ. Ordena por orden de conveniencialos siguientes casos:

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 12/62

12   CAPÍTULO 2. PROBABILIDAD

X  ∼ N (3, 1)

X  ∼ N (0, 4)

X  ∼

N (3, 4)

X  ∼ N (0, 1)

19. Supongamos que cierta variable bioquímica, por ejemplo colesterolemia [mg/cm3],sigue aproximadamente un modelo de distribución Normal de media 20 y desviacióntípica 4. Si analizamos la función de densidad tipo Normal, observaremos que esposible que se den valores negativos de la variable, lo cual sería absurdo en estecaso. ¿Qué opinas al respecto?

20. Consideremos cierta variable bioquímica X . Se desea saber si se ajusta a un modelode distribución Normal. Es conocido que el 50 % de los individuos de la poblaciónpresentan un valor de la variable superior a 8, que el 20 % presentan un valor

superior a 10 y que el 2 % presentan un valor inferior a 6.

¿Contradicen estos datos la normalidad de la variable?

¿Puedes decir algo acerca del coeficiente de simetría  g1?

21. Supongamos que el nivel de acidez de determinado compuesto sigue un modelo dedistribución N (10, 5). Encontrar un intervalo de modo que, con una probabilidaddel   95 %, la acidez de una muestra del compuesto se sitúe dentro del intervalo.Encontrar el valor de acidez que es superado por el   50 %   de las muestras delcompuesto.

22. Calcula la esperanza y la varianza de la variable aleatoria X  : “resultado obtenidotras lanzar un dado no trucado”.

23. Demuestra, en el caso discreto, que  E (k + X ) =  k +  E (X )  y que  V ar(k ·  X ) =k2 · V ar(X ).

24. Describe un ejemplo, dentro de tu campo cientí fico, en el que debamos utilizar elmodelo de Poisson.

25. Si una variable   X   sigue una distribución de campana de Gauss de media   µ   ydesviación típica   σ, la probabilidad de que un valor se encuentre entre   µ − σ   yµ + σ es, aproximadamente, del 68 %. ¿Se trata de un hecho experimental o existealguna forma de probarlo?

26. Cuando se habla de probabilidad, debemos estar necesariamente refiriéndonos aun fenómeno aleatorio. Por ejemplo: podemos hablar de probabilidad de obtenercara tras lanzar una moneda, probabilidad de que la suma de las puntuaciones dedos dados sea 7, etc. Sin embargo, con frecuencia se utilizan expresiones como lasiguiente:  la probabilidad de que un individuo varón mayor de 18 años mida más de   1,74m  es del 50% . ¿A qué fenómeno aleatorio nos estamos refiriendo en estecaso?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 13/62

2.1. CUESTIONES TEÓRICAS    13

27. Considera la siguiente  figura:

1º2º

12º

14º

11º

13º

10º

NIVELES

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14   POSICIÓN

DEPÓSITO

1º2º

12º

14º

11º

13º

10º

NIVELES

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14   POSICIÓN

DEPÓSITO

¿Cuál es la probabilidad de que una bola introducida en la abertura superior

termine en la posición 7 del depósito? Si se introducen un total de 200 bolas, ¿quefigura se formará en el depósito, una vez hayan caído todas?

28. ¿Qué entiendes por función de densidad? ¿y por función de probabilidad? ¿Puedesindicar algún ejemplo de cada una de ellas, contenido en las tablas? Razona porqué no tiene sentido hablar de función de probabilidad con variables aleatoriascontinuas.

29. Ochenta jugadores juegan a la lotería. Cada uno de ellos elige un número del 1al 100 (todos distintos). ¿Cuál es la probabilidad de que un determinado jugadorgane al menos una vez tras 200 sorteos independientes? Si los 20 números restantespertenecen a la banca, ¿cuál es la probabilidad de que la banca gane como mucho

50 veces? ¿Son ambos cálculos exactos?

30. Once estudiantes de la Facultad de Ciencias son condenados a asistir a un cursoavanzado de Estadística, en completo silencio y prestando la máxima atención, peroantes de semejante tortura se les concede pedir un último deseo. Cuando el queaprobó Estadística y Programación nota que tardan 5 minutos en acomodarlos enel aula, pide que los ejecuten tras colocarlos de todas las formas posibles. Explicarpor qué salvó a sus compañeros.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 14/62

14   CAPÍTULO 2. PROBABILIDAD

31.   Sopa de letras . Buscar y marcar las palabras que se definen a continuación:

1.- Conjunto de todos los resultados posibles de un experimento aleatorio. 2.- Medidade incertidumbre. 3.- Función con valores reales, definida sobre el espacio muestral. 4.-Valor central, en el sentido aritmético, o centro de gravedad. 5.- Modelos de distribucióndiscretos. 6.- Modelo de distribución continuo más común. 6.- Experimento que bajo lasmismas condiciones inidiales, produce distintos resultados  finales. 7.- Subconjunto del es-pacio muestral. 8.- Sucesos con intersección vacía. 9.- Sucesos tales que la probabilidadde su intersección es la intersección de las probabilidades. 10.- Suceso que no se verificanunca. 11.- Valor que expresa en qué medida se agrupan los datos en torno a la media.12.- Distribuciones de muestreo relacionadas con la normal.

D E J A K S N E D E C O R M I D Ñ C L IL O E R B H V J D P U G O B Q N E H L MT U H S S U N A S B L O S E C U S P A P

A U Z Ñ P R O B A B I L I D A D Q G M OI T D P O A R Z K H C E Y R S I M H R SR U K N I Z C L T B O C G T O S E B O IO A T A S N G I M E H Q V D I T R A N BT Y E O S J D P O V O Z A P I Ñ A V S LA L D O O Ñ Q E N M L G U E S J G E R EE Z M B N C H I P Y U J D S B K F Ñ L OL O G Q B Q A Z P E T E S P E R A N Z AA I J A R L N M G O N N S H F I K A E CE P B I N O M I A L M D B T U B J B M FL C R F I N Q V U C I P I A R T O S C O

B E U L Ñ A E K F D Q Y Ñ E V A Z F R QA D A R D A U C I H C V A R N S L A E DI N C O M P A T I B L E S Z L T P E Q NR A H C N J M R S F I R T T Ñ V E G U AA E Ñ M G A P K E B U T N E D U T S F IV A R I A N Z A O Ñ C N F K L F H D J A

2.2. Ejercicios y Problemas

1. A la ruleta se juega girando una bola sobre una rueda, dividida en 38 sectores de

igual longitud. Los sectores están numerados como 00, 0, 1, 2, ..., 36 y coloreadosde la siguiente manera:

Verde    00 0Rojo   1 3 5 7 9 12 14 16 18

19 21 23 25 27 30 32 34 36Negro   2 4 6 8 10 11 13 15 17

20 22 24 26 28 29 31 33 35

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 15/62

2.2. EJERCICIOS Y PROBLEMAS    15

Por supuesto, el sector dentro del cual cae la bola es el resultado de la jugada.Los jugadores pueden hacer apuestas de diversas maneras como par, impar, rojo,negro, bajo  (1

−18), y alto  (19

−36) . El verde queda reservado para la casa.

a ) Definir los siguientes eventos:A :   {el resultado es un número impar}B :   {el resultado es un número par}C   :   {el resultado es un número alto}D :   {el resultado es un número negro}

b) Calcular las siguientes probabilidades:

P  (A ∪B)   P  (A ∩ C )   P  (B ∪ C )   P ¡

 B¢

P  (A ∩B ∩C )   P  (A ∪D)   P ¡

 D¢

  P  (A ∩B ∩D)

2. Calcular las siguientes probabilidades:

a ) Probabilidad de sacar 5 caras y 7 cruces en 12 lanzamientos de una monedano trucada.

b) Probabilidad de que exactamente dos coches, de 10000, tengan un neumáticoreventado tras cruzar cierto puente, si sabemos que la probabilidad de que aun automóvil se le reviente un neumático, mientras cruza dicho puente, es de0.00005.

c ) Si el 2 % de los libros encuadernados en cierto taller tiene una encuadernacióndefectuosa, determinar la probabilidad de que 5 de 400 libros encuadernadosen este taller tenga encuadernaciones defectuosas.

d ) Si la probabilidad de que un banco rechace una solicitud de préstamo es 0.20,determinar la probabilidad de que rechace como mucho 40 de 225 solicitudesde préstamo.

3. Sea X  ∼ N  (0, 1) , una distribución normal estándar. Encontrar la probabilidad deque x  esté:

a ) a la izquierda de z  = 1,43, P  (X < 1,43) ,

b) a la derecha de z  = −0,89, P  (X > −0,89) ,

c ) entre  z  =

−2,16 y  z  =

−0,65, P  (

−2,16 < X <

−0,65) ,

d ) a la izquierda de z  = −1,39, P  (X < −1,39) ,

e ) a la derecha de z  = 1,66, P  (X > 1,66) ,

 f  ) entre  z  = −0,48 y  z  = 1,74, P  (−0,48 < X < 1,74) ,

Encontrar el valor  k  tal que:

g )   P  (X < k) = 0,0427,

h )   P  (X > k) = 0,2946,

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 16/62

16   CAPÍTULO 2. PROBABILIDAD

i )   P  (−0,93 < X < k) = 0,7235.

4. Dada una distribución normal con µ  = 30 y  σ  = 6, encontrar:

a ) El área de la curva normal a la derecha de x  = 17;

b) El área de la curva normal a la izquierda de x  = 22;

c ) El área de la curva normal entre x  = 32 y  x  = 41;

d ) el valor de x  que tiene el 80 % del área de la curva normal a la izquierda,

e ) los dos valores de x que contienen el 75% central del área de la curva normal.

5. Dada  X  ∼ N  (18, 2,5) , calcular:

a )   P  (X < 15)

b) el valor de k  tal que:  P  (X < k) = 0,2236

c ) el valor de k  tal que:  P  (X > k) = 0,1814

d )   P  (17 < X < 21) .

6. Se sabe que el coeficiente de inteligencia de una población (medido por una pruebaestándar) está distribuido normalmente, en forma aproximada, con   µ   = 100   yσ  = 15.  ¿Cuál es la probabilidad de que un individuo seleccionado al azar tengaun C.I. de 125?

7. En una empresa metalúrgica, los empleados se clasifican en tres categorías: técnicos,

especialistas y administrativos. En la tabla siguiente aparece la información delmes de Diciembre de 2004 respecto al no de empleados, salario medio mensual yvarianza de los salarios de cada categoría:

Categoría  Número de

empleadosSalario medio

mensual (en  €)Varianza delos salarios

Técnicos 20 1500 160000Especialistas 100 900 10000Administrativos 40 700 4900

I. Calcular el salario medio para el conjunto de la empresa y la dispersión de

los salariosII. En una discusión para  fi jar los salarios de 2005, se propusieron tres alternati-

vas diferentes:

(1) Aumentar todos los salarios en un 5 %

(2) Aumentar todos los salarios en 30  €

(3) Aumentar los salarios según el siguiente baremo: 4 % a los técnicos, 5 %a los especialistas y 5’5 % a los administrativos

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 17/62

2.2. EJERCICIOS Y PROBLEMAS    17

II. a) Calcular los salarios medios y la dispersión relativa que resulten, encada caso, de aplicar las tres alternativas.

II. b) ¿Cuál de las tres alternativas tiene mayor efecto para reducir la dis-

persión relativa inicial de los salarios en el conjunto de la empresa?

8. En una instalación de blanqueado de pasta de papel es necesario renovar dos reac-tores al mes, por término medio, debido a la corrosión. Cuál es la probabilidad deque en un mes determinado haya que renovar:

a ) más de tres reactores,

b) ninguno,

c ) alguno,

d ) exactamente dos,

e ) ¿cuál es la cantidad más probable de reactores que habrá que reponer en unmes?

9. Una central telefónica puede atender un máximo de cinco llamadas por minuto. Elpromedio de llamadas por hora es 210. Calcular:

a ) La probabilidad de que en un determinado minuto la central reciba más lla-madas de las que puede atender.

b) El número medio de minutos por hora en que la centralita podrá atendertodas las llamadas recibidas.

c ) La probabilidad de que no se produzca saturación en ningún minuto, a lolargo de una hora.

10. Un artículo publicado en el periódico explicaba que la puntuación media de losalumnos de la UEX en Estadística es de 4.8 y que el 20 % de ellos no supera el 4.Si asumimos que la variable sigue una distribución normal:

a ) Calcular la desviación estándar

b) ¿Qué porcentaje de estudiantes aprueba?

11. Iberia ha llegado a la conclusión de que el 5 % de las personas que compran un

billete, no llegan a embarcar. En consecuencia, ha adoptado la política de vender70 billetes para un vuelo con 68 asientos. ¿Cuál es la probabilidad de que todaslas personas que lleguen a ese vuelo encuentren asiento? ¿Crees que dicha políticaes razonable?

12. Supongamos que el número medio de grietas por  m2 de suelo, encementado concierto tipo de mezcla, sigue una distribución de Poisson. Supongamos además queel número medio de grietas es de 2.5.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 18/62

18   CAPÍTULO 2. PROBABILIDAD

a ) Calcular la media y la desviación típica de la variable aleatoria X   : “númeromedio de grietas por  m2”.

b) Calcular la probabilidad de que un m2 concreto, elegido al azar, tenga exac-tamente cinco grietas.

c ) Calcular la probabilidad de que un m2 concreto, elegido al azar, contenga doso más grietas.

d ) Calcular la probabilidad de que un   m2 concreto, elegido al azar, no tengagrietas.

e ) Calcular la probabilidad de que un m2 concreto, elegido al azar, tenga algunagrieta.

13. El sorteo de la ONCE consta de 100.000 números (del 00000 al 99999), con 120series cada uno. Un billete cuesta 2.5  € y los premios que se otorgan son:

6,000,000  €   5 cifras y serie35,000  €   5 cifras

600  €   4 últimas cifras60  €   3 últimas cifras

6  €   2 últimas cifras2,5  €   última cifra

a ) Si compramos un billete, ¿cuál es la ganancia o pérdida esperada?

b) Si pensamos en comprar dos billetes, ¿cómo podemos esperar tener una ganan-

cia mayor comprándolos del mismo número o de dos números que no tenganla última cifra en común?

14. Te proponen el siguiente juego: se lanzan dos dados, si la suma de los númerosobtenidos es 2, 3, 4, 9, 10, 11 o 12 ganas 20  €, pero si, por el contrario, la suma es5, 6, 7 u 8 perderás los 20  €. Observa que ganas con 7 números mientras pierdesúnicamente con 4.

a ) ¿Crees que el juego resulta ventajoso para ti?

b) ¿Aceptarías jugar?

c ) ¿Cuánto dinero esperarías ganar o perder en una jugada?

15. El número medio de partículas radioactivas que son registradas por minuto por uncontador es 5.

a ) Calcular la probabilidad de que en un minuto cualquiera queden registradas5 partículas.

b) Calcular la probabilidad de que llegue alguna.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 19/62

2.2. EJERCICIOS Y PROBLEMAS    19

16. Un fabricante sabe que, en promedio, el 20 % de los tostadores eléctricos que fab-rica requerirán reparaciones dentro de un año después de su venta. Cuando seseleccionan al azar 20 tostadores, encontrar los valores para  x  e  y  tales que:

a ) la probabilidad de que al menos x  de ellos requieran reparaciones sea menorque 0.5

b) la probabilidad de que al menos y de ellos no requieran reparaciones sea mayorque 0.8

17. La dureza Rockwell de un metal se determina al golpear con un punto aceradola superficie del metal y después medir la profundidad de penetración del punto.Supongamos que la dureza Rockwell de cierta aleación está normalmente distribui-da con µ = 70 y σ  = 3 (se mide en una escala continua). Un espécimen se consideraaceptable si están entre 67 y 76.

a ) ¿Cuál es la probabilidad de que un espécimen, seleccionado al azar, tenga unadureza aceptable?Si seleccionamos al azar una muestra de 10 espécimenes:

b) ¿Qué distribución sigue la variable X   : “número de especimenes aceptablesentre 10”?

c ) ¿Cuál es el número esperado de espécimenes aceptables?

d ) ¿Cuál es la probabilidad de que, a lo sumo, 8 de los 10 espécimenes de lamuestra tengan una dureza menor que 73.84?

18. Supongamos que el 25 % de los conductores españoles no tiene asegurado su ve-hículo. Si seleccionamos una muestra aleatoria de tamaño 50:

a ) ¿Cuál es la probabilidad de que todos los conductores de la muestra esténasegurados?

b) ¿Cuál es la probabilidad de que alguno de los 50 conductores no esté asegu-rado?

c ) ¿Cuál es la probabilidad de que al menos 40 conductores estén asegurados?

d ) ¿Cuál es la probabilidad de que, como mucho, haya 5 conductores sin seguro?

19. Cuando se prueban cierto tipo de tarjetas de un circuito, el porcentaje de tarjetasdefectuosas a largo plazo es del 50%. Supongamos que se recibe un lote de 250tarjetas y que la condición de cualquier tarjeta es independiente de las demás.

a ) ¿Cuál es, aproximadamente, la probabilidad de que al menos el 10 % de lastarjetas del lote estén defectuosas?

b) ¿Cuál es, aproximadamente, la probabilidad de que haya exactamente 10 tar- jetas defectuosas en el lote?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 20/62

20   CAPÍTULO 2. PROBABILIDAD

c ) ¿Cuál es el número más probable de tarjetas defectuosas en el lote?

20. La llegada de clientes a un laboratorio es un proceso de Poisson, a razón de 6 por

hora. Se pide:

a ) ¿Cuantos clientes llegarán, por término medio en los 10 primeros minutos detrabajo?

b) Si en laboratorio está abierto durante una hora y media, ¿cuántas sillas ha detener la sala de espera para que puedan sentarse todos los clientes, con unaprobabilidad de, al menos, 0.9?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 21/62

Capítulo 3

Introducción a la Inferencia

Estadística

3.1. Cuestiones teóricas

1. Distingue entre media aritmética y media poblacional. Explícalo lo mejor quepuedas.

2. Explicar la importancia de tomar muestras aleatorias para hacer inferencia estadís-tica.

3. Comenta la siguiente afirmación:  aunque una variable   X   no siga un modelo de distribución Normal, si se selecciona una muestra aleatoria de gran tamaño,   X 

será Normal .4. Si se lanza un dado no trucado al azar y se considera la variable X   : “puntuación

obtenida tras el lanzamiento”, calcula la media y desviación típica de dicha variablealeatoria.

5. Si se lanzan simultáneamente 100 dados y se considera la variable   X   : “mediaaritmética de los 100 resultados”

a ) Calcular su media y desviación típica.

b) Calcular, asímismo, la probabilidad de que la suma de las 100 puntuacionessea mayor que 400.

6. Si   S 21   y   S 22   representan las varianzas de muestras aleatorias independientes detamaños n1 = 8 y  n2 = 12, respectivamente, tomadas de poblaciones normales convarianzas iguales, encontrar  P 

¡S 21/S 22  < 4,89

¢.

7. Utilizar el teorema del límite central, para justificar la aproximación normal a ladistribución binomial. Recordar que una variable binomial X  ∼ B (n, p) representael número de éxitos en  n  ensayos independientes con  p  =  P  (éxito) para cualquierensayo particular.

21

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 22/62

22   CAPÍTULO 3. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

3.2. Ejercicios y Problemas

1. Sea   X 1, X 2,...,X 100   una muestra aleatoria simple de una distribución   N (3, 16),

calcular P ( X > 3,6).

2. Encontrar la probabilidad de que una muestra aleatoria de 25 observaciones, deuna población normal con varianza  σ2 = 6, tenga una varianza muestral:

a ) mayor que 9.1

b) entre 3.462 y 10.745.

3. Una empresa eléctrica fabrica focos que tienen una duración que se distribuyeaproximadamente en forma normal, con una media de 800 horas y una desviaciónestándar de 40 horas.

a ) Encontrar la probabilidad de que una bombilla, seleccionada al azar, tengauna vida de menos de 775 horas.

b) Encontrar la probabilidad de que una muestra aleatoria de 16 focos tenga unavida promedio de menos de 775 horas.

4. El diámetro interior de un anillo de pistón, seleccionado al azar, es una variablealeatoria (X ) con un valor medio de 12  cm  y una desviación estándar de 0.04  cm.

a ) Si  X  es el diámetro medio de una muestra aleatoria de tamaño  n = 16, ¿dóndeestá centrada la distribución muestral de  X,  y cuál es su desviación estándar?

b) Responder a las cuestiones del apartado anterior para un tamaño muestral den = 64 anillos.

c ) ¿Para cuál de las dos muestras aleatorias anteriores es más probable que  X esté dentro del intervalo  12 ± 0,01 cm? Explicar el razonamiento.

5. Supongamos una población cuya característica en estudio se encuentra normal-mente distribuida con media  µ  = 12 y varianza  σ2 = 16. Se pide:

a ) Calcular la probabilidad de que un elemento de la población, elegido al azar,tenga la característica superior a 14.

b) Se considera una muestra aleatoria de tamaño n = 9. ¿Cuál es la probabilidad

de que la media muestral tenga un valor superior a 14?c ) Para la misma muestra anterior, ¿cuál será la varianza de la media muestral?

d ) ¿Se puede concluir estadísticamente que los valores tomados por la mediamuestral se encuentran menos dispersos que los valores poblacionales?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 23/62

Capítulo 4

Estimación

4.1. Cuestiones teóricas

1. Razonar si son verdaderas o falsas cada una de las siguientes afirmaciones:

a ) Una estimación de tipo puntual es más recomendable que una por intervalosde confianza.

b) Un estimador es insesgado cuando su valor esperado coincide con el valorpoblacional.

c ) El intervalo de confianza para la varianza es simétrico.

d ) A mayor nivel de confianza, mayor anchura del intervalo.

e ) Dos muestras, de igual tamaño, extraídas de una misma población, propor-cionan idénticos intervalos de confianza (al 95 %).

2. Razonar qué efecto tiene cada uno de los siguientes conceptos sobre el ancho de unintervalo de confianza:

a ) Nivel de confianza

b) Tamaño muestral

c ) Variabilidad de las características que se miden

3. Consideremos una distribución poblacional normal, con el valor de   σ   conocido¿Cuál es el nivel de confianza para el intervalo  x ± 2,81σ/

√ n?

4. Se verifica que la esperanza de una distribución  χ2(m) es  m. Partiendo de dichaafirmación, demuestra que la esperanza de la variable  S 2n  (varianza muestral sobrelas muestras aleatorias de tamaño  n) es  σ2.

5. Un estimador se dice insesgado cuando su esperanza (media) es el parámetro que sepretende estimar. Demuestra entonces que X n y  S 2n son los estimadores insesgadosde  µ  y  σ2,  respectivamente.

23

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 24/62

24   CAPÍTULO 4. ESTIMACIÓN 

6. Cada uno de los siguientes intervalos:

(114,4, 115,6) (114,1, 115,9)

es un intervalo de confianza de  µ  (promedio real de la frecuencia de resonancia detodas las raquetas de tenis, de cierto tipo)

a ) ¿Cuál es el valor de la frecuencia de resonancia media muestral?

b) Si ambos intervalos fueron calculados sobre la misma muestra, pero con dis-tintos niveles de confianza, ¿cuál de ellos se corresponde a un nivel del 90 %y cuál a uno del 99 %? Razonar la respuesta.

c ) Siguiendo con los supuestos explicados hasta ahora, ¿podrían haber sido

(114,4, 115,6) (114,2, 115,9)

los intervalos obtenidos?

7. Se investiga el tiempo de reacción, tras un determinado estímulo, en un grupo de25 individuos, resultando una media muestral de 132 segundos y una desviacióntípica muestral de 40. Admitimos que la variable  X   : “numero de segundos hastaque se reacciona tras el estímulo” sigue un modelo de distribución Normal:

a ) Indicar una estimación puntual de la media µ de la variable. ¿Cuál es el errormáximo asociado a dicha estimación, con una confianza del 95 %? Construirel intervalo de confianza al 95%.

b) Si repetimos la experiencia con otra muestra de 25 individuos, ¿obtendremosel mismo intervalo de confianza al 95 %? ¿Será al menos su amplitud la misma?¿Cómo ha de interpretarse entonces un intervalo de confianza?

c ) Vamos a variar el planteamiento inicial, suponiendo que la desviación típicade la variable  X  es conocida, siendo su valor  σ  = 38. Calcular el intervalo deconfianza al 99 % para la media.

d ) Continuando con la situación del inciso anterior, si tomamos otra muestra de25 individuos, ¿aportará el mismo intervalo de confianza al 99%?, al menos¿será su amplitud la misma? ¿Qué tamaño de muestra es necesario para es-timar la media con un margen máximo de error de 5 segundos, al 95% de

confianza?

8. ¿Cuánto debe aumentar el tamaño muestral   n   si queremos que la longitud delintervalo de confianza para la media poblacional se reduzca a la mitad?

9. En una muestra aleatoria de 6 automóviles de una región, se obtuvo un promediode 23500  km/ano y una desviación típica de 5000  km/ano. ¿Qué podemos deciracerca de la media poblacional?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 25/62

4.2. EJERCICIOS Y PROBLEMAS    25

10. ¿Cuál es el valor de k  para un intervalo de tolerancia del 97 %, para el 98 % de lasmediciones de una población normal, con  n  = ∞? Razónalo lo mejor que puedas.

11. Aunque una variable no siga un modelo de distribución Normal, si el tamaño dela muestra aleatoria es mayor que 60, el intervalo de confianza para la media seconstruye a partir de un valor teórico  zα en  N (0, 1) ¿Por qué?

12. Construye razonadamente el intervalo de confianza para una proporción p, a partirde una muestra aleatoria de tamaño   n  con una proporción muestral

  ∧

 p, tal que

n∧

 p, n(1− ∧

 p) > 5,  ∧

 p, 1− ∧

 p > 0,05.

13. Se desea estimar la probabilidad p de obtener cara tras lanzar determinada moneda,posiblemente trucada. Para ello se lanza  n veces y se cuenta el número de carasobtenidas. De esta forma, una estimación puntual de  p  será la proporción de carastras los n  lanzamientos. ¿Cuántos lanzamientos debemos efectuar como mínimo si

pretendemos que, con una probabilidad del 95%, el error cometido en la estimaciónno exceda de 0.01?

Nota: En realidad esa cantidad no puede calcularse con exactitud, aunque sí sepuede obtener una solución aproximada (mayor), teniendo en cuenta que el poli-nomio y  =  x(1− x) alcanza el máximo en  x  =   1

2, con un valor de   1

4.

14. Sea   µ  el contenido promedio de alcohol en la población de todos los frascos de jarabe para la tos, de una marca particular. Supongamos que se selecciona unamuestra aleatoria de 50 botellas de dicho jarabe, se determina el contenido dealcohol de cada frasco, y se calcula un intervalo de confianza al 95 %, resultando(7,8, 9,4). Razonar las siguientes cuestiones:

a ) Un intervalo de confianza al 90 %, calculado para la misma muestra, ¿habríade ser más estrecho o más ancho que el anterior?

b) ¿Es correcto afirmar que hay un 95 % de probabilidades de que  µ esté entre7.8 y 9.4?

c ) ¿Podemos confiar mucho en que el 95 % de todos los frascos de esta marca de jarabe tengan un contenido de alcohol entre 7.8 y 9.4?

d ) Si repetimos el proceso de extraer una muestra aleatoria de tamaño 50 muchasveces, el 95% de los intervalos de confianza (calculados para dicho nivel)incluirán a  µ.

4.2. Ejercicios y Problemas

1. Los datos siguientes miden la resistencia a la flexión (en MP a) de vigas de hormigón:

5,9 7,2 7,3 6,3 8,1 6,8 7,0 7,6 6,86,5 7,0 6,3 7,9 9,0 8,2 8,7 7,8 9,77,4 7,7 9,7 7,8 7,7 11,6 11,3 11,8 10,7

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 26/62

26   CAPÍTULO 4. ESTIMACIÓN 

a ) Calcular un estimador puntual del valor medio de resistencia para la poblaciónconceptual de todas las vigas fabricadas de esta forma.

b) Calcular un estimador puntual del valor de resistencia que separa el 50 % másdébil de las vigas, del 50 % más fuerte.

c ) Calcular e interpretar un estimador puntual de la desviación estándar pobla-cional.

d ) Calcular un estimador puntual de la proporción de vigas cuya resistencia a laflexión es mayor que  10  MP a.

e ) Calcular un estimador puntual del coeficiente de variación poblacional.

2. Se sabe que la concentración de coloides en el agua de un río es de 5,4 por  ml.Para analizar el efecto de cierto reactivo, se tomaron muestras de agua de dichorío, a la que se le agregó el reactivo. Pasado un tiempo, se extrajeron pequeñas

cantidades para analizarlas de forma independiente en una cámara de recuento.Los resultados fueron los siguientes:

No de coloides: 2 3 4 5 6 7   (no/ml)Frecuencia: 10 20 170 100 90 10

a ) Calcular los intervalos de confianza al 95% y al 99%, para la concentracióndel agua tras agregar el reactivo.

b) ¿Ha aumentado o disminuido la concentración? Razonar la respuesta.

3. Una muestra aleatoria extraída de una población normal, de varianza igual a 100,

presenta una media muestral  ¯X  = 160. Se pide, con  n  = 144 :

a ) Calcular un intervalo de confianza del 95 % para la media poblacional.

b) Calcular un intervalo de confianza del 90 % para la media poblacional.

c ) Comparar ambos intervalos, desde el punto de vista de la información quegeneran.

d ) Si se quiere tener una confianza del 95 % de que su estimación se encuentrea menos de 1.2 de la verdadera media poblacional, ¿cuántas observacionesadicionales deben tomarse?

4. Se hicieron las siguientes observaciones de resistencia a la fractura de placas base

de 18 % de acero maragizado al níquel:

69,5 71,9 72,6 73,1 73,3 73,5 75,5 75,775,8 76,1 76,2 76,2 77,0 77,9 78,1 79,679,7 79,9 80,1 82,2 83,7 93,7 94,0 94,5

a ) Calcular un intervalo de confianza al 99 % para la desviación estándar de ladistribución de la resistencia a la fractura.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 27/62

4.2. EJERCICIOS Y PROBLEMAS    27

b) ¿Es válido este intervalo cualquiera que sea la naturaleza de la distribución?

5. Es importante que las mascarillas utilizadas por los bomberos resistan temperat-

uras muy altas, debido a que trabajan en temperaturas de 200 a 500  o

F. En unaprueba para un tipo de mascarillas determinado, a 11 de 35 se les desprendieronlos lentes a 250   oF. Construir un intervalo de confianza al 90 % para la verdaderaproporción de mascarillas de este tipo cuyos lentes se desprendan a 250oF.

6. Una empresa que fabrica CDs ha tomado una muestra aleatoria de 85 discos, delos cuales 10 han resultado ser defectuosos.

a ) Calcular un intervalo de confianza del que podamos asegurar que existe unaprobabilidad del 95 % de que contenga a la proporción poblacional de CDsdefectuosos.

b) ¿Qué tamaño ha de tener la muestra para garantizar, con una probabilidaddel 95 %, que puede utilizarse la estimación puntual de la proporción comoaproximación del porcentaje real, sin cometer un error superior al 2 %?

c ) ¿Podrías responder al apartado anterior sin conocer cualquier dato de lapoblación?

7. Disponemos de la siguiente información resumida, relativa a la resistencia a lafractura (en  MP a) de  n = 169  barras de cerámica, quemadas en un determinadohorno:  x = 89,10 y  s  = 3,73.

a ) Calcular un intervalo de confianza de la resistencia real promedio a la fractura,con un nivel de confianza del 95 % ¿Parece precisa la estimación?

b) Supongamos que los investigadores creían, a priori , que la desviación estándarde la población era de 4  M P a. Comprobar si la muestra apoya esta hipótesis.

c ) Bajo la hipótesis de los investigadores, es decir  σ   = 4,  ¿de qué tamaño sehubiera requerido una muestra para estimar  µ  con  0,5  MP a  de precisión y95% de confianza?

8. Supongamos que un centro de cálculo desea evaluar la eficiencia de su sistema dememoria en disco. Una medida de eficiencia es el tiempo medio entre fallos consec-utivos de la unidad de disco. A  fin de estimar este valor, el centro registró el tiempoentre fallos para una muestra aleatoria de 45 fallos de la unidad, obteniéndose lossiguientes estadísticos:

x = 1, 762 horas y  s  = 215 horas

a ) Estimar el tiempo medio entre fallos verdadero, con una confianza del 90 %

b) Si el sistema de memoria en disco está funcionando correctamente, el tiempomedio entre fallos ha de ser mayor que 1,7. Con base en el intervalo de con-fianza obtenido en el apartado anterior, ¿qué podríamos inferir acerca de laeficiencia del sistema de memoria en disco?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 28/62

28   CAPÍTULO 4. ESTIMACIÓN 

c ) ¿Podríamos dar la misma respuesta que en (b) para un nivel de confianzamayor?, ¿y para uno menor?

9. Una máquina produce piezas de metal de forma cilíndrica. Se toma una muestrade estas piezas y se encuentra que los diámetros son 1.01, 0.97, 1.03, 1.04, 0.99,0.98, 0.99, 1.01 y 1.03 centímetros. Encontrar los límites de tolerancia de 99 % quecontendrán el 95 % de las piezas de metal que produce esta máquina, suponiendouna distribución aproximadamente normal.

10. Con objeto de estudiar la factibilidad de generar electricidad a partir de aguascalientes, y de elevada salinidad, las experiencias operativas han demostrado queestas salmueras dejan depósitos de incrustaciones silíceas en las tuberías metálicasde las plantas, causando paros excesivos de las operaciones, que pueden reducirse,en cierto grado, agregando soluciones químicas a la salmuera. Se hizo una determi-nación de sílice en cinco muestras tomadas al azar a las que se había incorporadocierto agente antiincrustación, después de un tiempo de retención de 24 horas, conlos siguientes resultados:

229   255 280 203 229

a ) Estimar la cantidad media de dióxido de silicio presente en las soluciones conagentes antiincrustaciones, con una confianza del 99 %.

b) ¿Es necesario hacer algún supuesto adicional para que el intervalo produzcainferencias válidas?

11. En una determinada ciudad, se están planeando construir una central hidroeléc-

trica. Un periódico local encuentra que el 53% de los votantes está a favor dela construcción de la planta. Si asumimos que esta proporción es cierta para elconjunto de todos los votantes de la ciudad,

a ) ¿cuál es la probabilidad de que más del 50 % entre 200 votantes seleccionadosal azar estén a favor de la construcción de la planta?

b) un político quiere seleccionar una muestra de forma que más del 50 % de laspersonas seleccionadas estén a favor de la central, con una confianza del 95%,¿cuál debe ser el tamaño de la muestra?

12. Es común utilizar aceros inoxidables en las plantas químicas para manejar  fluidos

corrosivos. Sin embargo, estos aceros tienen especial susceptibilidad al agrietamien-to por corrosión causada por esfuerzos en ciertos entornos. En una muestra de 295fallos, de aleaciones de acero que ocurrieron en refinerías de petróleo y plantaspetroquímicas en Japón durante los últimos 10 años, 118 se debieron a agrietamien-to por corrosión causada por esfuerzos.

a ) Determinar una estimación puntual para la verdadera proporción de fallos dealeaciones causados por agrietamiento.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 29/62

4.2. EJERCICIOS Y PROBLEMAS    29

b) Establecer un intervalo de confianza al  95 % para la verdadera proporción defallos de aleaciones causados por agrietamiento.

c ) ¿Qué tamaño muestral necesitamos para que el error cometido con la esti-

mación puntual no sea mayor de 0.05, con una confianza del 95%?

13. Sea  µ  el número medio de horas que trabaja un ingeniero químico a diario. Ex-traemos una muestra aleatoria de tamaño   n >   60  y calculamos un intervalo deconfianza al 95% para  µ  resultando  (5,75, 9,35) .

a ) Calcular el valor de  X  para dicha muestra.

b) Calcular un intervalo de confianza al 99% para   µ   basándose en la mismamuestra.

c ) Suponiendo que  n  = 100, calcular el valor de  s.

d ) Si te ofrecen un trabajo en el que vas a trabajar una media de 8 horas diarias,con un sueldo medio, ¿decidirías aceptarlo?

14. La duración de las bombillas fabricadas por una empresa sigue un modelo de dis-tribución normal con media desconocida y desviación típica 50 horas. Para estimarla duración se experimenta con una muestra de tamaño  n. Calcular el valor de  npara que, con un nivel de confianza del 95 %, se consiga un error en la estimacióninferior a las 5 horas.

15. Imagina que queremos estimar, con un error máximo del 3 %, la cuota de pantallade un programa de TV, y queremos un  95 %  de confianza para nuestros resulta-dos. Si no disponemos de información previa sobre el posible valor de  p, ¿cuántos

telespectadoeres deberán ser encuestados?

16. El ingeniero de control de calidad de una compañía, que fabrica botellas, seleccionadiariamente una botella terminada del proceso de producción al azar y registra supeso. La tabla siguiente muestra los datos para la inspección del último mes:

5.6 5.7 6.1 6.3 5.2 6.0 5.8 5.8 6.4 6.06.2 5.9 5.2 6.0 6.3 5.8 6.1 5.8 6.4 6.05.3 6.2 5.8 6.3 5.5 6.1 5.8 6.1 6.1 5.7

Una gráfica de control para una variable de calidad se obtiene representando per-iódicamente las mediciones de la variable sobre el tiempo, junto con tres líneas de

referencia. La línea central es la media muestral de las observaciones,  x,  la líneasuperior representa el valor   x + 3s  y la inferior   x − 3s.  Se espera que tdas lasmediciones caigan entre las líneas superior e inferior si el proceso está en control.

a ) Trazar una gráfica de control para los pesos de las botellas terminadas. ¿Pien-sas que el proceso estaba bajo control durante el mes en estudio?

b) Establecer un intervalo de tolerancia al 95 % para el 99 % de las botellas.Suponer para ello que la variable peso es aproximadamente normal.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 30/62

30   CAPÍTULO 4. ESTIMACIÓN 

c ) Las especificaciones requieren que el peso sea de   5,8 ± 0,4, ¿piensas que seestán cumpliendo las especificaciones?

17. Se realizaron pruebas conjuntas de armaduras de madera, pegadas con resina epóx-ica, para determinar las tolerancias a esfuerzos de corte sobre la línea de adhesión.Para una muestra aleatoria de 100 juntas de armadura se obtuvo que:  x = 1,312y   s   = 0,422.  Suponiendo que la distribución de las mediciones de resistencia esaproximadamente normal, establecer un intervalo de tolerancia al 95 % para el99 % de las resistencias al corte.

18. El presidente de una compañía mandó una carta a una empresa de investigaciónestadística, en la que argumentaba:

¡Cuando ustedes o cualquier otro intentan decirme que 1223 personas, sirven para conocer las opiniones y gustos en España, me vuelvo loco!. ¡Cómo se atreven!.

Deberían ustedes ser detenidos y encarcelados.Más adelante, afirmaba:

Dado que 1223 personas representan a 40 millones, mi carta representa la opinión de 32706 personas (división de 40 millones entre 1223) que comparten mi puntode vista 

a ) Encontrar el margen de error que se comete al estimar una proporción a unnivel de confianza del 95 %, para  n = 1223.

b) Este señor piensa que 1223 personas es una muestra demasiado pequeña paraser significativa, ¿estás de acuerdo?

c ) También argumenta que él representa a 32706 personas. ¿Es correcto esteargumento?. Razona la respuesta.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 31/62

Capítulo 5

Test de Hipótesis

5.1. Cuestiones teóricas1. ¿Qué entiendes por nivel de significación y potencia de un test?

2. ¿Qué entiendes por P  − valor. Explícalo lo mejor posible.

3. Explicar la diferencia entre muestras aleatorias independientes y apareadas.

4. Se pretende contrastar si una moneda está o no trucada, a partir de 5 lanzamientosde la misma. Se propone el siguiente test: si obtenemos 5 caras o 5 cruces, rechaz-amos la hipótesis inicial (no trucada). En el caso contrario, la aceptamos. Se trata,en verdad, de un test razonable.

a ) Expresa las hipótesis   H 0   y   H 1   a partir del parámetro   p   =probabilidad deobtener cara (que, en el caso de que la moneda sea simétrica, coincide con laproporción de casos favorables, es decir,   1

2).

b) Calcular la probabilidad de error de tipo I asociada a este test.

5. Se sabe que el tiempo de secado de cierto tipo de pintura, bajo condiciones especí-ficas de prueba, está normalmente distribuido, con un valor medio de 75 minutosy una desviación estándar de 9 minutos. Unos químicos han propuesto que se dis-eñe un nuevo aditivo para reducir el tiempo promedio de secado. Se cree que lostiempos de secado seguirán normalmente distribuidos con  σ  = 9. Debido al gastoasociado con el aditivo, la evidencia debe sugerir de forma contundente una mejoríaen el tiempo promedio de secado, antes de que se adopte tal conclusión.

a ) Plantear las hipótesis estadísticas que permitan tomar una decisión respectoal problema.

b) Se obtiene información experimental de tiempos de secado a partir de 25pruebas. Plantear una región de rechazo que parezca razonable.

31

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 32/62

32   CAPÍTULO 5. TEST DE HIPÓTESIS 

c ) Calcular, si es posible, las probabilidades de cometer un error de tipo I y detipo II, asociadas con el test planteado.

d ) Ilustrar gráficamente el apartado c.

6. Mediante 20 lanzamientos independientes de una moneda, se desea saber si estáo no trucada. Plantea el contraste de hipótesis adecuado y construye, a partir dela tabla Binomial, un test con un nivel de significación  α ≤  0,05, lo más potenteposible. Si la probabilidad de obtener cara fuese del  60 %, ¿cuál sería la probabilidadde tomar una decisión errónea?

¿Cuál sería la decisión si el número de caras obtenido fuese 16. ¿Significaría esoque tendríamos la certeza de que la moneda está trucada? ¿Tendríamos certeza delo contrario?

Supongamos que la moneda se lanza un total de 100. Plantea igualmente el test anivel α  lo más potente posible y relaciónalo con el presentado en el cuadernillo delas tablas.

7. Iberia asegura que sólamente el 15 % de sus vuelos se retrasan más de 10 minutos.Consideremos el test de hipótesis:

½  H 0  :  p ≤ 0,15H 1  :  p > 0,15

Supongamos que tomamos una muestra aleatoria de tamaño  n  = 50 y rechazamosH 0  si 9 o más de los vuelos de la muestra se retrasan.

a ) ¿Es un test razonable?

b) Calcular el nivel de significación del test

c ) ¿Cómo disminuirías el nivel de significación? ¿Qué ocurriría con la potenciadel test?

8. Se lanza una moneda un total de 100 veces, resultando 58 caras por 42 cruces.

a ) ¿Crees que está trucada? Responder utilizando el test correspondiente, paradistintos niveles de significación.

b) Calcular el P -valor.

c ) Responder también a través del intervalo de confianza, para los mismos nivelesde confianza.

9. Se desea comprobar si una moneda está trucada o no. Para ello, se lanza  n veces,obteniéndose cara en el 51 % de los lanzamientos. Tras aplicar el test adecuado, seobtuvo un P  − valor = 0,01. ¿Qué podemos decir del tamaño de la muestra?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 33/62

5.1. CUESTIONES TEÓRICAS    33

10. Indicar cuál de los siguientes planteamientos no cumple las reglas de Neyman-Pearson. Para los que sí las cumplen, determinar de qué tipo de contraste se trata.

a:½

  H 0  :   µ ≤ 100H 1  :   µ >  100   b:½

  H 0 :   σ = 20H 1 :   σ ≤ 20   c:½

  H 0 :   p 6= 0,25H 1 :   p = 0,25

d:½

  H 0 :   µ1 − µ2  = 25H 1 :   µ1 − µ2 >  100

  e:½

  H 0  :   s21 =  s22H 1  :   s21 6= s22

f:½

  H 0 :   µ = 120H 1 :   µ = 150

g:½

  H 0  :   σ1/σ2  = 1H 1  :   σ1/σ2  6= 1

  h:½

  H 0 :   p1 − p2  = −1H 1 :   p1 − p2  <  0,1

  i:½

  H 0 : x = yH 1 : x 6= y

11. Para determinar si las soldaduras efectuadas en tubos de una planta de energíanuclear cumplen con las especificaciones legales, se selecciona una muestra de sol-

daduras al azar y se realizan las pruebas oportunas para determinar su resistencia,como la fuerza requerida para romperla. Supongamos que dichas especificacionesestablecen que la resistencia media ha de rebasar los 100  kg/cm2.  El equipo deinspección determina probar  H 0 :  µ ≤ 100 frente a  H 1  :  µ > 100. Explicar por quésería preferible utilizar esa hipótesis alternativa en vez de  H 1 :  µ < 100.

12. Consideremos dos variables  X 1 ∼  N (µ1, σ) y  X 2 ∼  N (µ2, σ). Se desea contrastarlas hipótesis ½

  H 0 :   µ1 =  µ2

H 0 :   µ1 6= µ2

a partir de sendas muestras aleatorias independientes de tamaños  n1 = 10 y  n2 =

22, respectivamente. Para realizar dicha toma de decisión, se utiliza el test deStudent.

Supongamos que la información que aportan las dos muestras queda resumidaen   texp   = 3,00. ¿Qué decisión hemos de tomar pues, según el test, para losniveles de significación α  = 0,05,   0,01,   0,001? Calcular el  P  − valor.

Supongamos que  texp = 0,46. Calcular  P 

Supongamos que  texp = 5,67. Calcular  P 

Supongamos que para un nivel de significación α = 0,01 la decisión es rechazarH 0. ¿Cuál será entonces la decisión para  α = 0,05?

Supongamos que para un nivel de significación α  = 0,05 la decisión es aceptarH 0. ¿Cuál será entonces la decisión para  α = 0,01?

Supongamos que para un nivel de significación α = 0,05 la decisión es rechazarH 0. ¿Cuál será entonces la decisión para  α = 0,01?

Supongamos que para un nivel de significación α  = 0,01 la decisión es aceptarH 0. ¿Cuál será entonces la decisión para  α = 0,05?

13. Considera los dos estudios siguientes:

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 34/62

34   CAPÍTULO 5. TEST DE HIPÓTESIS 

a) Comparando los niveles medios de pepsina en jugo gástrico de dos formasdiferenciadas de una enfermedad, se obtuvo una diferencia altamente signi-ficativa (P   = 0,00001) partiendo de muestras aleatorias independientes de

tamaños 120 y 110.b) Comparando los niveles medios de  O3  en dos regiones del planeta, se obtuvo

una diferencia altamente significativa (P   = 0,00001) partiendo de muestrasde tamaño 20 y 25.

Se aplicó el test de Student. Responde a las siguientes preguntas:

¿En cuál de los dos estudios se está más seguro de que existen diferenciasentre los niveles medios?

Si suponemos que las dispersiones (varianzas) de todas las variables en juego

son similares, ¿en cuál de los dos estudios la diferencia estimada de los valoresmedios será mayor?

Se desea contrastar la hipótesis de que determinado suceso se verifica conuna probabilidad del 50 %. Para ello se toma una muestra de  n repeticionesindependientes del fenómeno y se cuenta la proporción resultados favorablesal mismo, obteniéndose un 51 %. Tras aplicar el test adecuado (cf. Tablas), seobtuvo  P  = 0,0032. ¿Qué decisiones corresponderán a unos niveles de signifi-cación del 5 %, 50 % y 0.0001 %? En términos muy prácticos, ¿qué conclusiónse extrae de este resultado? ¿Qué podemos decir del tamaño de la muestra?Contesta con la mayor concreción posible.

Se pretende comparar las proporciones de alérgicos de dos poblaciones  A  yB. Para ello se toma una muestra de cierto tamaño   n   en la población   A,resultando ser alérgicos el 12 % de éstos. Se toma, de manera independiente,otra muestra del mismo tamaño en la población   B, resultando alérgicos el22 %. Tras aplicar el test de Student se obtuvo P > 0,05. Comenta brevementela implicación práctica del resultado

Volvemos a repetir el experimento tomando sendas muestras de un mismotamaño m (en principio distinto de  n). Se obtiene entonces unas proporcionesde alérgicos del 12 % y 16 % respectivamente. Tras aplicar el mismo test seobtiene P < 0,01. Comenta brevemente la implicación práctica del resultado.

Existe una aparente contradicción entre ambos resultados. ¿Cuál es? ¿Puede jus-tificarse este hecho de alguna forma? ¿Qué podemos decir concretamente de  n ym?

14. En un problema de contraste de hipótesis se obtiene como resultado   final   P >0,05. ¿Significa eso que se ha demostrado la autenticidad de   H 0? ¿Cómo debeinterpretarse un valor  P < 0,05? ¿Cuál ha de ser el valor de  P  para tener certezaabsoluta de la falsedad de  H 0?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 35/62

5.2. EJERCICIOS Y PROBLEMAS    35

15. Partiendo de una muestra aleatoria de tamaño n  = 250 de una variable normal, seobtuvo como resultado  x  = 13,1 y  s  = 2,2.

a ) Decidir, sin calcular el intervalo a partir de los datos anteriores, cual de lossiguientes es el correcto (para una confianza del 95%)

(11,73 ,   14,44)

(12,09 ,   14,10)

(12,83 ,   13,37)

(2,74 ,   3,75)

(2,72 ,   3,77)

b) Si se plantea el problema de decidir si la media de la variable estudiada esigual a 13.3, cuál de las siguientes afirmaciones es cierta:

Con un nivel de significación del 5 % no podemos decir que no.Tenemos una confianza del 95 % de que es seguro.

Con un nivel de significación de 5 % no podemos decir que no.

Con un nivel de significación del 5 % no podemos decir que sí.

Ninguna de las anteriores afirmaciones es correcta.

16. Un investigador desea probar que el valor medio de una determinada variablebioquímica en una región A es mayor que en una región B. ¿Con cuál de lossiguientes resultados se sentiría más satisfecho?

a )   P > 0,05 con muestras pequeñas.

b)   (0,03 ,   0,91), intervalo al 95 % para la diferencia de medias  µA − µB.

c )   (1,83 ,   1,91) intervalo al 99 % para la diferencia de medias µA − µB.

d )   P < 0,01 para el test bilateral de comparación de medias.

17. Se pretende contrastar si las medias de dos variables normales con varianza comúnson iguales o no. Tras seleccionar sendas muestras independientes, de tamañosn1  = 20 y  n2  = 27, y aplicar el test de Student, se obtuvo  texp  = 2,001. Acotar elP  − valor lo mejor posible.

5.2. Ejercicios y problemas

1. Un ingeniero químico afirma que el rendimiento medio de la población de ciertoproceso en lotes es 500 gramos por milímetro de materia prima. Para verificaresta afirmación muestrea 25 lotes cada mes. Suponiendo que la distribución derendimientos es aproximadamente normal, ¿qué conclusión extraería de una mues-tra que tiene una media  x = 518 gramos por milímetro y una desviación estándars = 40?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 36/62

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 37/62

5.2. EJERCICIOS Y PROBLEMAS    37

Un grupo de consumidores duda de dicha afirmación del fabricante y selecciona 30automóviles al azar para probarlos. El grupo obtiene los siguientes datos:

25,3 25,1 29,6 24,6 26,0 26,3 23,6 26,0 25,4 26,125,1 24,1 25,8 26,4 23,4 24,8 22,6 26,6 25,1 26,623,8 25,4 26,2 25,1 25,3 21,5 26,0 23,3 23,8 28,0

a ) Establece las hipótesis nula y alternativa para esta situación desde el puntode vista del grupo de consumidores.

b) Indica las suposiciones que debe hacer el grupo de consumidores para llevara cabo esta prueba de hipótesis.

c ) Al nivel de significación α  = ,05, encontrar la región de rechazo.

d ) Calcular el P 

 −valor

e ) Escribe tu conclusión.

7. Un fabricante afirma que su quitamanchas elimina, al menos, el 90 % de todas lasmanchas. Si en una muestra aleatroia sólo se consiguen quitar 174 de 200 manchas,demostrar si la afirmación del fabricante es correcta.

8. Los pinos de cierta variedad tienen una media de crecimiento de 10.1 pulgadas en3 años. Un biólogo reclama que una nueva variedad de pino tendrá un crecimientopromedio mayor en tres años. Una muestra de 15 árboles de la nueva variedadtiene una media de crecimiento de 10.8 pulgadas con una desviación estándar de

2.1 pulgadas. ¿Está en lo correcto el biólogo?

9. El empleo de acero intemperizado en la construcción de puentes para autopistas hasido tema de considerable controversia. Los críticos han citado recientemente prob-lemas de corrosión graves del acero intemperizado y están tratando de convencera los estados de que prohiban su uso en la construcción de puentes. Por otro lado,las corporaciones acereras aseguran que estas acusaciones son exageradas y dicenque el 95 % de los puentes contruidos usando acero intemperizado se encuentranen buen estado, sin daños graves por corrosión. A  fin de probar esta aseveración,un equipo de ingenieros y expertos de la industria del acero evaluaron 60 puentesde acero intemperizado seleccionados al azar y encontraron que 54 de ellos esta-

ban en buen estado. ¿Hay pruebas para demostrar que la proporción de puentesconstruidos con acero intemperizado en buen estado es menor que la proporcióncitada por las corporaciones acereras?

10. Una cortadora de papel corta pliegos de 10,5cm con una desviación típica de 0,1cm.Diez muestras de papel fueron seleccionadas aleatoriamente de un lote de produc-ción con las siguientes medidas:  10,5,   10,2,   10,7,  11,   10,4,   10,6,   10,3,  10,8,   10,6,10,5. Contrastar si la máquina funciona correctamente.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 38/62

38   CAPÍTULO 5. TEST DE HIPÓTESIS 

11. Una central de transformación de productos lácteos recibe diariamente la leche delos granjas  A  y  B. Deseando estudiar la calidad de los productos recibidos, se ex-traen dos muestras al azar y se analiza el contenido en materia grasa, obteniéndose

los siguientes resultados, expresados en tantos por ciento:

Granja A   xA = 8,7   s2A  = 1,02   nA  = 31Granja B   xB  = 10,9   s2B  = 1,73   nB  = 25

a ) Construir un intervalo de confianza al 95 % para la diferencia del contenidomedio en grasa de la leche de ambas granjas. ¿Es necesario suponer la nor-malidad de las variables?

b) ¿Existe diferencia significativa entre el contenido en grasa de la leche de lasdos granjas?

c ) ¿Tomarías la misma decisión para cualquier nivel de confianza?

d ) Plantear el test de hipótesis adecuado para responder al apartado (b), y ra-zonar si tomarías la misma decisión.

e ) Calcular el P −valor y explicar qué significa.

12. Se lleva a cabo un experimento para comparar el desgaste por abrasión de dosmateriales laminados diferentes. Se prueban 12 piezas del material 1, mediante laexposición de cada pieza a una máquina para medir la profundidad del desgaste, y10 piezas del material 2. Las muestras del material 1 dan un desgaste promedio de85 unidades, con una desviación estándar muestral de 4, mientras que las muestrasdel material 2 dan un promedio de 81 y una desviación estándar muestral de 5. Se

sabe que las poblaciones son aproximadamente normales. ¿Se puede concluir conun nivel de significación del 0.05 que el desgaste abrasivo del material 1 excede eldel material 2 en más de dos unidades?

13. En un estudio realizado por Aqualia se comparan dos plantas de tratamiento deaguas residuales. La planta  A se sitúa donde el ingreso medio de los hogares estápor debajo de 22.000  € al año, y la planta  B  se ubica donde el ingreso medio delos hogares está por encima de 60.000 € anuales. La cantidad de agua residual quetrata cada planta (miles de litros/día) se muestrea de forma aleatoria durante 10días:

Planta  A   21 19 20 23 22 28 32 19 13 18Planta  B   20 39 24 33 30 28 30 22 33 24

Suponiendo que las distribuciones son normales:

a ) ¿Cuál de las dos plantas trata cantidades de agua más homogéneas?

b) ¿Podemos concluir que la cantidad promedio de agua residual tratada en lavecindad de ingresos altos es mayor que la del área de bajos ingresos?

c ) Aproximar el   P  − valor en cada una de las pruebas anteriores.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 39/62

5.2. EJERCICIOS Y PROBLEMAS    39

14. En un estudio sobre la eficacia de ciertos ejercicios físicos para reducir peso, ungrupo de 16 personas hicieron estos ejercicios durante un mes y mostraron lossiguientes resultados:

Peso antes Peso después 211 198180 173171 172214 209182 179194 192160 161182 182172 166155 154

185 181167 164203 201181 175245 233146 142

Juzgar si los ejercicios son eficaces en la reducción de peso.

15. Un instituto de alimentación animal quiere comparar estadísticamente dos tiposde dietas. Seleccionan al azar una muestra de veinte animales, suministrando a 12

de ellos la primera dieta y a los 8 restantes la segunda. Los resultados del aumentode peso en una semana son los siguientes:

Primera dieta   x1  = 4,3 kg   s1 = 0,9 kg   n1  = 12Segunda dieta   x2  = 3,6 kg   s2 = 1,9 kg   n2  = 8

¿Puede afirmarse que la primera dieta es significativamente mejor que la sergunda?

16. Un experimento acerca de la resistencia a la tracción de dos clases de acero estruc-tural, dio los siguientes resultados:

n   X s2

Acero tipo I 13 23.3 19.2Acero tipo II 16 20.5 3.5

Suponiento que las mediciones constituyen variables aleatorias independientes dedos poblaciones normales, comparar ambos tipos de acero y decidir cuál sería másrecomendable utilizar.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 40/62

40   CAPÍTULO 5. TEST DE HIPÓTESIS 

17. Un almacén de productos químicos sabe que tiene satisfechos a sus clientes si,al menos el 90%, de los pedidos son recibidos a tiempo. Para comprobar cómoestá funcionando la distribución, el encargado toema una muestra aleatoria de 90

pedidos y comprueba que 75 de ellos llegaron a tiempo a su destino.

a ) Formular el test de hipótesis adecuado y calcular el P  − valor.

b) Para un nivel de significación del 2 %, ¿podríamos concluir que los clientes seencuentran satisfechos?

c ) ¿Rechazarías la hipótesis nula para α = 0,05? ¿y para  α  = 0,01?

18. De dos variables   X 1   y   X 2   (distribuidas normalmente, con varianza común   σ2),se seleccionan sendas muestras independientes de tamaños   n1   = 12  y   n2   = 14,respectivamente, a partir de las cuales se obtuvo el siguiente intervalo de confianzapara las medias al  95 %:

µ1 − µ2 ∈ (0,4, 7,6)

a ) Decidir, razonadamente, si las medias son iguales o no para los niveles designificación α  = 0,1, α = 0,05 y  α = 0,01.

b) Hacer una estimación puntual de σ2.

19. Un laboratorio químico ha realizado en un mismo orden el análisis de 8 pruebaspor dos métodos, que han dado los siguientes resultados:

xi   15 20 16 22 24 14 18 20yi   15 22 14 25 29 16 20 24

a ) Establecer si los resultados medios de los análisis se diferencian de manerasignificativa, suponiendo que las variables se distribuyen normalmente

b) ¿Podrías recomendar alguno de los dos métodos?

a ) Si conocemos que la máquina 1 es la más cara, ¿cuál recomendaría compraren el futuro?

20. En un estudio, diseñado para comparar las presiones críticas de dos tipos de vidrio,se seleccionan dos grupos independientes de recipientes, dando los siguientes val-ores:

Grupo 1 (tipo 1)   95 97 91 101 105 105 115 107 107 85Grupo 2 (tipo 2)   104 88 100 98 102 92 96 100 96 96

Suponiendo que las dos poblaciones son normales,

a ) C ontrastar si ambos tipos de vidrio presentan igual presión crítica media.Tomar la decisión en función del  P −valor.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 41/62

5.2. EJERCICIOS Y PROBLEMAS    41

b) Decidir acerca de la cuestión planteada en el apartado anterior utilizandointervalos de confianza.

c ) ¿Cuál de los dos tipos de vidrio aporta resultados más homogéneos para la

presión crítica?

21. Un fabricante de equipos deportivos desarrolla un nuevo sedal sintético que afir-ma tiene una resistencia media a la tensión de 8 kilogramos, con una desviaciónestándar de 0.5 kilogramos.

a ) Contrastar si es cierta la información aportada por el fabricante si disponemosde una muestra aleatoria de 100 sedales y se encuentra que tienen una resisten-cia media a la tensión de 7.5 kilogramos, utilizando un nivel de significaciónde 0.05.

b) Responder a la misma cuestión utilizando intervalos de confianza

c ) Calcular el P  − valord ) ¿Qué decisión tomaríamos para un nivel de significación α  = 0,01?

e ) Contrastar, utilizando la misma muestra si, en realidad, lo que ocurre es quela resistencia media a la tensión de los sedales es menor que 8.

22. Un supervisor de control de calidad en una enlatadora sabe que la cantidad exactacontenida en cada lata varía, debido a ciertos factores imposibles de controlar. Elllenado medio por lata es iportante, pero igualmente importante lo es la variaciónde la cantidad de llenado. Si  σ2 es grande, unas latas contendrán mucho y otrasmuy poco. A  fin de estimar la variación de llenado de la enlatadora, el supervisorescoge al azar 10 latas y pesa el contenido de cada una de ellas, obteníendose:

7,96 7,90 7,98 8,01 7,977,96 8,03 8,02 8,04 8,02

a ) Establecer un intervalo de confianza al  90 % para la verdadera variación delllenado de latas

b) Supongamos que las agencias reguladoras especifican que la desviación están-dar de la cantidad de llenado debe ser menor que 0.1. Calcular el  P  − valorpara contrastar si la información de la muestra anterior proporciona pruebassuficientes para decidir que la desviación de llenado es menor que 0.1.

23. Una empresa ha estado experimentando con dos disposiciones físicas distintas desu línea de ensamble. Se ha determinado que ambas disposiciones producen aprox-imadamente el mismo número de unidades terminadas al día. A  fin de obtener unadisposición que permita un mayor control del proceso, se han tomado dos muestrasaleatorias independientes obteniéndose los siguientes resultados:

Línea de ensamble 1 Línea de ensamble 2

n1 = 21 días   n2  = 25 díass21 = 1, 432   s22 = 3, 761

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 42/62

42   CAPÍTULO 5. TEST DE HIPÓTESIS 

¿Cuál de las dos líneas recomendarías?

24. Expertos israelíes en agricultura han desarrollado un nuevo método de irrigación,

llamado   fertigacion, en el que se agrega fertilizante al agua y la mezcla se dejagotear periódicamente sobre las raíces de las plantas. Se desperdicia muy pocaagua y los nutrientes llegan directamente al lugar en el que se necesitan. A  fin deprobar este nuevo proceso, se seleccionaron 100 ha de tierra al azar y ser registró surendimiento histórico. Luego, se aplicó el proceso de fertigación a la nueva cosechay se registraron los nuevos rendimientos. Los resultados se resumen en la siguientetabla:

Antes de fertigar Después de fertigarTamaño de la muestra 100 100Rendimiento medio 40 % 75 %Desviación estándar 8 % 6 %

a ) Estimar la diferencia entre los verdaderos rendimientos medios antes y despuésde la fertigación  (α = 0,05).

b) Interpretar el intervalo del apartado (a).

25. Se comprobó un micrómetro con una serie de piezas patrón.

Patrón   0,0003 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0Lectura   0,0002 0,1 0,1997 0,2998 0,4003 0,4999 0,6 0,6998 0,7999 0,8998 1,0004

a ) ¿Tiene error el instrumento?

b) Caso de ser afirmativa la respuesta, ¿podrías hacer una estimación de dichoerror?

26. Se cuenta con dos procedimientos, uno antiguo y otro nuevo, para medir la concen-tración de determinado componente químico. Se intenta probar estadísticamenteque el método nuevo es preferible al anterior. Para ello, se efectuaron, de man-era independiente, 121 mediciones de una misma sustantcia con cada uno de losmétodos, obteniéndose, en resumen, el siguiente resultado:

Antiguo

½  x1 = 32,38

s1  = 1,42  Nuevo

½  x2 = 35,30

s2 = 1,16

a ) ¿Qué hipótesis estadísticas debemos contrastar para solucionar este proble-ma?

b) ¿Es estrictamente necesaria la hipótesis de normalidad de ambas variablespara resolver el contraste según los métodos con los que contamos?

c ) Suponer la hipótesis de normalidad, aplicar el test adecuado y decidir, paraun nivel de significación α  = 0,05.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 43/62

5.2. EJERCICIOS Y PROBLEMAS    43

d ) Calcular (o acotar lo mejor que se pueda) el valor de  P.

e ) Interpretar el resultado

27. Un fabricante de cierto tipo de máquinas desea comprar remaches siendo muyimportante que su resistencia de ruptura supere los 10.000 psi. Dos fabricantes,  A yB, le ofrecen este tipo de remaches, cuyas resistencias de ruptura están distribuidasde forma normal, con parámetros:

µA = 14,000   µB  = 13,000σA = 2,000   σB  = 1,000

a ) ¿Qué fabricante producirá, en promedio, el menor número de remaches defec-tuosos?

b) Si la decisión fuera tuya, ¿a qué empresa encargarías los remaches?. ¿Necesi-

tarías haber hecho los cálculos del apartado a para tomar tu decisión?

28. Se lleva a cabo un experimento para comparar el contenido de alcohol en un per-fume en dos líneas de producción diferentes. La producción se supervisa ocho vecesal día, obteniéndose los datos que se muestran a continuación:

Línea 1   0.48 0.39 0.42 0.52 0.40 0.48 0.52 0.52Línea 2   0.38 0.37 0.39 0.41 0.38 0.39 0.40 0.39

a ) Plantear las hipótesis estadísticas que debemos contrastar para decidir quélínea produce resultados más homogéneos.

b) ¿Es necesario suponer que ambas poblaciones son normales para resolver elcontraste según los métodos con los que contamos?

c ) Aplicar el test adecuado, suponiendo, si es necesario, la normalidad de lasvariables, y decidir qué línea recomendarías usar para un nivel de significaciónα = 0,05.

d ) Acotar lo mejor que puedas el valor de P.

29. Una empresa química quiere localizar un lugar para verter residuos peligrosos cercade una ciudad de 50.000 habitantes, y ha ofrecido una considerable compensacióneconómica a la ciudad. Se ha encuestado a 200 adultos residentes en dicha ciudad(110 mujeres y 90 hombres), elegidos al azar. El 60 % se opone a la ubicación, el

32 % está a favor y el 8 % indeciso. De aquellos que se oponen, el 65 % son mujeres,y de los que están a favor, el 62.5 % son hombres. Usando un nivel de significacióndel 5 %, ¿podríamos concluir que las opiniones sobre el lugar de vertido dependendel sexo?. ¿Qué colectivo está más en desacuerdo con la idea propuesta por laempresa, hombres o mujeres?

30. Un problema que se presenta en ciertos tipos de minas es que algunos subproductostienden a ser moderadamente radiactivos, y, en ocasiones, van a parar a las reservas

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 44/62

44   CAPÍTULO 5. TEST DE HIPÓTESIS 

de agua dulce. La EPA ha emitido reglamentos relativos a la cantidad máxima deradiactividad en las reservas de agua potable. En particular, el nivel máximo parala radiación natural es de cinco picocuries por litro de agua. Se han seleccionado

64 muestras aleatorias de agua del suministro de una ciudad, encontrando que sumedia muestral es de 4.61 picocuries por litro, y una desviación estándar de 0.87picocuries por litro.

a ) ¿Proporcionan estos datos pruebas suficientes para afirmar que el nivel mediode radiación es seguro?

b) Calcular el P  − valor de la prueba del inciso (a) y explicar su significado

Supongamos que se hacen ciertos cambios en la mina con el objetivo de reducir laradiación emitida. Para comprobar si resultan efectivos, se toman otras 60 muestrasaleatorias de agua, obteniendo en este caso que su media es de 4.3 picocuries por

litro y su varianza de 0.25.

c. Estimar un intervalo de confianza para la diferencia de medias y otro para elcociente de las varianzas, al 95 %.

d. Según los resultados del apartado anterior, ¿qué se puede decir acerca de laefectividad de las medidas tomadas?

31. Se realizan dos procedimientos diagnósticos diferentes sobre un grupo de 75 ma-teriales, con objeto de determinar la presencia o ausencia de una determinadasustancia. Los resultados se expresan en la siguiente tabla:

Procedimiento 2+   −

Procedimiento 1   +   41 8−   14 12

Contrastar la diferencia entre proporciones de positivos por ambos procedimientos.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 45/62

Capítulo 6

Relación entre caracteres y

variables

6.1. Cuestiones teóricas

1. Se estudia la relación entre dos caracteres cualitativos A  y  B , distinguiéndose tresniveles en el primero y cuatro en el segundo. Se escogió, de manera aleatoria, unamuestra de tamaño  n, clasificándose cada individuo de la misma en su correspon-diente categoría.

a ) ¿Entre qué valores puede encontrarse, en este caso, el coeficiente de Pearson?Tras los cálculos pertinentes, se obtuvo  C  = 0,21.

b) Para contrastar la hipótesis de independencia, se aplicó el test χ2

, resultandoP < 0,05. ¿Puede ser  n  menor que 100?

2. Demuestra que cualquier recta de regresión pasa siempre por el punto  (x, y).

3. Se tiene un dado rojo y otro azul. Se supone que ambos son cubos perfectos.Consideremos las variables   X   : “resultado obtenido tras lanzar el dado rojo” eY   : “resultado obtenido tras lanzar el dado azul”.

a ) ¿Intuyes cuál debe ser la ecuación de la recta de regresión poblacional de  Y sobre X ? Ten en cuenta, que el valor medio, tanto de la variable  X  como dela variable  Y , es 3.5.

b) ¿Es de utilidad conocer el resultado de la variable  X  a la hora de averiguarel de la variable  Y ?

Tras lanzar ambos dados en 12 ocasiones, se obtuvo una recta de regresión muestraly = 3,8− 0,07x, con un coeficiente de correlación lineal muestral  r  = −0,13.

c) ¿Contradice esto la afirmación anterior?

45

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 46/62

46   CAPÍTULO 6. RELACIÓN ENTRE CARACTERES Y VARIABLES 

4. Comenta las siguiente afirmaciones:

a ) Si el parámetro  r2 es próximo a  1, el parámetro  s2 lo es a  0.

b) Si una muestra de tamaño   n   aporta un coeficiente de correlación   r   = 0,entonces no existe recta de regresión muestral.

c ) Es posible decidir H 1: Correlación lineal aún con un coeficiente de correlaciónlineal r  próximo a 0.

d ) Si realizamos una predicción del valor de  Y , supuesto conocido que  X  = x0,a partir de la recta de regresión muestral, la  fiabilidad de ésta depende de ladistancia de  x0 a la media muestral de los valores de  X . De hecho, si  x0 =  x,la predicción será con certeza exacta.

e ) A medida que el tamaño de muestra tiende a infinito, el error máximo asociadoa la estimación de  α + βx  tiende a cero, en todo caso.

 f  ) A medida que le tamaño de muestra tiende a infinito, el error máximo asociadoa la estimación (predicción) de  Y  tiende a cero, en todo caso.

g ) Para determinar si existe relación entre dos caracteres cualitativos, con 4 y 5niveles, respectivamente, estimamos el coeficiente  C  de Pearson, y obtenemosC  = 0,9, por lo que decidimos que están relacionadas.

5. Completar la siguiente tabla, de forma que entre las características  A  y  B  haya:

a ) la máxima asociación

b) independencia

Característica BCaracterística A   B1   B2   TotalA1   mA2

Total n

6. A partir de una muestra de 50 encinas afectadas por cierto hongo, se ha realizadouna investigación con objeto de estudiar la posible relación entre el tiempo tran-scurrido desde la aparición del hongo (clasificado como menor de 5 días o mayor de5 días) hasta su tratamiento, y el resultado  final obtenido (clasificado como buenoo malo). Tras realizar el estudio descriptivo, se obtuvo un coeficiente de Pearson

C  = 0,15.

a ) Comentar el resultado e interpretar el signo de C .

b) Calcular el coeficiente φ.

Supongamos ahora que se hubiera obtenido un coeficiente de Pearson   C   = 0,siendo además conocido que, de las 50 encinas de la muestra, 20 han evolucionadopositivamente.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 47/62

6.1. CUESTIONES TEÓRICAS    47

c. Si nos restringimos a las encinas tratadas antes de 5 días, ¿qué proporción deéstas evolucionan entonces positivamente?

d. ¿Y si nos restringimos a las tratadas después de 5 días?

7. Dada una nube de n  puntos correspondientes a dos variables  X  e  Y , el coeficienter es la medida del grado de correlación lineal que se observa entre ambas variables,de tal forma que   |r| = 1 cuando se da una correlación perfecta, esto es, todos lospuntos aparecen sobre una misma recta. Demuéstralo, es decir, prueba que si lacorrelación es perfecta,  |r| = 1 y viceversa: si |r| = 1, la correlación es perfecta.

8. Indica un ejemplo de 4 pares de datos que presenten un coeficiente de correlaciónlineal r = −1. Indica un ejemplo de 4 pares de datos que presenten un coeficientede correlación lineal  r  = 0.

9. En un estudio de regresión lineal se obtuvo, a partir de una muestra de tamañon = 12, una recta de regresión lineal y  = 3,2−4,1x, y un coeficiente de correlaciónlineal r  = +0,93. ¿Existe alguna contradicción entre estos resultados?

10. ¿Cuál es la recta de regresión lineal para los puntos (−1,−1),  (−1, 1),   (1,−1),   (1, 1)?

11. Una función que relacione cierta variable Y  respecto a otra variable  X  se dice quees intrínsecamente lineal si, por medio de una transformación en  X  y/o en  Y , sepuede expresar como:

y0 = a + bx0

donde   x0 es la variable independiente transformada e   y0 la variable dependientetransformada. Por ejemplo:

Función Transformación Forma lineal

Exponencial   y =  αeβx y0 = ln y y0 = ln α + βx

Potencia   y =  αxβ   y0 = log yx0 = log x

  y0 = log α + βx0

Recíproca   y =  α + β 1

x  x0 =

 1

x  y =  α + βx0

Determina, en cada uno de los siguientes casos, si la función dada es intrínsecamentelineal. En caso afirmativo, identificar la transformación adecuada y la forma linealresultante:

a )   y =  α + β log x

b)   y =  1

1 + eα+βx

c )   y =  eα+βx

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 48/62

48   CAPÍTULO 6. RELACIÓN ENTRE CARACTERES Y VARIABLES 

d )   y =  α + βeλx

12. Un alumno contesta en un examen que las rectas de regresión de  X  sobre  Y   y de

Y   sobre  X   son:

x   = 2y − 1

3− 3y   = 3

respectivamente. ¿Por qué sabemos que la respuesta no es correcta?

13. En un ajuste de regresión lineal se sabe que  x = 2,  y = 1 y  r  = 0. ¿Cuáles son lasrectas de regresión, de  X  sobre  Y , e  Y   sobre  X ?

14. Se considera la relación entre dos variables X  e Y . Tras tomar n pares de observa-ciones (X i, Y i), i = 1, . . . , n , se observó que los n puntos se ajustaban perfectamente

a una curva del tipo  y  =  kx3. Sin embargo, el valor del coeficiente r  fue 0.6785.

a ) ¿Crees que es contradictorio el último dato?

b) ¿Qué cambio de variables nos aportará un máximo coeficiente de correlaciónlineal?

c ) ¿Cuál será el valor del error de regresión, s2, para dicho cambio de variables?

15. Observando los gráficos correspondientes a muestras de  n  pares de valores  (xi, yi)de dos variables aleatorias   X   e   Y,   ordenar la intensidad de la relación lineal, oequivalentemente el valor del coeficiente de correlación lineal  r  :

16. Relacionar cada conjunto de datos con su recta de regresión, razonando brevementela respuesta.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 49/62

6.2. EJERCICIOS Y PROBLEMAS    49

(a)

X

20100

      Y

20

10

0

(b)

X

5,04,03,02,01,00,0

      Y

5,0

4,0

3,0

2,0

1,0

0,0

(c)

X

121086420

      Y

12

10

8

6

4

2

0

-2

(d)

X

20100-10

      Y

200

150

100

50

0

-50

(e)

X

14121086420-2

      Y

14

12

10

8

6

4

2

0

(f)

X

2520151050

      Y

35

30

25

20

15

10

y = 31− x r2 = 1   y = 29,41 + 5,88x r2 = 0,549   y = 12,31− 0,93x r2 = 0,908y =  x r2 = 1   y = 2,5   r2 = 0   y = −0,5 + x r2 = 0,971

17. Se considera la relación entre dos variables X  e Y . Tras tomar n  pares de observa-ciones (X i, Y i), i = 1, . . . , n , se observó que los n puntos se ajustaban a un modelo

probabilístico lineal. Estimamos la recta de regresión de  Y   sobre  X, y =  a + bx, yel coeficiente de correlación muestral,  r. Determinar cómo quedarían modificadoslos valores de  a, b y  r  si:

a ) Sumamos una constante, k, a los valores de  X.

b) Sumamos una constante, k, a los valores de  Y.

c ) Sumamos una constante, k, a los valores de  X  y de  Y.

d ) Multiplicamos los valores de X  por una constante,  k.

e ) Multiplicamos los valores de Y  por una constante,  k.

 f  ) Multiplicamos los valores de X  y de  Y  por una constante,  k.

6.2. Ejercicios y Problemas

1. Utilizar los datos de la tabla siguiente para probar si la habilidad de una personaen desempeñar trabajos de Ingeniería Química es independiente de su interés porla Estadística:

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 50/62

50   CAPÍTULO 6. RELACIÓN ENTRE CARACTERES Y VARIABLES 

Habilidad en Ingeniería Química Baja Media Alta

Bajo 63 42 15

Interés por la Estadística    Medio 58 61 31Alto 14 47 29

a ) ¿Podemos concluir, con un nivel de significación del 1 %, que hay relación entrela habilidad de una persona en desempeñar trabajos de Ingeniería Química ysu interés por la Estadística?

b) ¿Tiene sentido preguntarse acerca de la fortaleza de la relación entre las vari-ables habilidad de una persona para desempeñar trabajos de Ingeniería Quími-ca e interés por la Estadística?. En caso de respuesta afirmativa, determinardicha fortaleza y explicar el resultado.

2. Para estudiar el efecto de un nuevo antibiótico sobre la curación de cierta infecciónbacteriana se administraron, en ratones a los que se había inoculado la enfermedad,diferentes dosis del antibiótico. En la tabla se presenta el grado de curación   finalde la enfermedad frente a la dosis sumunistrada:

Dosis Muerte Secuela graves Secuelas leves Curación total TotalNula 16 0 0 0 16Baja 52 36 14 4 106Alta 0 9 13 2 24Muy alta 0 3 4 5 12Total 68 48 31 11 158

¿Qué conclusiones podemos obtener a partir de la información que aporta la mues-tra? Tener en cuenta las condiciones de validez del test χ2. Si éstas no se cumplen,se deben agrupar categorías contiguas.

3. Se pregunta a 50 economistas, 40 ingenieros químicos y 10 abogados si creen queen el próximo mes la bolsa va a subir, bajar o permanecerá igual. El 20% de loseconomistas opina que subirá, mientras que el 40 % piensa que bajará. El 50 % delos ingenieros químicos se inclina porque permanecerá igual, y, tan solo, el 5 % creeque bajará. Por último, la mitad de los abogados se decanta por la subida y la otramitad cree que bajará.

a ) Representar los datos en una tabla de contingencia

b) ¿Existe relación entre los pronósticos sobre la evolución del mercado bursátily la profesión del encuestado?

4. Se ha realizado un estudio acerca de la satisfacción de los usuarios de software deingeniería química. Para ello, se realizó una encuesta a 1000 usuarios muestreados,

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 51/62

6.2. EJERCICIOS Y PROBLEMAS    51

obteniendo los siguientes porcentajes:

Emplea programas 

de este tipo   Satisfechos Insatisfechos TotalesSiempre 27.5 0.0 27.5Generalmente 31.3 2.5 33.8Ocasionalmente 31.2 3.8 35.0Nunca 2.5 1.2 3.7Total 92.5 7.5 100.0

Analizar los datos y extraer las conclusiones oportunas.

5. En los últimos años, muchas compañías estadounidenses han realizado la conver-sión al sistema métrico. A   fin de investigar este fenómeno, se analizan los datosrecolectados entre 757 pequeños fabricantes, obteniendo:

Empresas de alta tecnología 

Convirtieron    Sí NoSí 81 296No 80 300

¿Hay pruebas suficientes que indiquen que las distribuciones de porcentajes deempresas que hicieron la conversión al sistema métrico y las que no la hicierondifieren para las empresas con alta tecnología?

6. Una compañía eléctrica debe elegir entre dos tipos de tecnología para generar elec-tricidad (carbón o nuclear). Para conocer las actitudes de los ciudadanos locales,realiza un sondeo de opinión pública. Consideró cuatro sectores: medios de comu-nicación (MC), sindicato de mineros del carbón (SMC), ecologistas (E) y gruposlocales (GL). Se muestrearon aleatoriamente 50 personas de cada sector cuyasopiniones se reflejan en la tabla siguiente:

Sector Opinión    MC SMC E GL TotalApoyan la opción del carbón 21 42 11 25 99Apoyan la opción nuclear 18 2 16 23 49Neutral 11 6 23 12 52Total 50 50 50 50 200

¿Difiere la opinión pública entre los cuatro grupos?

7. Se desea saber si una balanza investigada está calibrada. Los datos disponibles son:

X    1 2 5 10 20 50 100 150 200 500 1000 1500 2000 3000Y    1.2 1.9 4.8 10.5 21 49 98 152 202 496 1010 1520 1986 3020

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 52/62

52   CAPÍTULO 6. RELACIÓN ENTRE CARACTERES Y VARIABLES 

8. Como parte de un estudio sobre la rapidez de combustión de grafito artificial enun   flujo de aire húmedo, se llevó a cabo un experimento con miras a investigarla difusividad del oxígeno a través de una mezcla de vapor de agua. Para ello, se

prepararon muestras de mezclas de oxígeno y nitrógeno con una fracción molar deagua de 0.017, a diez temperaturas distintas,   fi jadas de antemano, y se midió ladifusividad del oxígeno en cada una de ellas, obteniendo los siguientes resultados:

Temperatura 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9Difusividad 1.69 1.99 2.31 2.65 3,01 3.39 3.79 4.21 4.64 5.07

a ) Representar los datos en un diagrama de dispersión.

b) Ajustar un modelo de regresión lineal simple que relacione la difusividadmedia del oxígeno con la temperatura. Interpretar las estimaciones de losparámetros del modelo.

c ) Calcular la varianza intrínseca muestral e interpretar su valor.d ) Contrastar si la temperatura y la difusividad del oxígeno exhiben una cor-

relación positiva.

e ) Hacer estimaciones por intervalo de la difusividad que estima el modelo paratemperaturas de 2.0 y de 0 ¿Cuál de las dos predicciones es más  fiable?

9. En un estudio de correlación-regresión entre dos variables   f   (fuerza, medida enNewtons) y   s   (distancia, medida en metros), se optó por el siguiente cambio devariables:

X  = ln s, Y   = ln f.

A partir de una muestra aleatoria de tamaño  n  = 12, se obtuvo como resultadoP   = 0,02 en el test del coeficiente de correlación lineal, y una recta de regresiónmuestral  y  = 2,84− 2,01x.

a ) ¿Qué decisión corresponde a un nivel de significación α  = 0,05? ¿Y a un nivelde significación α  = 0,001?

b) Calcular el coeficiente r  de correlación muestral.

c ) Estimar por intervalo el valor de f  que corresponde a una distancia  s  = 4m.

10. Se pretende establecer la relación entre la temperatura, T , de determinadas aguasresiduales (medida en   oC ) y la concentración,  S,  de cierta sustancia tóxica (me-

dida en  mg/l). En la siguiente tabla se dan los resultados de las mediciones de laconcentración para ocho temperaturas distintas:

17oC    22oC    27oC    32oC    37oC    42oC    47oC    52oC 9.6 12.0 15.1 18.1 25.0 28.9 36.5 48.6

10.1 12.7 15.8 19.0 23.4 28.2 34.8 47.59.2 14.7 18.5 24.0 35.7

15.5 38.1

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 53/62

6.2. EJERCICIOS Y PROBLEMAS    53

Como puedes apreciar, se trata de un muestreo del tipo II, es decir, se toman datosde la variable  S,  para ciertos valores predeterminados de la variable  T .

Suponiendo que se verifican las condiciones del modelo de regresión lineal:

a ) Representar esquemáticamente la nube de puntos.

b) Calcular la recta de regresión de S   sobre  T , así como el coeficiente de cor-relación lineal r .

c ) Realizar el contraste de correlación lineal, a partir del coeficiente r, calculandoel valor de significación P .

d ) Estimar puntualmente y mediante un intervalo de confianza, al 95 %, la con-centración que corresponde a una temperatura de  20oC .

e ) Estimar puntualmente la temperatura que corresponde a una concentraciónde  10,0mg/l.

11. Las cantidades de un compuesto   Y , que se disuelven en 100 gramos de agua, avarias temperaturas, X, se registran como sigue:

X   (oC )   Y   (gramos)0 8 6 8

15 12 10 1430 25 21 2445 31 33 2860 44 39 4275 48 51 44

a ) Representar gráficamente esta información

b) Calcular la recta de regresión muestral

c ) ¿Qué cantidad del compuesto Y   se disuelve en 100 gramos de agua, a 50   oC ?

12. Se han tomado cinco muestras de una cantidad   fi ja de glucógeno, y se les haaplicado una cantidad X  de glucogenasa (en µmoles/litro) anotando, en cada caso,la velocidad de reacción Y  medida en µmoles/minuto, obteniéndose así la siguientetabla:

X    1 2 3 0.2 0.5Y    18 35 60 8 10

Sabiendo que la reacción no se ajusta al modelo  Michaelis−Menten, se pide:

a ) ¿Se deduce de estos datos que la velocidad de reacción aumenta con la con-centración de glucogenasa?. Justificar detalladamente la respuesta.

b) Si a una de las muestras le hubiésemos aplicado una concentración de gluco-genasa de 5 mmoles/litro, ¿cuál hubiera sido la velocidad de reacción?, ¿conqué grado de predicción?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 54/62

54   CAPÍTULO 6. RELACIÓN ENTRE CARACTERES Y VARIABLES 

13. Consideremos los datos que aparecen en la tabla siguiente:

xi   10 20 30 40 50 60

yi   12 15 19 21 25 30

a ) Calcular el coeficiente de correlación lineal y decidir si las variables son inde-pendientes. Caso de estar relacionadas, estimar la recta de regresión.

b) Supongamos que incrementamos cada valor de la variable  Y   en 5 unidades,mientras que el valor de  X  permanece constante. ¿Cuál será ahora el coefi-ciente de correlación lineal y la recta de regresión?

c ) Supongamos ahora que incrementamos cada valor de la variable   X   en 5unidades, mientras que el valor de  Y  permanece constante. ¿Cuál será ahorael coeficiente de correlación lineal y la recta de regresión?

d ) ¿Qué ocurre en los supuestos b) y  c) con la varianza intrínseca muestral?

14. Se ha medido el contenido de oxígeno, Y, en mg/l, del lago Worther, a una profun-didad de  X  metros, obteniéndo los siguientes datos:

X    15 20 30 40 50 60 70Y    6.5 5.6 5.4 6.0 4.6 1.4 0.1

a ) Estudiar la correlación entre ambas variables

b) Ajustar una recta a los datos obtenidos

c ) Para una profundidad de 75 metros, ¿qué contenido en oxígeno se podríapredecir?

15. Se realizaron pruebas de resistencia térmica para estudiar la relación entre la tem-peratura y la duración del alambre esmaltado de poliéster, obteniéndose los sigu-ientes resultados:

Duración 200 5933 5404 4947 4963 3358 3878

Temperatura    220 1561 1494 747 768 609 777240 258 299 209 144 180 184

a ) Representar la nube de puntos, ¿sugiere una relación probabilística lineal entrelas variables?

b) Representar el diagrama de dispersión de 1/Temperatura frente a ln(Duración),¿es congruente con una relación lineal de los datos transformados? En casoafirmativo, estimar los coeficientes del modelo lineal.

c ) Expresar algebraicamente el modelo del inciso   b)  y pronosticar la duraciónpara una temperatura de 210.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 55/62

6.2. EJERCICIOS Y PROBLEMAS    55

16. Considera los siguientes cuatro conjuntos de datos de las variables X  e  Y 1:

Conjunto de datos 

1-3 1 2 3 4 4Variable    X Y Y Y X Y  

4 4.25 3.10 5.39 19 12.505 5.68 4.74 5.73 8 5.256 7.24 6.13 6.08 8 5.567 4.82 7.26 6.42 8 5.768 6.95 8.14 6.77 8 6.589 8.81 8.77 7.11 8 6.89

10 8.04 9.14 7.46 8 7.0411 8.33 9.26 7.81 8 7.7112 10.84 9.13 8.15 8 7.91

13 7.58 8.74 12.74 8 8.4714 9.96 8.10 8.84 8 8.84

a ) Calcular las rectas de regresión, para cada conjunto de datos.

b) ¿Puedes distinguir entre los 4 conjuntos de datos, utilizando los estadísticosresumen?

c ) Comentar lo apropiado o inapropiado de ajunstar un modelo de regresiónlineal para cada conjunto.

17. Con frecuencia, se obtienen datos bivariados cuando se usan dos técnicas distin-

tas para medir la misma cantidad. Por ejemplo, las observaciones siguientes deX   : “concentración de hidrógeno (en ppm), determinada con un método de cro-matografía de gases” e Y   : “concentración medida con un nuevo método de sensor”fueron publicadas en un artículo cientí fico:

X    47 62 65 70 70 78 95 100 114 118Y    38 62 53 67 84 79 93 106 117 116

X    124 127 140 140 140 150 152 164 198 221Y    127 114 134 139 142 170 149 154 200 215

a ) Representar el gráfico de dispersión.b) ¿Hay una relación muy fuerte entre los dos tipos de mediciones?

c ) Calcular la recta de regresión.

d ) ¿Los dos métodos parecen estar midiendo más o menos la misma cantidad?Explicar el razonamiento.

1 Los tres primeros tienen los mismos valores para  X  por lo que aparecen sólo una vez.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 56/62

56   CAPÍTULO 6. RELACIÓN ENTRE CARACTERES Y VARIABLES 

18. Los datos siguientes, relativos a la rapidez de combustión en masa, X, y la alturade la  flama,  Y , fueron obtenidos en una investigación acerca de papel de  filtro:

X    1.7 2.2 2.3 2.6 2.7 3.0 3.2 3.3 4.1 4.3 4.6 5.7 6.1Y    1.3 1.8 1.6 2.0 2.1 2.2 3.0 2.6 4.1 3.7 5.0 5.8 5.3

a ) Representar un diagrama de dispersión y comentarlo.

b) Ajustar un modelo de regresión lineal y predecir la altura de la   flama parauna rapidez de combustión en masa de  1/2 ¿Tiene sentido este valor?

c ) Comprobar si una función de potencia es una selección más apropiada demodelo, y, en caso afirmativo, estimar los coeficientes.

d ) ¿Qué valor pronostica el modelo del inciso c) para una rapidez de combustiónen masa de  1/2?

19. Se realizó un experimento para estudiar el agrietamiento por esfuerzos de corrosiónde acero inoxidable, tipo 304, en un entorno simulado de reactor con agua enebullición. Se tomaron seis muestras de acero, se recocieron y se sensibilizaron enagua a 289   oC con oxígeno y sulfato disueltos, sometiéndolos a diversas cargas. Enla tabla siguiente se muestran la carga máxima y la rapidez de crecimiento de lasgrietas resultantes:

Carga máxima ¡

MP a × m1/2¢

  30.0 35.6 41.5 50.2 55.5 61.1Rapidez de crec.

 ¡m/s × 1010

¢  1.0 2.2 3.9 5.8 5.0 14.0

a ) ¿Hay pruebas suficientes que indiquen que la rapidez de crecimiento aumenta

linealmente con la carga?b) Estimar el incremento medio en la rapidez de crecimiento de las grietas, por

cada incremento unitario en la carga máxima, con una confianza del 95%.

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 57/62

Capítulo 7

Comparación de   k   medias

7.1. Cuestiones teóricas

1. Razonar si son verdaderas o falsas cada una de las siguientes afirmaciones:

a ) Con los modelos de ANOVA se pueden comparar más de dos muestras a lavez.

b) Para poder aplicar los modelos de ANOVA no es necesario que las muestrassean independientes.

c ) Aunque en un ANOVA decidamos   H 0   es conveniente hacer comparacionesmúltiples.

2. Comprueba con un caso sencillo que el test de Student para la comparación demedias partiendo de dos muestras independientes equivale a la ANOVA de una víapara dos niveles.

7.2. Ejercicios y problemas

1. En una determinada zona rural, los labradores tienen a su disposición la comprade cinco tipos diferentes de abonos con nitrógeno. En las etiquetas de los sacos,cada fabricante asegura que su abono es mejor que los otros tres, como fertilizante.Para comprobarlo, se han seleccionado cuatro  fincas con la misma calidad de tierray el mismo tipo de árboles, y se les ha administrado a cada una un tipo de abonoal azar. En la época de la cosecha, se han tomado muestras de árboles en cada unade ellas y pesado la cantidad de fruto que han dado, obteniéndose los siguientes

57

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 58/62

58   CAPÍTULO 7. COMPARACIÓN DE  K   MEDIAS 

resultados:Abonos Peso en kilos  1 80 73 60 42 56

2 75 53 60 43 90 313 70 83 80 79 68 924 100 41 37 60 53 70 605 90 110 108 98 120

¿Mienten todas las fábricas? ¿Bajo qué supuestos?

2. Se utilizaron cuatro laboratorios para llevar a cabo análisis químicos. Se enviarona los laboratorios muestras de los mismos materiales para ser analizadas. Los re-sultados fueron los siguientes:

Material 

Laboratorio   1 2 3 4 51 58.7 61.4 60.9 59.1 58.22 62.7 64.5 63.1 59.2 60.33 55.9 56.1 57.3 55.2 58.14 60.7 60.3 60.9 61.4 62.3

Suponemos que las muestra han sido recogidas al azar, que las cuatro variables sonnormales con varianza común y que no se produce interacción laboratorio-material.Decide entonces si miden igual los laboratorios por término medio.

3. Un bioquímico desea averiguar si hay diferencia entre tres marcas comerciales dekits , para efectuar la técnica de glucosa. Para ello, prepara un   pool   de sueros,lo homogeiniza bien y lo fracciona en 18 alícuotas. Asigna al azar cinco vialespara cada marca y mide la glucosa para el mismo suero en forma repetida. Sila homogeinización está bien realizada, se dan por cumplidos los supuestos deANOVA. Los resultados se muestran en la tabla siguiente.

Marca 

Medición    1 2 31 1.04 1.10 1.212 1.05 1.11 1.193 1.06 1.09 1.184 1.07 1.07 1.175 1.05 1.08 1.216 1.04 1.09 1.20

Decidir si existen diferencias significativas entre las marcas probadas en el experi-mento.

4. En un estudio se midió la concentración en sólidos totales de algas Periphyton  enel South River de Virginia, en seis estaciones diferentes, en seis días distintos, con

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 59/62

7.2. EJERCICIOS Y PROBLEMAS    59

la  finalidad de determinar si la concentración media de mercurio es la misma paralas seis estaciones:

Estación    8-Abril 23-Junio 1-Julio 8-Julio 15-Julio 23-Julio TotalCA 0.45 0.10 0.25 0.09 0.15 0.17 1.21CB 3.24 0.10 0.25 0.06 0.16 0.39 4.20E1 1.33 0.99 1.65 0.92 2.17 4.30 11.36E2 2.04 4.31 3.13 3.66 3.50 2.91 19.55E3 3.93 9.92 7.39 7.88 8.82 5.50 43.44E4 5.93 6.49 4.43 6.24 5.39 4.29 32.77Total 16.92 21.91 17.10 18.85 20.19 17.56 112.53

6Pi=1

6Pi=1

x2ij  = 629,155

a ) ¿De qué tipo de diseño se trata?b) ¿Resulta estadísticamente adecuado el tipo de diseño elegido?

c ) Contrastar la hipótesis de que la concentración media de mercurio es la mismapara las seis estaciones, utilizando un nivel del 0.01.

d ) Ordenar las estaciones según la concentración de mercurio que presentan.

e ) ¿Qué hipótesis es necesario asumir que se cumplen para poder responder alas cuestiones anteriores?

5. Se desea comparar el rendimiento de cuatro máquinas diferentes para el ensam-blaje de un producto. Para ello, se mide el tiempo que tardan en ensamblar dicho

producto seis operarios diferentes, obteniendo los siguientes resultados:Operador 

Máquina    1 2 3 4 5 6 Total1 42.5 39.9 39.6 39.9 42.9 43.9 248.72 40.6 40.3 40.7 42.5 42.7 43.2 250.03 42.1 41.9 42.3 44.4 45.9 46.1 262.74 42.8 43.2 44.5 45.2 46.9 42.8 265.4Total 168.0 165.3 167.1 172.0 178.4 176.0 1026.8

Suponiendo que son ciertas las hipótesis de normalidad, homocedasticidad (igual-dad de varianzas) y que las máquinas han sido asignadas en orden aleatorio a los

operarios,

a ) ¿De qué tipo de diseño se trata?

b) Según los datos de la tabla, ¿resulta ser adecuado?

c ) Comprobar si las máquinas funcionan igual de rápidas, por término medio

d ) Si conocemos que la máquina 1 es la más cara, ¿cuál recomendaría compraren el futuro?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 60/62

60   CAPÍTULO 7. COMPARACIÓN DE  K   MEDIAS 

6. Se ha determinado una magnitud química mediante cuatro operadores diferentesusando una misma técnica y con la misma muestra. El objeto es detectar si haydiferencias debido al factor humano en los resultados del laboratorio. Los datos

obtenidos son: OperarioA 45 43 42 41B 44 44 45 43C 40 44 45 46D 44 45 46 45

a ) Determinar, usando el modelo de ANOVA unifactorial, si hay diferencia entrelos cuatro operadores.

b) En caso de encontrarla, determinar entre cuales de ellos hay diferencias.

7. Los siguientes datos corresponden a los contenidos de colesterol en miligramos,en 100 gramos de tres alimentos dietéticos muy similares, que obtuvieron cuatrolaboratorios:

Alimento

Laboratorio   A B C1 3.4 2.6 2.82 3.0 2.7 3.13 3.3 3.0 3.44 3.5 3.1 3.7

Realizar un análisis de la varianza para contrastar:

a ) ¿Tiene influencia el laboratorio que realiza el análisis sobre el resultado?

b) ¿Qué alimento recomendarías tomar?

8. Se dispone de 4 catalizadores metálicos (platino, cobalto, paladio y rutenio) prepara-dos sobre una base de alúmina. Se toman tres muestras elegidas al azar de formaque en cada una de ellas hay un tipo de catalizador. Una muestra ha sido sometidaa un proceso de calcinación (a 700oC con Oxígeno) otra a un proceso de reduccióncon hidrógeno y la tercera a un proceso de calcinación-reducción. Elegimos comovariable de respuesta la vida útil del catalizador, cuya información se recoge en latabla siguiente:

Catalizador   Calcinación

reducción  Calcinación Reducción Total

Paladio 80 70 82 232Cobalto 60 32 35 127Rutenio 90 82 85 257Platino 95 89 78 262Total 325 273 280 878

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 61/62

7.2. EJERCICIOS Y PROBLEMAS    61

Px2ij  = 68952

Se quiere saber:

a ) Si la vida útil media del catalizador es equivalente para los tres procesosb) Si la vida útil media es significativamente distinta de un catalizador a otro.

c ) ¿Qué catalizador recomendarías utilizar, si el platino es el más caro?

d ) ¿Cuál sería el menos recomendable?

9. Se realizó una evaluación de la unión por difusión de los componentes fabricadoscon zircaloy (una aleación de zirconio). El objetivo principal es determinar cuál detres elementos (níquel, hierro o cobre) es el mejor agente de unión. Puesto que hayuna variación considerable entre los componentes fabricados a partir de lingotesdistintos, se unió un par de componentes de cada lingote empleando cada uno de los

tres agentes y se midió la presión necesaria para separar los componentes unidos.Los datos obtenidos se muestran en la siguiente tabla:

Agente Lingote  de unión 1 2 3 4 5Níquel 7.0 7.5 16.0 12.7 13.1Hierro 11.9 8.8 22.6 18.1 14.2Cobre 12.2 6.4 14.5 7.3 13.2

Identificar los tratamientos y los bloques en este experimento. Decidir cuál es eldiseño más adecuado  (α = 0,01)

a ) ¿Hay indicios de una diferencia en la presión requerida para separar los com-ponentes entre los tres agentes? ¿Qué agente de unión recomendarías usar?

10. Un ingeniero químico efectuó un experimento para estudiar el efecto de cuatrotratamientos sobre la temperatura de transición vítrea (en grados Kelvin) de ciertocompuesto polimérico. La materia prima empleada para fabricar este polímero seadquiere en lotes pequeños, pensándose que el material es bastante uniforme dentrode cada lote, aunque variable entre ellos. Por tanto, cada tratamiento se aplicó amuestras de cada lote con los resultados que se presentan en la tabla:

Lote 

Tratamiento   1 2 31 576 515 5622 584 563 5553 562 522 5504 543 536 530

a ) ¿Qué tipo de diseño experimental se utilizó? ¿Consideras que es el más ade-cuado a priori?

8/16/2019 E.D - PROB - INF - ESTIM - HIP - ASOC - ANOVA.pdf

http://slidepdf.com/reader/full/ed-prob-inf-estim-hip-asoc-anovapdf 62/62

62   CAPÍTULO 7. COMPARACIÓN DE  K   MEDIAS 

b) ¿Los datos proporcionan evidencia suficiente de que exista una diferencia enla temperatura media entre los cuatro tratamientos?

c ) ¿Hay evidencia suficiente de que exista una diferencia en la temperatura mediaentre los tres lotes?

d ) Si el experimento se realizara otra vez en algún momento futuro, ¿recomen-darías algún cambio en el diseño?

11. Se realiza un estudio para determinar si las condiciones de humedad tienen unefecto en la fuerza que se requiere para romper piezas de plástico engomado. Seprueban tres tipos de plástico, para cada uno de los niveles de humedad, puestoque se sabe que el tipo de plástico puede tener influencia en la respuesta. Losresultados, en kilogramos, son los siguientes:

Tipo de Plástico

Humedad    A B C30 % 39.0 36.9 27.450 % 33.1 27.2 29.270 % 33.8 29.7 26.790 % 33.0 28.5 26.9

a ) ¿De qué tipo de diseño se trata?

b) ¿Resulta estadísticamente adecuado el tipo de diseño elegido?

c ) Contrastar si las condiciones de humedad tienen un efecto en la fuerza que serequiere para romper piezas de plástico engomado.

d ) ¿Tiene sentido hacer comparaciones múltiples entre los distintos niveles dehumedad, para poder apreciar mejor las diferencias?