distribuciones bidimensionales - matematicasonline.es · representa los datos mediante una nube de...
TRANSCRIPT
1
Distribuciones bidimensionales
Ejercicio nº 1.- Se ha medido el número medio de horas de entrenamiento a la semana de un grupo de 10 atletas y el tiempo, en minutos, que han hecho en una carrera, obteniendo los siguientes resultados:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado
para el coeficiente de correlación: 0,71; 0,71; 0,45; 0,32. Ejercicio nº 2.- Las notas de 10 alumnos y alumnas de una clase en Matemáticas y en Física han sido las siguientes:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado
para el coeficiente de correlación: 0,23; 0,94; 0,37; 0,94. Ejercicio nº 3.- En una empresa de televenta se ha anotado el plazo de entrega, en días, que anunciaban en los productos y el plazo real, también en días, de entrega de estos, obteniendo la siguiente tabla:
Representa los datos mediante una nube de puntos e indica cuál de estos números te parece más
apropiado para el coeficiente de correlación: 0,87; 0,2; 0,87; 0,2. Ejercicio nº 4.- Considera la siguiente distribución:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado
para el coeficiente de correlación: 0,99; 0,4; 0,83; 0,4.
2
Ejercicio nº 5.- Un grupo de 10 amigos se ha presentado a una prueba de oposición. Anotaron el número de horas que dedicaron a estudiar la semana antes del examen y la nota obtenida en la prueba. La información se recoge en la siguiente tabla:
Representa los datos mediante una nube de puntos e indica cuál de estos valores te parece más
apropiado para el coeficiente de correlación: 0,92; 0,44; 0,92; 0,44. Ejercicio nº 6.- Se ha realizado una encuesta preguntando por el número de personas que habitan el hogar familiar y el número de habitaciones que tiene la casa. La tabla siguiente recoge la información obtenida:
Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Ejercicio nº 7.- Se han realizado unas pruebas de habilidad (puntúan de 0 a 5) en un grupo de alumnos. Las siguientes puntuaciones corresponden a las obtenidas por seis alumnos en dos de ellas:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las variables?
Ejercicio nº 8.- En un reconocimiento médico a los niños de un colegio, se les ha pesado, en kilogramos, y se les ha medido, en centímetros. Aquí tienes los datos de los primeros seis niños:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables?
Ejercicio nº 9.- En seis modelos de zapatillas deportivas se ha estudiado el peso, en gramos, que tiene (para el número 42) y su precio, en euros. La información obtenida se recoge en esta tabla:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables?
3
Ejercicio nº 10.- Se ha medido la potencia (en kW) y el consumo (litros/100 km) de 6 modelos distintos de coches, obteniéndose los siguientes resultados:
Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Ejercicio nº 11.- Se ha estudiado en distintas marcas de yogures naturales el porcentaje de grasa que contenían, así como las kilocalorías por envase. Estos son los resultados obtenidos en seis de ellos:
a) Halla la recta de regresión de Y sobre X.
0,85).que(Sabemoses?estimacionestasválidas¿Son.10e52,Calculab) ryy ˆˆ
Ejercicio nº 12.- Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La siguiente tabla nos da los seis primeros pares de datos obtenidos:
a) Halla la recta de regresión de Y sobre X. b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el coste por página en
blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la estimación? (Sabemos que r 0,97). Ejercicio nº 13.- En distintos modelos de aspiradores se ha medido el peso, en kilogramos, y la capacidad útil de la bolsa, en litros, obteniendo los siguientes resultados:
a) Halla la recta de regresión de Y sobre X.
0,85). que (Sabemos ?estimación esta fiable ¿Es .6Calculab) r y
4
Ejercicio nº 14.- En seis institutos de la misma zona se ha estudiado la nota media de los estudiantes de 1º de bachillerato en Matemáticas y en Inglés, obteniéndose la información que se recoge en la siguiente tabla:
a) Halla la recta de regresión de Y sobre X.
0,87). que (Sabemos ?estimación esta fiable ¿Es .55,Calculab) ry
Ejercicio nº 15.- Se ha medido el peso, en kilogramos, y el volumen, en litros, de distintos tipos de maletas, obteniendo los resultados que se recogen en esta tabla:
a) Halla la recta de regresión de Y sobre X.
0,79). que (Sabemos ?estimación estafiable ¿Es120Calculab) ry .ˆ
Ejercicio nº 16.- En una academia para aprender a conducir se han estudiado las semanas de asistencia a clase de sus alumnos y las semanas que tardan en aprobar el examen teórico (desde que se apuntaron a la autoescuela). Los datos correspondientes a seis alumnos son:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables? Ejercicio nº 17.- La estatura, en centímetros, de seis chicos de la misma edad y la de sus padres viene recogida en la siguiente tabla:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables? Ejercicio nº 18.- Se ha preguntado en seis familias por el número de hijos y el número medio de días que suelen ir al cine cada mes. Las respuestas han sido las siguientes:
5
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables? Ejercicio nº 19.- Considera la siguiente distribución:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables? Ejercicio nº 20.- Un grupo de seis atletas ha realizado pruebas de salto de longitud y de altura. Las dos se han puntuado en una escala de 0 a 5. Los resultados obtenidos han sido los siguientes:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables?
6
Soluciones
Distribuciones bidimensionales
Ejercicio nº 1.- Se ha medido el número medio de horas de entrenamiento a la semana de un grupo de 10 atletas y el tiempo, en minutos, que han hecho en una carrera, obteniendo los siguientes resultados:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado
para el coeficiente de correlación: 0,71; 0,71; 0,45; 0,32. Solución:
A la vista de la representación, observamos que el coeficiente de correlación, r, es negativo y relativamente alto.
Por tanto, r 0,71. Ejercicio nº 2.- Las notas de 10 alumnos y alumnas de una clase en Matemáticas y en Física han sido las siguientes:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado
para el coeficiente de correlación: 0,23; 0,94; 0,37; 0,94. Solución:
Viendo la representación, observamos que el coeficiente de correlación es
positivo y alto. Por tanto, r 0,94.
7
Ejercicio nº 3.- En una empresa de televenta se ha anotado el plazo de entrega, en días, que anunciaban en los productos y el plazo real, también en días, de entrega de estos, obteniendo la siguiente tabla:
Representa los datos mediante una nube de puntos e indica cuál de estos números te parece más
apropiado para el coeficiente de correlación: 0,87; 0,2; 0,87; 0,2. Solución:
Vemos que la relación entre las variables es ligeramente positiva, pero muy baja. Por tanto,
r 0,2. Ejercicio nº 4.- Considera la siguiente distribución:
Representa los datos mediante una nube de puntos y di cuál de estos valores te parece más apropiado
para el coeficiente de correlación: 0,99; 0,4; 0,83; 0,4. Solución:
Vemos que hay una relación positiva entre las variables, pero es baja. Por tanto,
r 0,4.
8
Ejercicio nº 5.- Un grupo de 10 amigos se ha presentado a una prueba de oposición. Anotaron el número de horas que dedicaron a estudiar la semana antes del examen y la nota obtenida en la prueba. La información se recoge en la siguiente tabla:
Representa los datos mediante una nube de puntos e indica cuál de estos valores te parece más
apropiado para el coeficiente de correlación: 0,92; 0,44; 0,92; 0,44. Solución:
Observando la representación, vemos que el coeficiente de correlación es positivo y bajo. Por tanto, r 0,44. Ejercicio nº 6.- Se ha realizado una encuesta preguntando por el número de personas que habitan el hogar familiar y el número de habitaciones que tiene la casa. La tabla siguiente recoge la información obtenida:
Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución:
9
Medias:
17,3
6
19
5,46
27
y
x
Desviaciones típicas:
67,045,017,3
6
63
96,092,05,46
127
2
2
y
x
Covarianza:
40,040,017,35,4
6
88 xyxy
Coeficiente de correlación:
62,062,067,096,0
40,0
rr
Hay una relación positiva, aunque no demasiado fuerte, entre las variables. Ejercicio nº 7.- Se han realizado unas pruebas de habilidad (puntúan de 0 a 5) en un grupo de alumnos. Las siguientes puntuaciones corresponden a las obtenidas por seis alumnos en dos de ellas:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las variables? Solución:
10
Medias:
33,36
20
83,36
23
y
x
Desviaciones típicas:
76,058,033,36
70
08,116,183,36
95
2
2
y
x
Covarianza:
079,0σ079,033,383,36
77 xyxy
Coeficiente de correlación:
096,0096,076,008,1
079,0
rr
La relación entre las variables es prácticamente nula.
Ejercicio nº 8.- En un reconocimiento médico a los niños de un colegio, se les ha pesado, en kilogramos, y se les ha medido, en centímetros. Aquí tienes los datos de los primeros seis niños:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución:
xi
yi
xi
2y
i
2x
iy
i
120 25 14400 625 3000
110 30 12100 900 3300
140 35 19600 1225 4900
130 25 16900 625 3250
125 20 15625 400 2500
115 20 13225 400 2300
740 155 91850 4175 19250
11
Medias:
83,25
6
155
33,1236
740
y
x
Desviaciones típicas:
35,564,2883,25
6
4175
90,904,9833,1236
91850
2
2
y
x
Covarianza:
72,2272,2283,2533,123
6
19250 xyxy
Coeficiente de correlación:
43,043,035,590,9
72,22
rr
yx
xy
La relación entre las variables es positiva, pero débil.
Ejercicio nº 9.- En seis modelos de zapatillas deportivas se ha estudiado el peso, en gramos, que tiene (para el número 42) y su precio, en euros. La información obtenida se recoge en esta tabla:
Calcula la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución:
12
Medias:
67,61
6
370
33,6336
3800
y
x
Desviaciones típicas:
02,2314,53067,61
6
26000
32,1578,23433,6336
050.2408
2
2
y
x
Covarianza:
87,5087,5067,6133,633
6
234650 xyxy
Coeficiente de correlación:
14,014,002,2332,15
87,50
rr
La relación entre las variables es muy débil. Podemos decir que no están relacionadas. Ejercicio nº 10.- Se ha medido la potencia (en kW) y el consumo (litros/100 km) de 6 modelos distintos de coches, obteniéndose los siguientes resultados:
Halla la covarianza y el coeficiente de correlación. ¿Cómo es la relación entre las dos variables? Solución:
13
Medias:
15,9
6
9,54
846
504
y
x
Desviaciones típicas:
18,139,115,9
6
67,510
08,1167,122846
43072
2
2
y
x
Covarianza:
17,917,915,984
6
6,4666 xyxy
Coeficiente de correlación:
70,070,018,108,11
17,9
rr
Hay una relación positiva y relativamente alta entre las variables. Ejercicio nº 11.- Se ha estudiado en distintas marcas de yogures naturales el porcentaje de grasa que contenían, así como las kilocalorías por envase. Estos son los resultados obtenidos en seis de ellos:
a) Halla la recta de regresión de Y sobre X.
0,85).que(Sabemoses?estimacionestasválidas¿Son.10e52,Calculab) ryy ˆˆ
Solución: a)
14
Medias:
17,626
373
37,26
2,14
y
x
Varianza de X:
23,037,26
06,35 22 x
Covarianza:
47,317,6237,26
9,904xy
Coeficiente de regresión:
1,1523,0
47,32
x
xyyxm
Ecuación de la recta de regresión de Y sobre X:
38,261,1537,21,1517,62 xyxy
kcal 13,6438,265,21,155,2ˆb) y
kcal 38,17738,26101,1510ˆ y
Como la correlación es alta, r 0,85, es razonable hacer estimaciones dentro del intervalo de datos. Para un porcentaje del 2,5 de grasa, las kilocalorías serán, aproximadamente, 64,13. Sin embargo, la segunda
estimación no es válida porque x 10 está muy alejado del intervalo de datos que hemos considerado. Ejercicio nº 12.- Se ha analizado en distintos modelos de impresoras cuál es el coste por página (en céntimos de euro) en blanco y negro y cuál es el coste por página si esta es en color. La siguiente tabla nos da los seis primeros pares de datos obtenidos:
a) Halla la recta de regresión de Y sobre X. b) ¿Cuánto nos costaría imprimir una página en color en una impresora en la que el coste por página en
blanco y negro fuera de 12 céntimos de euro? ¿Es fiable la estimación? (Sabemos que r 0,97). Solución:
15
a)
Medias:
67,656
394
5,136
81
y
x
Varianza de X:
58,195,136
1211 22 x
Covarianza:
12,11167,655,136
5986xy
Coeficiente de regresión:
68,558,19
12,1112
x
xyyxm
Ecuación de la recta de regresión de Y sobre X:
01,1168,55,1368,567,65 xyxy
euro de céntimos 15,5712ˆ01,111268,512ˆb) yy
Como la correlación es alta, r 0,97, y x 12 queda dentro del intervalo de valores que tenemos, la estimación sí es fiable. Si el coste de la página en blanco y negro es de 12 céntimos de euro, muy probablemente costará 57,15 céntimos de euro imprimirla en color. Ejercicio nº 13.- En distintos modelos de aspiradores se ha medido el peso, en kilogramos, y la capacidad útil de la bolsa, en litros, obteniendo los siguientes resultados:
a) Halla la recta de regresión de Y sobre X.
0,85). que (Sabemos ?estimación esta fiable ¿Es .6Calculab) r y
16
Solución: a)
Medias:
58,26
5,15
28,66
7,37
y
x
Varianza de X:
39,028,66
97,238 22 x
Covarianza:
52,058,228,66
35,100xy
Coeficiente de regresión:
33,139,0
52,02
x
xyyxm
Ecuación de la recta de regresión de Y sobre X:
77,533,128,633,158,2 xyxy
21,277,5633,16ˆb) y
Sí es fiable, puesto que la correlación es fuerte, r 0,85, y x 6 está dentro del intervalo de datos que estamos considerando. Para un peso de 6 kg la capacidad de la bolsa será, aproximadamente, de 2,21 litros. Ejercicio nº 14.- En seis institutos de la misma zona se ha estudiado la nota media de los estudiantes de 1º de bachillerato en Matemáticas y en Inglés, obteniéndose la información que se recoge en la siguiente tabla:
a) Halla la recta de regresión de Y sobre X.
0,87). que (Sabemos ?estimación esta fiable ¿Es .55,Calculab) ry
17
Solución: a)
Medias:
92,56
5,35
2,66
2,37
y
x
Varianza de X:+
32,02,66
54,232 22 x
Covarianza:
46,092,52,66
223xy
Coeficiente de regresión:
44,132,0
46,02
x
xyyxm
Ecuación de la recta de regresión de Y sobre X:
344,12,644,192,5 xyxy
92,435,544,15,5ˆb) y
Sí es fiable la estimación, puesto que la correlación es fuerte, r 0,87, y x 5,5 está dentro del intervalo de valores que estamos considerando. Por tanto, estimamos que si la nota de Matemáticas es 5,5, la de Inglés será muy probablemente 4,9.
18
Ejercicio nº 15.- Se ha medido el peso, en kilogramos, y el volumen, en litros, de distintos tipos de maletas, obteniendo los resultados que se recogen en esta tabla:
a) Halla la recta de regresión de Y sobre X.
0,79). que (Sabemos ?estimación estafiable ¿Es120Calculab) ry .ˆ
Solución:
a)
Medias:
67,66
40
33,986
590
y
x
Varianza de X:
54,2533,986
58166 22 x
Covarianza:
89,167,633,986
5,3946xy
Coeficiente de regresión:
07,054,25
89,12
x
xyyxm
Ecuación de la recta de regresión de Y sobre x:
21,007,033,9807,067,6 xyxy
19,821,012007,0120ˆb) y
Como x 120 está alejado del intervalo que estamos considerando, la estimación no es fiable.
19
Ejercicio nº 16.- En una academia para aprender a conducir se han estudiado las semanas de asistencia a clase de sus alumnos y las semanas que tardan en aprobar el examen teórico (desde que se apuntaron a la autoescuela). Los datos correspondientes a seis alumnos son:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables? Solución: a)
Medias:
17,66
37
5,46
27
y
x
Desviaciones típicas:
76,11,317,66
247
22,292,45,46
151
2
2
y
x
Covarianza:
9,217,65,46
184xy
Coeficientes de regresión:
59,092,4
9,2 sobre yxmxy
94,01,3
9,2 sobre xymyx
Rectas de regresión:
20
52,359,05,459,017,6 sobre xyxyxy
17,694,05,4 sobre yxyx
80,594,05,4 yx
3,194,0 yx
yx 94,03,1
38,106,194,0
3,1
xy
xy
Representación:
b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy próximas. Con los
datos obtenidos comprobamos que el coeficiente de correlación es: r 0,74 Ejercicio nº 17.- La estatura, en centímetros, de seis chicos de la misma edad y la de sus padres viene recogida en la siguiente tabla:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables? Solución: a)
21
Medias:
5,1776
1065
1656
990
y
x
Desviaciones típicas:
79,492,225,1776
189175
57,967,911656
163900
2
2
y
x
Covarianza:
17,295,1771656
175900xy
Coeficientes de regresión:
32,067,91
17,29 sobre yxmxy
27,192,22
17,29 sobre xymyx
Rectas de regresión:
7,12432,016532,05,177 sobre xyxyxy
5,17727,1165 sobre yxyx
43,6027,1 yx
58,4779,027,1
43,60
xy
xy
Representación:
b) La correlación entre las variables no es demasiado fuerte, pues las dos rectas no están muy
636,079,457,9
17,29 :es ncorrelació de ecoeficient el que sComprobamo próximas.
r
22
Ejercicio nº 18.- Se ha preguntado en seis familias por el número de hijos y el número medio de días que suelen ir al cine cada mes. Las respuestas han sido las siguientes:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables? Solución: a)
Medias:
36
18
5,26
15
y
x
Desviaciones típicas:
15,133,136
62
96,092,05,26
43
2
2
y
x
Covarianza:
17,035,26
44xy
Coeficientes de regresión:
18,092,0
17,0 sobre
yxmxy
13,033,1
17,0 sobre
xymyx
Rectas de regresión:
45,318,05,218,03 sobre xyxy x y
23
313,05,2 sobre yxyx
89,213,0 yx
xy 89,213,0
23,2269,713,0
89,2
xy
xy
Representación:
b) La correlación es prácticamente nula; las rectas son casi perpendiculares. Ejercicio nº 19.- Considera la siguiente distribución:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables? Solución: a)
Medias:
17,116
67
33,46
26
y
x
24
Desviaciones típicas:
43,373,1117,116
819
61,158,233,46
128
2
2
y
x
Covarianza:
97,417,1133,46
320xy
Coeficientes de regresión:
93,158,2
97,4 sobre yxmxy
42,073,11
97,4 sobre xymyx
Rectas de regresión:
81,293,133,493,117,11 sobre xyxyxy
17,1142,033,4 sobre yxyx
36,042,0 yx
86,038,242,0
36,0
xy
xy
Representación:
b) La correlación es muy alta, puesto que las dos rectas están muy próximas, casi coinciden.
9,043,361,1
97,4 :es ncorrelació de ecoeficient el que sComprobamo
r
Ejercicio nº 20.- Un grupo de seis atletas ha realizado pruebas de salto de longitud y de altura. Las dos se han puntuado en una escala de 0 a 5. Los resultados obtenidos han sido los siguientes:
a) Halla las dos rectas de regresión y represéntalas. b) Observando el grado de proximidad entre las dos rectas, ¿cómo crees que será la correlación entre las
dos variables?
25
Solución: a)
Medias:
83,36
23
17,46
25
y
x
Desviaciones típicas:
71,0498,083,36
91
67,044,017,46
107
2
2
y
x
Covarianza:
Coeficientes de regresión:
82,044,0
36,0 sobre yxmxy
72,0498,0
36,0 sobre xymyx
Rectas de regresión:
41,082,017,482,083,3 sobre xyxyxy
41,172,0 83,372,017,4 sobre yx yx yx
96,139,172,0
41,1
xy
xy
36,083,317,46
98xy
26
Representación:
b) La correlación entre las dos variables no es demasiado fuerte, pues las dos rectas no están muy
76,071,067,0
36,0 :es ncorrelació de ecoeficient el que sComprobamo próximas.
r