tema1.2problemas_descriptiva

4
Exploraci´ on de datos 1 Universidad Polit´ ecnica de Cartagena Dpto. Matem´ atica Aplicada y Estad´ ıstica Grado en Ingenier´ ıadeEdificaci´on Estad´ ıstica Exploraci´ on de datos Problema 1 El Instituto Nacional de Estad´ ıstica proporciona los datos siguientes sobre el crec- imiento vegetativo, es decir la diferencia entre el n´ umero de nacimientos y defunciones, en las comunidades aut´ onomas: Comunidad crecimiento Comunidad crecimiento Galicia -9865 Ceuta 455 Castilla y Le´ on -8825 Valencia 543 Asturias -5915 Melilla 599 Arag´ on -3853 Catalu˜ na 779 Pa´ ıs Vasco -2040 Baleares 1230 Cantabria -1332 Murcia 3730 Cast.-La Mancha -837 Canarias 5668 Extremadura -553 Madrid 11152 La Rioja -384 Andaluc´ ıa 15489 Navarra 136 1. Calcular la mediana y los cuartiles de estos datos. 2. Realizar el diagrama de cajas y bigotes para estos datos. ¿Para qu´ e sirve este diagrama? ¿Hay datos at´ ıpicos? ¿Qu´ e representan estos ´ ultimos? Problema 2 A continuaci´on se presentan los diagramas de caja-bigotes para la emisi´on total de cuatro paises de la Uni´on europea entre 1990 y 1997. ( ES=”Espa˜ na”, FR=”Francia”, GB=”Gran Breta˜ na”, y IT=”Italia”).

Upload: eduardo-gomez-pinuela

Post on 24-Dec-2015

8 views

Category:

Documents


1 download

DESCRIPTION

Tema1.2problemas_descriptiva

TRANSCRIPT

Page 1: Tema1.2problemas_descriptiva

Exploracion de datos 1

Universidad Politecnica de Cartagena

Dpto. Matematica Aplicada y Estadıstica

Grado en Ingenierıa de Edificacion

Estadıstica Exploracion de datos

Problema 1

El Instituto Nacional de Estadıstica proporciona los datos siguientes sobre el crec-

imiento vegetativo, es decir la diferencia entre el numero de nacimientos y defunciones,

en las comunidades autonomas:

Comunidad crecimiento Comunidad crecimiento

Galicia -9865 Ceuta 455

Castilla y Leon -8825 Valencia 543

Asturias -5915 Melilla 599

Aragon -3853 Cataluna 779

Paıs Vasco -2040 Baleares 1230

Cantabria -1332 Murcia 3730

Cast.-La Mancha -837 Canarias 5668

Extremadura -553 Madrid 11152

La Rioja -384 Andalucıa 15489

Navarra 136

1. Calcular la mediana y los cuartiles de estos datos.

2. Realizar el diagrama de cajas y bigotes para estos datos. ¿Para que sirve este

diagrama? ¿Hay datos atıpicos? ¿Que representan estos ultimos?

Problema 2

A continuacion se presentan los diagramas de caja-bigotes para la emision total de

cuatro paises de la Union europea entre 1990 y 1997. ( ES=”Espana”, FR=”Francia”,

GB=”Gran Bretana”, y IT=”Italia”).

Page 2: Tema1.2problemas_descriptiva

2 Exploracion de datos

1. ¿Como se construye un diagrama de caja-bigotes?

2. ¿Como clasificarıa estos cuatro paises en cuanto a contaminacion por CO2?

3. ¿Cual es el paıs que presenta mayor dispersion entre sus datos de contaminacion?

¿Que quiere decir?

Problema 3

En la siguiente tabla estan representados los datos referidos al alquiler pagado mensual-

mente por 45 familias que habitan pisos de alquiler en una determinada ciudad:

Alquiler en euros. Numero de familias

(0 − 150] 5

(150 − 300] 12

(300 − 600] 16

(600 − 900] 10

(900 − 1200] 2

Se pide:

Page 3: Tema1.2problemas_descriptiva

Exploracion de datos 3

1. Representar graficamente la variable mediante un histograma. ¿Cuales son las car-

acterısticas de dicho histograma? ¿Que medidas de centralizacion y dispersion son

mas adecuadas para resumir los datos? Razonar la respuesta.

2. Calcular el alquiler medio pagado por las familias analizadas. ¿En que intervalo se

situa la mediana? ¿Cual es el intervalo modal?

3. ¿Cual es la proporcion de familias que pagan un alquiler menor o igual a seiscentos

euros?

Problema 4

Con el fin de determinar si existe relacion entre la cantidad de polımeros de latex incluida

durante el proceso de mezclado de cemento Portland y su resistencia adhesiva a tension,

una empresa encargada de realizar certificaciones de obras toma una muestra de tamano

10, obteniendo los siguientes resultados:

Polımeros latex (mgr/kg) 13.5 11.0 13.0 11.2 12.0 13.2 12.0 13.5 11.2 13.0

Resistencia (kgf/cm2) 17.5 16.6 17.2 16.6 17.0 17.3 16.9 17.3 16.8 17.1

(a) Calcular dos medidas de centro y dos medidas de dispersion para cada una de las

dos variables.

(b) Calcular el rango intercuartılico de la variable Resistencia

Problema 5

Se ha aplicado un test sobre capacitacion laboral a 90 empleados de una industria,

obteniendose los siguientes resultados:

PUNTUACIONES N o de EMPLEADOS

[38, 44) 7

[44, 50) 8

[50, 56) 15

[56, 62) 27

[62, 68) 18

[68, 74) 9

[74, 80] 6

Se pide:

Page 4: Tema1.2problemas_descriptiva

4 Exploracion de datos

1. Representar graficamente la variable mediante un histograma. Comentar las car-

acterısticas mas relevantes de dicho histograma. ¿Que medidas de centralizacion y

dispersion son mas adecuadas para resumir los datos? Razona tu respuesta.

2. Calcular la puntuacion media obtenida en el test. ¿En que intervalo se situa la

mediana? ¿Cual es el intervalo modal?

3. ¿Que proporcion de empleados tiene una puntuacion mayor o igual a 62?