municipio densidad energia población acebeda (la) 2.49...

12
Probabilidades y Estadística Introducción al Análisis de Datos Municipio densidad energia población Acebeda (La) 2.49 237 55 Ajalvir 140.56 53.871 2.755 Alameda del Valle 7.8 996 195 Alamo (El) 260.54 18.246 5.784 Alcalá de Henares 2149.59 940.718 188.519 Alcobendas 2187.04 610.305 98.417 Alcorcón 4582.82 520.648 154.441 Aldea del Fresno 34.81 7.978 1.803 Algete 448.42 72.054 16.995 Alpedrete 764.05 31.192 9.627 Ambite 12.42 1.473 323 Anchuelo 26.57 3.539 574 Aranjuez 221.56 182.221 41.897 Arganda del Rey 454.83 317.136 36.250 Arroyomolinos 295.46 53.680 6.116 Atazar (El) 3.42 219 101 Batres 57.59 6.312 1.244 Becerril de la Sierra 138.64 13.659 4.090 Belmonte de Tajo 48.27 2.603 1.144 Berrueco (El) 16.08 3.003 463 Berzosa del Lozoya 11.19 440 160 Boadilla del Monte 655.08 125.833 30.920 Boalo (El) 108.16 16.412 4.283 Braojos 7.63 392 190 Brea de Tajo 10.54 1.031 467 Brunete 142.82 19.905 6.984 Buitrago del Lozoya 64.04 8.481 1.697 Bustarviejo 28.78 4.901 1.649 Cabanillas de la Sierra 38.3 2.186 540 Cabrera (La) 89.78 7.385 2.011 Cadalso de los Vidrios 51.49 16.344 2.451 Camarma de Esteruelas 101.1 48.678 3.579 Campo Real 53.65 16.888 3.310 Canencia 9.15 1.100 482 Carabaña 27.84 4.393 1.325 Casarrubuelos 275.47 4.069 1.460 Cenicientos 27.3 4.473 1.859 Cercedilla 175.89 23.749 6.297 Cervera de Buitrago 10.75 368 129 Chapinería 63.78 4.480 1.620 Chinchón 39.48 17.141 4.576 Ciempozuelos 323.75 68.330 16.058 Cobeña 173.03 13.086 3.599 Collado Mediano 235.27 13.108 5.317 Collado Villalba 2009.29 186.613 50.634 Colmenar Viejo 203.94 133.773 37.239 Colmenar de Oreja 49.54 20.594 6.257 Colmenar del Arroyo 20.34 3.059 1.029 Colmenarejo 196.69 17.778 6.235 Corpa 17.8 861 461 Coslada 6.848,00 307.349 82.176 Cubas de la Sagra 189.14 9.508 2.421 Daganzo de Arriba 121.16 65.440 5.307 Escorial (El) 184.14 50.614 12.669 Estremera 14.35 5.875 1.135 Fresnedillas de la Oliva 38.33 2.121 1.081 Fresno de Torote 29.46 3.460 931 Fuenlabrada 4794.97 626.853 187.963 Fuente el Saz de Jarama 158.43 25.481 5.260 Fuentidueña de Tajo 25.03 9.583 1.517 Galapagar 413.18 68.023 26.857 Garganta de los Montes 8.64 1.624 348 Gargantilla del Lozoya y Pinilla de Buitrago 12.57 1.555 303 Gascones 6.9 600 138 Getafe 1993.81 1.040.736 156.315 Griñón 378.97 56.702 6.594 Guadalix de la Sierra 67.36 14.832 4.109 Guadarrama 209.77 43.974 11.957 Hiruela (La) 5.76 127 99 Horcajo de la Sierra 6.93 771 147 Horcajuelo de la Sierra 4.83 295 115 Hoyo de Manzanares 148.45 18.048 6.725 Humanes de Madrid 601.95 88.274 11.738 Leganés 4104.41 516.947 176.900

Upload: lytuong

Post on 07-Feb-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Probabilidades y Estadística

Introducción al Análisis de Datos

Municipio densidad energia poblaciónAcebeda (La) 2.49 237 55Ajalvir 140.56 53.871 2.755Alameda del Valle 7.8 996 195Alamo (El) 260.54 18.246 5.784Alcalá de Henares 2149.59 940.718 188.519Alcobendas 2187.04 610.305 98.417Alcorcón 4582.82 520.648 154.441Aldea del Fresno 34.81 7.978 1.803Algete 448.42 72.054 16.995Alpedrete 764.05 31.192 9.627Ambite 12.42 1.473 323Anchuelo 26.57 3.539 574Aranjuez 221.56 182.221 41.897Arganda del Rey 454.83 317.136 36.250Arroyomolinos 295.46 53.680 6.116Atazar (El) 3.42 219 101Batres 57.59 6.312 1.244Becerril de la Sierra 138.64 13.659 4.090Belmonte de Tajo 48.27 2.603 1.144Berrueco (El) 16.08 3.003 463Berzosa del Lozoya 11.19 440 160Boadilla del Monte 655.08 125.833 30.920Boalo (El) 108.16 16.412 4.283Braojos 7.63 392 190Brea de Tajo 10.54 1.031 467Brunete 142.82 19.905 6.984Buitrago del Lozoya 64.04 8.481 1.697Bustarviejo 28.78 4.901 1.649Cabanillas de la Sierra 38.3 2.186 540Cabrera (La) 89.78 7.385 2.011Cadalso de los Vidrios 51.49 16.344 2.451Camarma de Esteruelas 101.1 48.678 3.579Campo Real 53.65 16.888 3.310Canencia 9.15 1.100 482Carabaña 27.84 4.393 1.325Casarrubuelos 275.47 4.069 1.460Cenicientos 27.3 4.473 1.859Cercedilla 175.89 23.749 6.297Cervera de Buitrago 10.75 368 129Chapinería 63.78 4.480 1.620Chinchón 39.48 17.141 4.576Ciempozuelos 323.75 68.330 16.058Cobeña 173.03 13.086 3.599Collado Mediano 235.27 13.108 5.317Collado Villalba 2009.29 186.613 50.634Colmenar Viejo 203.94 133.773 37.239Colmenar de Oreja 49.54 20.594 6.257Colmenar del Arroyo 20.34 3.059 1.029Colmenarejo 196.69 17.778 6.235Corpa 17.8 861 461Coslada 6.848,00 307.349 82.176Cubas de la Sagra 189.14 9.508 2.421Daganzo de Arriba 121.16 65.440 5.307Escorial (El) 184.14 50.614 12.669Estremera 14.35 5.875 1.135Fresnedillas de la Oliva 38.33 2.121 1.081Fresno de Torote 29.46 3.460 931Fuenlabrada 4794.97 626.853 187.963Fuente el Saz de Jarama 158.43 25.481 5.260Fuentidueña de Tajo 25.03 9.583 1.517Galapagar 413.18 68.023 26.857Garganta de los Montes 8.64 1.624 348Gargantilla del Lozoya y Pinilla de Buitrago 12.57 1.555 303Gascones 6.9 600 138Getafe 1993.81 1.040.736 156.315Griñón 378.97 56.702 6.594Guadalix de la Sierra 67.36 14.832 4.109Guadarrama 209.77 43.974 11.957Hiruela (La) 5.76 127 99Horcajo de la Sierra 6.93 771 147Horcajuelo de la Sierra 4.83 295 115Hoyo de Manzanares 148.45 18.048 6.725Humanes de Madrid 601.95 88.274 11.738Leganés 4104.41 516.947 176.900

Análisis de Datos

Objetivos:

•Descubrir las posibilidades del el análisis de datos

•Motivar el uso de herramientas que aportan fiabilidad, flexibilidad y productividad en la gestión datos y explotación de la información

•Mostrar la metodología estadística de análisis de datos con aplicaciones y modelos implementados

•Observaciones, Medidas, Datos•Información / Incertidumbre•Conocimiento (relaciones, probabilidad)•Decisión, Predicción

Métodos de estudio/investigación/análisis de datos

ProblemasDefinir y comprenderSolucionesExplicación

Introducción.

Qué es la estadística?

•Es el estudio y aplicación de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad y la incertidumbre sea una causa intrínseca de los mismos.

•El objetivo es explorar los datos y realizar inferencias con la información disponible para comprender los procesos que generan los datos, ayudar a tomar decisiones y realizar predicciones.

•La exploración, descripción y análisis se limita al conjunto datos observado mediante resumenes numéricos y gráficos de la frecuencia.

•Por otra parte, la inferencia extiende las conclusiones del estudio al proceso generador de la información mediante el uso de modelos probabilísticos o estocásticos.

Inferencia Estadística:Probabilidad de que la Inferencia sea correcta sobre la población objeto de estudio.

Obtener conclusiones basadas en datos experimentales e información subjetiva: Inferencia Bayesiana.

El objetivo de la Inferencia Estadística y la Inferencia Bayesiana es evaluar la Incertidumbre mediante Probabilidad.

Estadística Fácil

Aprender estadística: ¿por qué? y ¿para qué?

•Herramienta de trabajo

•Solución de problemas

•Investigación teórica yaplicada

•Comprensión y utilización de la investigación

•Satisfacción personal

Análisis de datos e Interpretación de resultados

Extracción de información de un conjunto de datos

• Gráficos y tablas• Medias o promedios aritméticos• Variabilidad• Unidades, rangos e intervalos• Coeficientes de correlación • Fiabilidad experimental• Validez, tests o contrastes • Regresión, predicciones, muestra• Inferencia estadística• Comparar muestras

Razonamiento: ciclo deductivo e inductivo

El método estadístico

Población y Muestra

Poblacióncualquier conjunto de objetos, personas, plantas, instituciones... o entes en general, que son portadores de una serie de características que nos interesa estudiar.

•Finita: alumnos de clase•Infinita: clientes de un operador de telecomunicaciones

Muestrasubconjunto representativo de la población de forma que las conclusiones sacadas en aquella se generalizan a ésta.Coste, tamaño, sesgo, estimador.

CensoListado completo de la población

Conceptualización: Variables estadísticas y escalasStanley Stevens' "Scales of measurement" (1946): nominal, ordinal, interval, ratio

(variables estacionarias, temporales, espaciales,…)

Carácter estadístico cualitativo.

Escala nominal

Catálogo de productos de oferta en un supermercado clasificados por la sección donde se encuentran. Catálogo de viajes de una agencia, clasificados por los destinos. Catálogo de libros la una biblioteca, clasificados por materias. Programas de la semana en una cadena de televisión, clasificados por franja horaria. Titulados universitarios, clasificados por el título obtenido. Carta de platos de un restaurante, clasificados por entrantes, primeros, segundos y postres.

Escala ordinal

Rutas de senderismo por los Picos de Europa, ordenados por nivel de dificultad. Predicción del viento de la mar en el litoral Cantabrico durante un año, escala de vientos. Estado de las playas de la península Ibérica un dia de agosto, código de banderas. Estado de los pacientes en urgencias de un hospital, escala de valoración clínica. Valoración de idoneidad para la localización de un planta industrial en un conjunto de alternativas. Estado de conservación del ecosistema de un municipio expresado por sus habitantes, escala likertde 5 niveles: MuyBien, Bien, Normal, Mal, MuyMal.

Conceptualización: Variables estadísticas y escalas

Carácter estadístico cuantitativo (unidades).

Escala discreta

Número de hijos. Enlaces en una pagina web. Averías de un vehículo en un año. Plantilla de profesores de una universidad, años de edad. Libros prestados a los usuarios de la biblioteca.Espectadores de un programa de televisión.

Escala continua

Carta de platos de un restaurante, calorías. Catálogo de productos de oferta en un supermercado, precio. Duración de un viaje, tiempo. Superficie de un inmueble.Catálogo de viajes ofertados por una agencia, precio/dia.Tiempo de espera de pacientes para ser atendido en la urgencia de un hospital. Modelos de vehículos producidos por una marca, consumo.

Historía (breve) de la Estadística (y la probabilidad)

•Demografía Descriptiva

•Recursos naturales

•Juegos de AZAR Cálculo de PROBABILIDADES

•Investigación social, psicología, genética Muestreo e Inferencia

•Fundamentación teórica (axiomas, teoría de la medida, modelos probabílisticos)

•El ordenador y el software estadístisco: Estadística computacional.

•Análisis multivariante (bioestadística,…), temporal (economía,…) y espacial (x,y,z)

•Simulación y Análisis de Decisiones.

•Grandes bases de datos: Minería de Datos.

Historía (breve) de la Estadística (y la probabilidad)

S. XVII - Pascal, Fermart, Huygens,Graunt, J. y N. Bernoulli,…

S. XVIII – Montmort, Laplace, De Moivre, Bayes,

S. XIX – Legendre, Gaus, Bessel, Qutelet, Poisson, Chebyshev, Galton, Pearson,…

S. XX – Spearman, Gosset, Fisher, Kolmogorov, Hotelling, Smirnov, Glass, Tukey, Markov, Liapunov, Borel, Lévy, Frechet, Savage, de Fineti, von Mises, Weibull,Snedecor, Savage, LindLey, Kruskal, Kendall, Gini, Feller, Erlang, Einstein, Cox, Chernoff, Box, Borel, Bonferroni, Efron, Yule, …

S. XXI - ….